ETL (แยกแปลงและโหลด) เป็นหนึ่งในกระบวนการที่สำคัญที่สุดในการวิเคราะห์ข้อมูลขนาดใหญ่ - และในเวลาเดียวกันมันสามารถเป็นหนึ่งในคอขวดที่ใหญ่ที่สุด (สำหรับข้อมูลเพิ่มเติมเกี่ยวกับข้อมูลขนาดใหญ่ลองดู 5 หลักสูตรข้อมูลขนาดใหญ่ที่เป็นประโยชน์ที่คุณสามารถลงเรียนออนไลน์ได้)
เหตุผลที่ ETL มีความสำคัญคือข้อมูลส่วนใหญ่ที่ธุรกิจรวบรวมไม่พร้อมในรูปแบบดิบสำหรับโซลูชันการวิเคราะห์เพื่อแยกย่อย เพื่อให้โซลูชันการวิเคราะห์สร้างข้อมูลเชิงลึกข้อมูลดิบจะต้องถูกแยกออกจากแอปพลิเคชันที่อยู่ในปัจจุบันแปลงเป็นรูปแบบที่โปรแกรมการวิเคราะห์สามารถอ่านและโหลดลงในโปรแกรมการวิเคราะห์เอง
กระบวนการนี้คล้ายคลึงกับการปรุงอาหาร วัตถุดิบของคุณเป็นข้อมูลดิบของคุณ พวกเขาจะต้องสกัด (ซื้อจากร้านค้า) เปลี่ยน (สุก) แล้วโหลด (ชุบ) ก่อนที่จะวิเคราะห์ (ชิม) ความยากและค่าใช้จ่ายสามารถเพิ่มขึ้นอย่างคาดไม่ถึง - มันง่ายที่จะทำชีสแมคแอนด์เนสสำหรับตัวคุณเอง แต่ยากมากที่จะสร้างเมนูอาหารสำหรับ 40 คนในงานเลี้ยงอาหารค่ำ ความผิดพลาดในทุกจุดสามารถทำให้มื้ออาหารของคุณไม่สามารถย่อยได้