บ้าน ในข่าว Data wrangling คืออะไร - คำจำกัดความจาก techopedia

Data wrangling คืออะไร - คำจำกัดความจาก techopedia

สารบัญ:

Anonim

คำจำกัดความ - Wrangling ข้อมูลหมายถึงอะไร

Data wrangling เป็นการจัดการข้อมูลชนิดหนึ่งที่เกิดขึ้นจากความสามารถของซอฟต์แวร์ใหม่ที่นำเสนอชุดข้อมูลขนาดใหญ่ยุ่งและมีความหลากหลายซึ่งจำเป็นต้องเข้าสู่สถาปัตยกรรมที่มุ่งเน้นบริการ (SOA) เพื่อการวิเคราะห์และการใช้งาน การถกเถียงข้อมูลโดยทั่วไปเกี่ยวข้องกับเทคนิคที่ซับซ้อนหลายอย่างสำหรับการจัดการข้อมูลที่ผิดปกติหรือหลากหลายและจัดการกับกรณีการใช้งานทางธุรกิจ

Techopedia อธิบาย Data Wrangling

มันอาจฟังดูเป็นคำที่ไม่เป็นทางการ แต่การบิดเบือนข้อมูลจริง ๆ แล้วมีพื้นที่เฉพาะในการจัดการข้อมูล วิธีหนึ่งที่มีประโยชน์ในการทำความเข้าใจกับข้อมูลที่มีการโต้เถียงคือการเปรียบเทียบกับวิธีการแยกการแปลงและโหลด (ETL) ที่เป็นทางการ Data wrangling มีแง่มุมที่แตกต่างกันและใช้เคสมากกว่า ETL มันมักจะทำโดยนักวิทยาศาสตร์ข้อมูลที่มีทักษะหรือคนอื่น ๆ ใกล้กับท่อ ในบางวิธีการถกเถียงข้อมูลอาจเรียกได้ว่าเป็น ETL แบบ "โอเพ่นซอร์ส" ซึ่งวิศวกรเหล่านั้นจัดการกับข้อมูลอาจจะ "ลงมือ" มากขึ้นหรือใช้วิธีการสกัดเพิ่มเติมด้วยตนเอง

สำหรับผู้ที่เข้าใจกระบวนการกลั่นที่ข้อมูลหลากหลายได้รับการคัดแยกและป้อนเข้าสู่สถาปัตยกรรมองค์กรการบิดเบือนข้อมูลเป็นหัวข้อที่สำคัญมาก ผู้เชี่ยวชาญด้านไอทีพิจารณาเครื่องมือทรัพยากรและเทคนิคมากมายเพื่อนำคุณค่าจากข้อมูลที่ยุ่งเหยิงดิบหรือไม่มีโครงสร้าง

Data wrangling คืออะไร - คำจำกัดความจาก techopedia