Q:
อะไรคือความแตกต่างระหว่าง data ขนาดใหญ่และ data mining?
A:Big data และ data mining เป็นสองสิ่งที่แตกต่างกัน ทั้งคู่เกี่ยวข้องกับการใช้ชุดข้อมูลขนาดใหญ่เพื่อจัดการการรวบรวมหรือการรายงานข้อมูลที่ให้บริการธุรกิจหรือผู้รับอื่น ๆ อย่างไรก็ตามคำสองคำนี้ใช้สำหรับองค์ประกอบที่แตกต่างกันสองแบบของการทำงานประเภทนี้
Big data เป็นคำศัพท์สำหรับชุดข้อมูลขนาดใหญ่ ชุดข้อมูลขนาดใหญ่คือชุดข้อมูลที่เติบโตเกินกว่าประเภทฐานข้อมูลและสถาปัตยกรรมการจัดการข้อมูลที่ใช้ในครั้งก่อนหน้าเมื่อข้อมูลขนาดใหญ่มีราคาแพงกว่าและเป็นไปได้น้อยกว่า ตัวอย่างเช่นชุดของข้อมูลที่มีขนาดใหญ่เกินกว่าที่จะจัดการได้ง่ายในสเปรดชีต Microsoft Excel อาจถูกอ้างถึงเป็นชุดข้อมูลขนาดใหญ่
การขุดข้อมูลหมายถึงกิจกรรมที่ต้องผ่านชุดข้อมูลขนาดใหญ่เพื่อค้นหาข้อมูลที่เกี่ยวข้องหรือเกี่ยวข้อง กิจกรรมประเภทนี้เป็นตัวอย่างที่ดีของสัจพจน์เก่า "มองหาเข็มในกองหญ้า" แนวคิดก็คือธุรกิจจะรวบรวมข้อมูลจำนวนมหาศาลซึ่งอาจเป็นเนื้อเดียวกันหรือถูกรวบรวมโดยอัตโนมัติ ผู้ตัดสินใจต้องเข้าถึงข้อมูลที่มีขนาดเล็กและเฉพาะเจาะจงมากขึ้นจากชุดใหญ่เหล่านั้น พวกเขาใช้ data mining เพื่อเปิดเผยข้อมูลที่จะแจ้งความเป็นผู้นำและช่วยจัดทำแผนภูมิหลักสูตรสำหรับธุรกิจ
การขุดข้อมูลอาจเกี่ยวข้องกับการใช้แพ็คเกจซอฟต์แวร์ประเภทต่าง ๆ เช่นเครื่องมือวิเคราะห์ มันอาจเป็นไปโดยอัตโนมัติหรืออาจเป็นงานที่ต้องใช้แรงงานเป็นส่วนใหญ่ซึ่งคนงานแต่ละคนส่งแบบสอบถามเฉพาะสำหรับข้อมูลไปยังที่เก็บถาวรหรือฐานข้อมูล โดยทั่วไปการขุดข้อมูลหมายถึงการดำเนินการที่เกี่ยวข้องกับการค้นหาที่ค่อนข้างซับซ้อนซึ่งให้ผลลัพธ์ที่ตรงเป้าหมายและผลลัพธ์ที่เฉพาะเจาะจง ตัวอย่างเช่นเครื่องมือขุดข้อมูลอาจตรวจสอบข้อมูลทางบัญชีเป็นเวลาหลายสิบปีเพื่อค้นหาคอลัมน์ค่าใช้จ่ายหรือลูกหนี้การค้าสำหรับปีดำเนินการที่เฉพาะเจาะจง
ในระยะสั้นข้อมูลขนาดใหญ่คือสินทรัพย์และการขุดข้อมูลคือ "ตัวจัดการ" ที่ใช้เพื่อให้ผลลัพธ์ที่เป็นประโยชน์