สารบัญ:
- คำจำกัดความ - การค้นพบความรู้ในฐานข้อมูล (KDD) หมายถึงอะไร
- Techopedia อธิบายการค้นพบความรู้ในฐานข้อมูล (KDD)
คำจำกัดความ - การค้นพบความรู้ในฐานข้อมูล (KDD) หมายถึงอะไร
การค้นหาความรู้ในฐานข้อมูล (KDD) เป็นกระบวนการค้นหาความรู้ที่เป็นประโยชน์จากการรวบรวมข้อมูล เทคนิคการขุดข้อมูลที่ใช้กันอย่างแพร่หลายนี้เป็นกระบวนการที่รวมถึงการเตรียมและการเลือกข้อมูลการล้างข้อมูลรวมความรู้ก่อนหน้าเกี่ยวกับชุดข้อมูลและการตีความโซลูชันที่ถูกต้องจากผลลัพธ์ที่สังเกตได้
พื้นที่ใช้งานหลักของ KDD ได้แก่ การตลาดการตรวจจับการทุจริตการสื่อสารโทรคมนาคมและการผลิต
Techopedia อธิบายการค้นพบความรู้ในฐานข้อมูล (KDD)
เดิมการขุดข้อมูลและการค้นหาความรู้ดำเนินการด้วยตนเอง เมื่อเวลาผ่านไปปริมาณของข้อมูลในหลาย ๆ ระบบเพิ่มขึ้นมากกว่าขนาดเทราไบต์และไม่สามารถดูแลรักษาด้วยตนเองได้อีกต่อไป นอกจากนี้เพื่อความสำเร็จในการดำรงอยู่ของธุรกิจใด ๆ การค้นพบรูปแบบพื้นฐานในข้อมูลถือเป็นสิ่งจำเป็น เป็นผลให้เครื่องมือซอฟต์แวร์จำนวนมากได้รับการพัฒนาเพื่อค้นหาข้อมูลที่ซ่อนอยู่และตั้งสมมติฐานซึ่งเป็นส่วนหนึ่งของปัญญาประดิษฐ์
กระบวนการ KDD ถึงจุดสูงสุดในช่วง 10 ปีที่ผ่านมา ตอนนี้เป็นที่ตั้งของวิธีการค้นพบที่หลากหลายซึ่งรวมถึงการเรียนรู้เชิงอุปนัยสถิติแบบเบย์การเพิ่มประสิทธิภาพการค้นหาความหมายการได้มาซึ่งความรู้สำหรับระบบผู้เชี่ยวชาญและทฤษฎีข้อมูล เป้าหมายสูงสุดคือการดึงความรู้ระดับสูงจากข้อมูลระดับต่ำ
KDD มีกิจกรรมสหสาขาวิชาชีพ สิ่งนี้ครอบคลุมการจัดเก็บข้อมูลและการเข้าถึงการปรับอัลกอริธึมไปยังชุดข้อมูลขนาดใหญ่และการตีความผลลัพธ์ กระบวนการล้างข้อมูลและการเข้าถึงข้อมูลที่รวมอยู่ในคลังข้อมูลช่วยให้กระบวนการ KDD ง่ายขึ้น ปัญญาประดิษฐ์ยังสนับสนุน KDD โดยการค้นหากฎหมายเชิงประจักษ์จากการทดลองและการสังเกต รูปแบบที่ได้รับการยอมรับในข้อมูลจะต้องถูกต้องกับข้อมูลใหม่และมีความมั่นใจในระดับหนึ่ง รูปแบบเหล่านี้ถือว่าเป็นความรู้ใหม่ ขั้นตอนที่เกี่ยวข้องในกระบวนการ KDD ทั้งหมดคือ:
- ระบุเป้าหมายของกระบวนการ KDD จากมุมมองของลูกค้า
- ทำความเข้าใจเกี่ยวกับโดเมนแอปพลิเคชันที่เกี่ยวข้องและความรู้ที่จำเป็น
- เลือกชุดข้อมูลเป้าหมายหรือชุดย่อยของตัวอย่างข้อมูลที่จะดำเนินการค้นหา
- ทำความสะอาดและประมวลผลข้อมูลล่วงหน้าโดยการตัดสินใจเลือกกลยุทธ์เพื่อจัดการกับช่องที่ขาดหายไปและแก้ไขข้อมูลตามข้อกำหนด
- ลดความซับซ้อนของชุดข้อมูลโดยการลบตัวแปรที่ไม่ต้องการ จากนั้นวิเคราะห์คุณสมบัติที่มีประโยชน์ที่สามารถใช้เพื่อแสดงข้อมูลขึ้นอยู่กับเป้าหมายหรือภารกิจ
- จับคู่เป้าหมาย KDD กับวิธีการขุดข้อมูลเพื่อแนะนำรูปแบบที่ซ่อนอยู่
- เลือกอัลกอริทึมการขุดข้อมูลเพื่อค้นหารูปแบบที่ซ่อนอยู่ กระบวนการนี้รวมถึงการตัดสินใจเลือกรุ่นและพารามิเตอร์ที่เหมาะสมสำหรับกระบวนการ KDD โดยรวม
- ค้นหารูปแบบที่น่าสนใจในรูปแบบเฉพาะซึ่งรวมถึงกฎการจำแนกหรือต้นไม้การถดถอยและการจัดกลุ่ม
- ตีความความรู้ที่สำคัญจากรูปแบบการขุด
- ใช้ความรู้และรวมไว้ในระบบอื่นเพื่อดำเนินการต่อไป
- จัดทำเอกสารและจัดทำรายงานสำหรับผู้มีส่วนได้เสีย
