บ้าน ฐานข้อมูล การค้นพบความรู้ในฐานข้อมูลคืออะไร? - คำจำกัดความจาก techopedia

การค้นพบความรู้ในฐานข้อมูลคืออะไร? - คำจำกัดความจาก techopedia

สารบัญ:

Anonim

คำจำกัดความ - การค้นพบความรู้ในฐานข้อมูล (KDD) หมายถึงอะไร

การค้นหาความรู้ในฐานข้อมูล (KDD) เป็นกระบวนการค้นหาความรู้ที่เป็นประโยชน์จากการรวบรวมข้อมูล เทคนิคการขุดข้อมูลที่ใช้กันอย่างแพร่หลายนี้เป็นกระบวนการที่รวมถึงการเตรียมและการเลือกข้อมูลการล้างข้อมูลรวมความรู้ก่อนหน้าเกี่ยวกับชุดข้อมูลและการตีความโซลูชันที่ถูกต้องจากผลลัพธ์ที่สังเกตได้

พื้นที่ใช้งานหลักของ KDD ได้แก่ การตลาดการตรวจจับการทุจริตการสื่อสารโทรคมนาคมและการผลิต

Techopedia อธิบายการค้นพบความรู้ในฐานข้อมูล (KDD)

เดิมการขุดข้อมูลและการค้นหาความรู้ดำเนินการด้วยตนเอง เมื่อเวลาผ่านไปปริมาณของข้อมูลในหลาย ๆ ระบบเพิ่มขึ้นมากกว่าขนาดเทราไบต์และไม่สามารถดูแลรักษาด้วยตนเองได้อีกต่อไป นอกจากนี้เพื่อความสำเร็จในการดำรงอยู่ของธุรกิจใด ๆ การค้นพบรูปแบบพื้นฐานในข้อมูลถือเป็นสิ่งจำเป็น เป็นผลให้เครื่องมือซอฟต์แวร์จำนวนมากได้รับการพัฒนาเพื่อค้นหาข้อมูลที่ซ่อนอยู่และตั้งสมมติฐานซึ่งเป็นส่วนหนึ่งของปัญญาประดิษฐ์

กระบวนการ KDD ถึงจุดสูงสุดในช่วง 10 ปีที่ผ่านมา ตอนนี้เป็นที่ตั้งของวิธีการค้นพบที่หลากหลายซึ่งรวมถึงการเรียนรู้เชิงอุปนัยสถิติแบบเบย์การเพิ่มประสิทธิภาพการค้นหาความหมายการได้มาซึ่งความรู้สำหรับระบบผู้เชี่ยวชาญและทฤษฎีข้อมูล เป้าหมายสูงสุดคือการดึงความรู้ระดับสูงจากข้อมูลระดับต่ำ

KDD มีกิจกรรมสหสาขาวิชาชีพ สิ่งนี้ครอบคลุมการจัดเก็บข้อมูลและการเข้าถึงการปรับอัลกอริธึมไปยังชุดข้อมูลขนาดใหญ่และการตีความผลลัพธ์ กระบวนการล้างข้อมูลและการเข้าถึงข้อมูลที่รวมอยู่ในคลังข้อมูลช่วยให้กระบวนการ KDD ง่ายขึ้น ปัญญาประดิษฐ์ยังสนับสนุน KDD โดยการค้นหากฎหมายเชิงประจักษ์จากการทดลองและการสังเกต รูปแบบที่ได้รับการยอมรับในข้อมูลจะต้องถูกต้องกับข้อมูลใหม่และมีความมั่นใจในระดับหนึ่ง รูปแบบเหล่านี้ถือว่าเป็นความรู้ใหม่ ขั้นตอนที่เกี่ยวข้องในกระบวนการ KDD ทั้งหมดคือ:

  1. ระบุเป้าหมายของกระบวนการ KDD จากมุมมองของลูกค้า
  2. ทำความเข้าใจเกี่ยวกับโดเมนแอปพลิเคชันที่เกี่ยวข้องและความรู้ที่จำเป็น
  3. เลือกชุดข้อมูลเป้าหมายหรือชุดย่อยของตัวอย่างข้อมูลที่จะดำเนินการค้นหา
  4. ทำความสะอาดและประมวลผลข้อมูลล่วงหน้าโดยการตัดสินใจเลือกกลยุทธ์เพื่อจัดการกับช่องที่ขาดหายไปและแก้ไขข้อมูลตามข้อกำหนด
  5. ลดความซับซ้อนของชุดข้อมูลโดยการลบตัวแปรที่ไม่ต้องการ จากนั้นวิเคราะห์คุณสมบัติที่มีประโยชน์ที่สามารถใช้เพื่อแสดงข้อมูลขึ้นอยู่กับเป้าหมายหรือภารกิจ
  6. จับคู่เป้าหมาย KDD กับวิธีการขุดข้อมูลเพื่อแนะนำรูปแบบที่ซ่อนอยู่
  7. เลือกอัลกอริทึมการขุดข้อมูลเพื่อค้นหารูปแบบที่ซ่อนอยู่ กระบวนการนี้รวมถึงการตัดสินใจเลือกรุ่นและพารามิเตอร์ที่เหมาะสมสำหรับกระบวนการ KDD โดยรวม
  8. ค้นหารูปแบบที่น่าสนใจในรูปแบบเฉพาะซึ่งรวมถึงกฎการจำแนกหรือต้นไม้การถดถอยและการจัดกลุ่ม
  9. ตีความความรู้ที่สำคัญจากรูปแบบการขุด
  10. ใช้ความรู้และรวมไว้ในระบบอื่นเพื่อดำเนินการต่อไป
  11. จัดทำเอกสารและจัดทำรายงานสำหรับผู้มีส่วนได้เสีย
การค้นพบความรู้ในฐานข้อมูลคืออะไร? - คำจำกัดความจาก techopedia