บ้าน พัฒนาการ การขัดข้อมูลคืออะไร - คำจำกัดความจาก techopedia

การขัดข้อมูลคืออะไร - คำจำกัดความจาก techopedia

สารบัญ:

Anonim

คำจำกัดความ - การขัดข้อมูลหมายถึงอะไร

การขัดข้อมูลหมายถึงกระบวนการแก้ไขหรือลบข้อมูลที่ไม่สมบูรณ์ไม่ถูกต้องจัดรูปแบบไม่ถูกต้องหรือซ้ำซ้อนในฐานข้อมูล วัตถุประสงค์หลักของการขัดข้อมูลคือการทำให้ข้อมูลมีความแม่นยำและสอดคล้องกันมากขึ้น

การขัดข้อมูลเป็นกลยุทธ์สำคัญในการสร้างความมั่นใจว่าฐานข้อมูลยังคงถูกต้อง เป็นสิ่งสำคัญอย่างยิ่งในอุตสาหกรรมที่ต้องใช้ข้อมูลเป็นหลักรวมถึงการสื่อสารโทรคมนาคมการประกันภัยการธนาคารและการค้าปลีก การขัดข้อมูลจะทำการประเมินข้อมูลสำหรับข้อบกพร่องหรือข้อผิดพลาดอย่างเป็นระบบด้วยความช่วยเหลือของตารางการค้นหากฎและอัลกอริทึม

การขัดข้อมูลเรียกว่าการล้างข้อมูล

Techopedia อธิบายการขัดข้อมูล

ข้อผิดพลาดฐานข้อมูลเป็นเรื่องปกติและอาจเกิดจากสิ่งต่อไปนี้:

  • ข้อผิดพลาดของมนุษย์ระหว่างการป้อนข้อมูล
  • การรวมฐานข้อมูล
  • การขาดมาตรฐานข้อมูลทั้งอุตสาหกรรมหรือเฉพาะ บริษัท
  • ระบบที่มีอายุซึ่งมีข้อมูลล้าสมัย

ในอดีตการขัดข้อมูลทำได้ด้วยตนเอง สิ่งนี้ไม่เพียงเพิ่มเวลาที่ใช้ในการทำให้กระบวนการเสร็จสมบูรณ์เท่านั้น แต่ยังทำให้กระบวนการมีราคาแพงขึ้นและมีแนวโน้มที่จะเกิดข้อผิดพลาด สิ่งนี้นำไปสู่การสร้างเครื่องมือขัดข้อมูลที่มีประสิทธิภาพซึ่งประเมินข้อมูลข้อบกพร่องอย่างเป็นระบบซึ่งไม่สามารถระบุได้ในกระบวนการทำความสะอาดด้วยตนเอง


โดยทั่วไปแล้วเครื่องมือการขัดฐานข้อมูลประกอบด้วยโซลูชันที่เหมาะสำหรับการแก้ไขข้อผิดพลาดหลายประเภทเช่นการค้นหาระเบียนที่ซ้ำกันหรือการแทนที่รหัสไปรษณีย์ที่หายไป การผสานข้อมูลที่ผิดพลาดหรือเสียหายเป็นปัญหาที่ซับซ้อนที่สุด มันอธิบายได้ว่าเป็นปัญหา "ข้อมูลสกปรก" เพราะมีค่าใช้จ่ายหลายล้านดอลลาร์ต่อองค์กรทุกปี ปรากฏการณ์นี้เพิ่มขึ้นด้วยการเปิดตัวสภาพแวดล้อมทางธุรกิจที่ซับซ้อนยิ่งขึ้นด้วยระบบและข้อมูลที่มากขึ้น การขัดข้อมูลช่วยให้องค์กรสามารถแก้ไขปัญหาดังกล่าวได้ด้วยการจัดหาเครื่องมือขัดข้อมูลที่ทรงพลังเพื่อระบุและกำจัดข้อบกพร่องของข้อมูล

การขัดข้อมูลคืออะไร - คำจำกัดความจาก techopedia