สารบัญ:
คำจำกัดความ - การตรวจหาค่าผิดปกติหมายถึงอะไร
การตรวจจับภายนอกคือกระบวนการของการตรวจจับและไม่รวมค่าผิดปกติจากชุดข้อมูลที่ระบุ
ค่าผิดปกติอาจถูกกำหนดเป็นชิ้นส่วนของข้อมูลหรือการสังเกตที่เบี่ยงเบนอย่างมากจากบรรทัดฐานหรือค่าเฉลี่ยที่กำหนดของชุดข้อมูล ค่าผิดปกติอาจเกิดขึ้นโดยบังเอิญ แต่ก็อาจบ่งบอกถึงข้อผิดพลาดในการวัดหรือว่าชุดข้อมูลที่ให้นั้นมีการแจกแจงแบบหนา
นี่เป็นสถานการณ์จำลองอย่างง่ายในการตรวจหาค่าผิดเพี้ยนกระบวนการวัดสร้างค่าการอ่านค่าอย่างสม่ำเสมอระหว่าง 1 ถึง 10 แต่ในบางกรณีที่หาได้ยากเราได้รับการวัดค่ามากกว่า 20
การวัดที่หายากเกินกว่าบรรทัดฐานเหล่านี้เรียกว่าค่าผิดปกติเนื่องจากมัน "อยู่ข้างนอก" เส้นโค้งการแจกแจงแบบปกติ
Techopedia อธิบายการตรวจหาค่าผิดปกติ
ไม่มีวิธีการทางคณิตศาสตร์ที่ได้มาตรฐานและเข้มงวดสำหรับการกำหนดค่าผิดปกติเพราะมันแตกต่างกันไปขึ้นอยู่กับกลุ่มประชากรหรือชุดข้อมูลดังนั้นการกำหนดและการตรวจจับในท้ายที่สุดจึงกลายเป็นอัตวิสัย ด้วยการสุ่มตัวอย่างอย่างต่อเนื่องในเขตข้อมูลที่กำหนดคุณลักษณะของค่าเริ่มต้นอาจถูกกำหนดขึ้นเพื่อให้การตรวจจับง่ายขึ้น
มีวิธีการที่ใช้แบบจำลองสำหรับการตรวจจับค่าผิดปกติและพวกเขาคิดว่าข้อมูลทั้งหมดมาจากการแจกแจงแบบปกติและจะระบุการสังเกตหรือจุดซึ่งถือว่าไม่น่าจะเป็นไปตามค่าเบี่ยงเบนมาตรฐานหรือค่าเบี่ยงเบนมาตรฐาน มีหลายวิธีในการตรวจหาค่าผิดปกติ:
- การทดสอบสำหรับผู้ผิดกฏหมายของ Grubb - เป็นไปตามข้อสันนิษฐานที่ว่าข้อมูลมีการแจกแจงแบบปกติและลบค่าผิดพลาดครั้งละหนึ่งครั้งพร้อมการทดสอบซ้ำจนกว่าจะไม่พบค่าผิดปกติอีกต่อไป
- การทดสอบ Q ของ Dixon - นอกจากนี้ยังขึ้นอยู่กับความปกติของชุดข้อมูลวิธีนี้จะทดสอบข้อมูลที่ไม่ดี มีการตั้งข้อสังเกตว่าสิ่งนี้ควรใช้อย่าง จำกัด และไม่เกินหนึ่งครั้งในชุดข้อมูล
- เกณฑ์ของ Chauvenet - ใช้เพื่อวิเคราะห์ว่าค่าผิดเพี้ยนเป็นจริงหรือยังอยู่ในขอบเขตและถือเป็นส่วนหนึ่งของชุด ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานและความน่าจะเป็นที่เกิดขึ้นจากการเปรียบเทียบ ผลลัพธ์จะเป็นตัวกำหนดว่าควรรวมหรือไม่
- เกณฑ์ของ Pierce - ข้อ จำกัด ข้อผิดพลาดถูกกำหนดไว้สำหรับชุดการสังเกตซึ่งเกินกว่าที่การสังเกตทั้งหมดจะถูกยกเลิกเมื่อพวกเขาเกี่ยวข้องกับข้อผิดพลาดที่ยิ่งใหญ่เช่นนี้แล้ว
