Q:
เหตุใดการเลือกคุณสมบัติจึงมีความสำคัญในการเรียนรู้ของเครื่อง?
A:การเลือกคุณสมบัติเป็นสิ่งสำคัญอย่างยิ่งในการเรียนรู้ของเครื่องจักรเป็นหลักเพราะทำหน้าที่เป็นเทคนิคพื้นฐานในการนำการใช้ตัวแปรไปสู่สิ่งที่มีประสิทธิภาพและประสิทธิผลที่สุดสำหรับระบบการเรียนรู้ของเครื่อง
ผู้เชี่ยวชาญพูดคุยเกี่ยวกับวิธีการเลือกคุณลักษณะและการแยกคุณลักษณะเพื่อลดการสาปแช่งของมิติข้อมูลหรือช่วยจัดการกับการ overfitting - นี่เป็นวิธีที่แตกต่างกันในการจัดการกับแนวคิดของการสร้างแบบจำลองที่ซับซ้อนมากเกินไป
ดาวน์โหลดฟรี: การเรียนรู้ของเครื่องและเหตุผลที่สำคัญ |
อีกวิธีในการพูดแบบนี้คือการเลือกคุณสมบัติช่วยให้นักพัฒนาเครื่องมือใช้เฉพาะข้อมูลที่เกี่ยวข้องและเป็นประโยชน์มากที่สุดในชุดการฝึกอบรมการเรียนรู้ของเครื่องซึ่งช่วยลดต้นทุนและปริมาณข้อมูลได้อย่างมาก
ตัวอย่างหนึ่งคือแนวคิดในการวัดรูปร่างที่ซับซ้อนในระดับ เมื่อโปรแกรมขยายขนาดโปรแกรมจะระบุจุดข้อมูลจำนวนมากขึ้นและระบบมีความซับซ้อนมากขึ้น แต่รูปร่างที่ซับซ้อนไม่ใช่ชุดข้อมูลทั่วไปที่ใช้ระบบการเรียนรู้ของเครื่อง ระบบเหล่านี้อาจใช้ชุดข้อมูลที่มีระดับความแปรปรวนระหว่างตัวแปรต่างกันอย่างมาก ตัวอย่างเช่นในการจำแนกสายพันธุ์วิศวกรสามารถใช้การเลือกคุณสมบัติเพื่อศึกษาตัวแปรที่จะให้ผลลัพธ์ที่ตรงเป้าหมายที่สุดเท่านั้น หากสัตว์ทุกตัวในแผนภูมิมีจำนวนตาหรือขาเท่ากันข้อมูลนั้นอาจถูกลบออกหรือจุดข้อมูลที่เกี่ยวข้องอื่น ๆ อาจถูกดึงออกมา
การเลือกคุณสมบัติเป็นกระบวนการที่แยกแยะโดยที่วิศวกรนำระบบการเรียนรู้ของเครื่องไปยังเป้าหมาย นอกเหนือจากความคิดในการขจัดความซับซ้อนออกจากระบบในระดับการเลือกคุณลักษณะยังมีประโยชน์ในการเพิ่มประสิทธิภาพของสิ่งที่ผู้เชี่ยวชาญเรียกว่า "ความแปรปรวนอคติการแลกเปลี่ยน" ในการเรียนรู้ของเครื่อง
เหตุผลที่การเลือกคุณสมบัติช่วยด้วยการวิเคราะห์อคติและความแปรปรวนนั้นซับซ้อนกว่า การศึกษาจากมหาวิทยาลัยคอร์เนลล์เกี่ยวกับการเลือกคุณสมบัติความแปรปรวนอคติและการบรรจุถุงนั้นทำหน้าที่แสดงให้เห็นว่าการคัดเลือกคุณสมบัติช่วยโครงการได้อย่างไร
ตามที่ผู้เขียนรายงาน "ตรวจสอบกลไกที่เลือกคุณสมบัติช่วยเพิ่มความแม่นยำของการเรียนรู้แบบมีผู้สอน"
การศึกษาเพิ่มเติมระบุ:
การวิเคราะห์อคติเชิงประจักษ์ / การแปรปรวนเป็นความคืบหน้าการเลือกคุณลักษณะบ่งชี้ว่าชุดคุณลักษณะที่ถูกต้องที่สุดสอดคล้องกับจุดแลกเปลี่ยนความแปรปรวนอคติที่ดีที่สุดสำหรับอัลกอริทึมการเรียนรู้
ในการพูดคุยเกี่ยวกับการใช้ความเกี่ยวข้องที่รัดกุมหรืออ่อนแอผู้เขียนพูดคุยเกี่ยวกับการเลือกคุณลักษณะเป็น "วิธีการลดความแปรปรวน" - สิ่งนี้สมเหตุสมผลเมื่อคุณคิดถึงความแปรปรวนเป็นหลักจำนวนของการเปลี่ยนแปลงในตัวแปรที่กำหนด หากไม่มีความแปรปรวนจุดข้อมูลหรืออาเรย์อาจไร้ประโยชน์ หากมีความแปรปรวนสูงมากมันอาจตกอยู่กับสิ่งที่วิศวกรอาจคิดว่าเป็น "เสียง" หรือผลลัพธ์ที่ไม่เกี่ยวข้องโดยพลการซึ่งเป็นเรื่องยากสำหรับระบบการเรียนรู้ของเครื่องในการจัดการ
ในแง่นี้การเลือกคุณสมบัติเป็นส่วนพื้นฐานของการออกแบบในการเรียนรู้ของเครื่อง
