Q:
ทำไมการบรรจุถุงในการเรียนรู้ของเครื่องจึงลดความแปรปรวน?
A:การรวม Bootstrap หรือ "การห่อ" ในการเรียนรู้ของเครื่องลดความแปรปรวนผ่านการสร้างแบบจำลองขั้นสูงของชุดข้อมูลที่ซับซ้อน โดยเฉพาะวิธีการบรรจุถุงจะสร้างชุดย่อยซึ่งมักจะทับซ้อนกันเพื่อจำลองข้อมูลในวิธีที่เกี่ยวข้องมากกว่า
แนวคิดหนึ่งที่น่าสนใจและตรงไปตรงมาเกี่ยวกับวิธีการบรรจุถุงคือการสุ่มตัวอย่างแบบสุ่มและแยกค่าเฉลี่ยแบบง่าย ๆ จากนั้นใช้ตัวอย่างชุดเดียวกันสร้างชุดย่อยหลายสิบชุดที่สร้างขึ้นเป็นแผนผังการตัดสินใจเพื่อจัดการผลลัพธ์ในที่สุด ค่าเฉลี่ยที่สองควรแสดงภาพที่แท้จริงว่าตัวอย่างบุคคลเหล่านั้นเกี่ยวข้องกันอย่างไรในแง่ของมูลค่า แนวคิดเดียวกันนี้สามารถนำไปใช้กับคุณสมบัติของชุดข้อมูลใด ๆ ได้
| ดาวน์โหลดฟรี: การเรียนรู้ของเครื่องและเหตุผลที่สำคัญ |
เนื่องจากวิธีการนี้รวมการค้นพบเข้ากับขอบเขตที่กำหนดไว้มากขึ้นจึงลดความแปรปรวนและช่วยในการหาข้อมูลมากเกินไป คิดถึง scatterplot ที่มีจุดข้อมูลที่ค่อนข้างกระจาย โดยใช้วิธีการบรรจุถุงวิศวกรจะ "ย่อ" ความซับซ้อนและปรับทิศทางการค้นหาให้สอดคล้องกับพารามิเตอร์ที่นุ่มนวลขึ้น
บางคนพูดถึงคุณค่าของการห่อเป็น "หารและพิชิต" หรือ "heuristic ที่มีส่วนช่วย" แนวคิดก็คือผ่านการสร้างแบบจำลองวงดนตรีเช่นการใช้ป่าสุ่มผู้ที่ใช้การห่อเป็นเทคนิคสามารถได้รับข้อมูลที่มีความแปรปรวนต่ำกว่า ในแง่ของความซับซ้อนที่ลดลงการบรรจุถุงสามารถช่วยในเรื่องการบรรจุมากเกินไปได้ นึกถึงโมเดลที่มีจุดข้อมูลมากเกินไปเช่นพูดจุดเชื่อมต่อที่มีจุด 100 จุดที่ไม่ได้จัดแนว บรรทัดข้อมูลภาพที่ได้จะเป็นขรุขระแบบไดนามิกผันผวน จากนั้น "ขจัดความแปรปรวน" โดยการรวมชุดการประเมินเข้าด้วยกัน ในการเรียนรู้ทั้งมวลนี้มักจะคิดว่าเป็นการเข้าร่วมหลาย ๆ "ผู้เรียนที่อ่อนแอ" เพื่อให้ได้ผลการเรียนรู้ที่แข็งแกร่ง ผลลัพธ์ที่ได้คือเส้นข้อมูลที่นุ่มนวลและมีเส้นสายมากขึ้นและความแปรปรวนน้อยกว่าในโมเดล
ง่ายมากที่จะเห็นว่าความคิดเกี่ยวกับการบรรจุถุงสามารถนำไปใช้กับระบบไอทีขององค์กรได้อย่างไร ผู้นำธุรกิจมักต้องการ "มุมมองของนก" ในสิ่งที่เกิดขึ้นกับผลิตภัณฑ์ลูกค้าเป็นต้นแบบจำลองที่ overfitted สามารถส่งคืนข้อมูลที่ย่อยได้น้อยลงและผลลัพธ์ที่ "กระจัดกระจาย" มากกว่าซึ่งการบรรจุถุงสามารถ "ทำให้เสถียร" แบบจำลองและทำให้มีประโยชน์มากขึ้น เพื่อผู้ใช้ปลายทาง




