บ้าน พัฒนาการ แนวคิดเรื่องความสมดุลอาจแจ้งโครงการเรียนรู้ของเครื่องได้อย่างไร

แนวคิดเรื่องความสมดุลอาจแจ้งโครงการเรียนรู้ของเครื่องได้อย่างไร

Anonim

Q:

แนวคิดเรื่องความสมดุลอาจแจ้งโครงการเรียนรู้ของเครื่องได้อย่างไร

A:

โดยทั่วไปความสมดุลจะแจ้งการเรียนรู้ของเครื่องจักรโดยการหาทางรักษาสภาพแวดล้อมการเรียนรู้ของเครื่องจักรและสร้างผลลัพธ์ด้วยการผสมผสานที่เข้ากันได้ของส่วนประกอบที่กำหนดและน่าจะเป็น

ผู้เชี่ยวชาญอธิบายว่า "ดุลยภาพ" เป็นสถานการณ์ที่นักแสดงเหตุผลในระบบการเรียนรู้ของเครื่องจักรเข้าถึงฉันทามติเกี่ยวกับการดำเนินการเชิงกลยุทธ์ - โดยเฉพาะอย่างยิ่งความสมดุลของแนชในทฤษฎีเกมเกี่ยวข้องกับนักแสดงเหตุผลเหล่านี้สองคนหรือมากกว่านั้น เปลี่ยนกลยุทธ์เฉพาะถ้าผู้เล่นคนอื่นไม่เปลี่ยนพวกเขา

ดาวน์โหลดฟรี: การเรียนรู้ของเครื่องและเหตุผลที่สำคัญ

การสาธิตที่ได้รับความนิยมและเรียบง่ายโดยเฉพาะอย่างยิ่งของสมดุลของแนชนั้นเกี่ยวข้องกับเมทริกซ์ธรรมดาที่ผู้เล่นสองคนแต่ละคนเลือกผลลัพธ์ไบนารี

ข้างต้นเป็นวิธีทางเทคนิคที่ใช้อธิบายสมดุลและวิธีการทำงาน วิธีที่ไม่เป็นทางการมากขึ้นเพื่อแสดงให้เห็นถึงแนวคิดของความสมดุลโดยเฉพาะตัวอย่างข้างต้นของนักแสดงเหตุผลสองคนที่มีตัวเลือกไบนารีคือคิดเกี่ยวกับสิ่งที่คุณอาจเรียกว่า "เดินไปหากันในห้องโถงโรงเรียนมัธยม"

สมมติว่าคนสองคนเดินไปในทิศทางที่แตกต่างกันไปตามโถงทางเดินของโรงเรียนมัธยม (หรือพื้นที่ประเภทอื่น ๆ ) ที่มีเพียงห้องสำหรับคนสองคนที่มีความกว้าง เส้นทางเปิดสองเส้นทางเป็นผลลัพธ์แบบไบนารี หากนักแสดงเหตุผลสองคนเลือกผลลัพธ์ไบนารีที่แตกต่างกันซึ่งไม่ขัดแย้งกันพวกเขาจะผ่านกันและกันและทักทาย หากพวกเขาเลือกผลลัพธ์ไบนารีที่ขัดแย้งกันสองรายการ - พวกเขากำลังเดินอยู่ในพื้นที่เดียวกันและหนึ่งในนั้นจะต้องให้ผล

ในตัวอย่างข้างต้นหากนักแสดงเหตุผลสองคนเลือกผลลัพธ์ที่เข้ากันได้และไม่ขัดแย้งกันทั้งสองฉันทามติทั่วไปก็คือว่าไม่มีใครได้รับจากการเปลี่ยนกลยุทธ์ของพวกเขา - ในกรณีนี้ทิศทางการเดินของพวกเขา - ถ้าคนอื่นไม่เปลี่ยนพวกเขา

ข้างต้นถือว่าเป็นดุลยภาพที่สามารถสร้างแบบจำลองในการเรียนรู้ด้วยเครื่องจักร จากตัวอย่างง่ายๆนี้ผลที่ได้คือนักแสดงเหตุผลสองคนที่ร่วมมือกันหรือพูดอีกอย่างคือคนสองคนเดินผ่านกันและกัน

สิ่งที่ตรงกันข้ามอาจเรียกว่า "ความไม่สมดุล" - หากนักแสดงเหตุผลสองคนเลือกผลลัพธ์ที่ขัดแย้งกันดังที่กล่าวไว้หนึ่งในนั้นจะต้องให้ผล อย่างไรก็ตามการสร้างแบบจำลองโปรแกรม ML นี้อาจถูกโยนลงในวงวนไม่สิ้นสุดหากทั้งคู่ตัดสินใจที่จะให้ผลตอบแทน - เหมือนคนสองคนที่จะย้ายเพื่อพยายามช่วยเหลือซึ่งกันและกันและยังคงเดินต่อไปสู่การปะทะกัน

โดยทั่วไปจะใช้ Equilibriums ดังกล่าวข้างต้นในการเรียนรู้ของเครื่องเพื่อสร้างฉันทามติและสร้างเสถียรภาพของแบบจำลอง วิศวกรและนักพัฒนาจะค้นหาสถานการณ์และสถานการณ์เหล่านั้นที่ได้รับประโยชน์จากดุลยภาพและทำงานเพื่อเปลี่ยนแปลงหรือจัดการกับสิ่งที่ไม่ได้ทำ ดูตัวอย่างโลกแห่งความจริงที่สอดคล้องกับดุลยภาพของ ML มันง่ายที่จะดูว่าการวิเคราะห์แบบนี้ในระบบการเรียนรู้ของเครื่องเป็นวิธีที่ไม่ซ้ำกันในการหาวิธีจำลองพฤติกรรมของมนุษย์โดยการสร้างนักแสดงและตัวแทนที่มีเหตุผล นี่เป็นเพียงตัวอย่างหนึ่งที่ยอดเยี่ยมเกี่ยวกับวิธีการใช้ดุลยภาพเพื่อให้เกิดความก้าวหน้าในการประยุกต์ใช้ระบบการเรียนรู้ของเครื่อง

แนวคิดเรื่องความสมดุลอาจแจ้งโครงการเรียนรู้ของเครื่องได้อย่างไร