บ้าน เสียง เหตุใดโครงการการเรียนรู้ด้วยเครื่องบางโครงการอาจต้องการนักแสดงจำนวนมาก

เหตุใดโครงการการเรียนรู้ด้วยเครื่องบางโครงการอาจต้องการนักแสดงจำนวนมาก

Anonim

Q:

เหตุใดโครงการการเรียนรู้ด้วยเครื่องบางโครงการอาจต้องการนักแสดงจำนวนมาก

A:

เมื่อคุณคิดถึงการเรียนรู้ของเครื่องคุณมักจะนึกถึงนักวิทยาศาสตร์ข้อมูลที่มีทักษะซึ่งทำงานกับแป้นพิมพ์ในห้องคอมพิวเตอร์ มีความสำคัญอย่างยิ่งในการวิเคราะห์เชิงปริมาณและขั้นตอนวิธีคือ ไม่มีบริบทโลกแห่งความเป็นจริงในทันทีสำหรับโปรแกรมเหล่านี้จำนวนมาก - อย่างน้อยนั่นคือสิ่งที่หลายคนคิด

อย่างไรก็ตามโปรแกรมการเรียนรู้ด้วยเครื่องจักรที่ล้ำสมัยที่สุดในปัจจุบันบางส่วนกำลังใช้ประโยชน์จากกองทัพมนุษย์จริงบนท้องถนนในร้านค้าและทุกที่ที่พวกเขาสามารถจำลองกิจกรรมมนุษย์ขั้นพื้นฐานเช่นการเดินการทำงานหรือการช็อปปิ้ง

ดาวน์โหลดฟรี: การเรียนรู้ของเครื่องและเหตุผลที่สำคัญ

บทความแบบมีสายโดย Tom Simonite แสดงให้เห็นถึงสิ่งนี้ได้เป็นอย่างดีพร้อมกับชื่อ apt "เพื่อให้ AI ฉลาดขึ้นมนุษย์ทำภารกิจ Oddball ที่ได้ค่าจ้างต่ำ"

การใช้ตัวอย่างวิดีโอสั้น ๆ ที่ถ่ายในร้านขายของชำ Whole Foods ไซมอนไลท์เน้นประเภทของงานที่จะช่วยสร้างการเรียนรู้ของเครื่องในระยะต่อไป

สิ่งนี้นำไปสู่คำถามที่ว่าทำไมคนเหล่านี้ทั้งหมดจึงมีส่วนร่วมในการถ่ายทำวิดีโอสั้น ๆ และเรียบง่ายที่บันทึกการกระทำที่เป็นพื้นฐานในการเคลื่อนแขนหรือขา

คำตอบจะให้แสงสว่างบางอย่างเกี่ยวกับการเรียนรู้ของเครื่องและตำแหน่งที่จะไป

“ นักวิจัยและผู้ประกอบการต้องการเห็น AI เข้าใจและลงมือทำในโลกทางกายภาพ” Simonite เขียนอธิบายว่าทำไมเขาและคนอื่น ๆ กำลังท่องไปกับกล้อง “ ดังนั้นความต้องการให้คนงานแสดงฉากในซุปเปอร์มาร์เก็ตและบ้านเรือน พวกเขากำลังสร้างสื่อการสอนเพื่อสอนอัลกอริทึมเกี่ยวกับโลกและผู้คนในนั้น”

เนื่องจากผู้เชี่ยวชาญหลายคนจะชี้ให้เห็นขอบเขตที่ใหญ่ที่สุดของการเรียนรู้ของเครื่องเกี่ยวข้องกับการประมวลผลภาพและการประมวลผลภาษาธรรมชาติ สิ่งเหล่านี้เป็นกระบวนการเชิงปริมาณอย่างมาก - กล่าวอีกอย่างหนึ่งก็คือไม่มีปัจจัยการผลิตที่หลากหลายเช่นในสภาพแวดล้อมจริง "นักแสดง" แต่โปรแกรมการเรียนรู้ของเครื่องกำลังใช้ข้อมูลภาพและเสียงในวิธีที่เฉพาะเจาะจงมากในการสร้างแบบจำลอง ด้วยการประมวลผลภาพมันคือการเลือกคุณสมบัติจากขอบเขตการมองเห็น (จำกัด ) สำหรับ NLP มันคือการรวบรวมหน่วยเสียง

นอกเหนือไปจากหมวดหมู่อินพุตเฉพาะเหล่านี้เกี่ยวข้องกับสิ่งที่คุณอาจเรียกว่า "ช่องว่างภาพและเสียงพูด" - นอกเหนือไปจากสิ่งต่าง ๆ เช่นการประมวลผลภาพและการรู้จำเสียงคุณกำลังเข้าสู่บริเวณที่คอมพิวเตอร์ต้องวิเคราะห์ในรูปแบบต่างๆ ชุดฝึกอบรมจะแตกต่างกันโดยพื้นฐาน

เข้าสู่กองทัพของช่างวิดีโอ ในโครงการเรียนรู้เครื่องจักรใหม่เหล่านี้ความคิดที่เล็กที่สุดของกิจกรรมของมนุษย์คือชุดฝึกอบรม แทนที่จะได้รับการฝึกอบรมเพื่อค้นหาคุณสมบัติและขอบและพิกเซลที่ประกอบเป็นภารกิจการจัดประเภทคอมพิวเตอร์แทนที่จะใช้วิดีโอการฝึกอบรมเพื่อประเมินลักษณะการทำงานประเภทต่างๆ

สิ่งสำคัญคือสิ่งที่วิศวกรสามารถทำกับข้อมูลนี้เมื่อมีการรวบรวมและโหลดและเมื่อคอมพิวเตอร์ได้รับการฝึกฝน ในไม่ช้าคุณจะเห็นผลลัพธ์ในด้านต่าง ๆ - เช่นนี้จะทำให้การเฝ้าระวังมีประสิทธิภาพอย่างมาก คอมพิวเตอร์จะสามารถ "เห็น" ในทัศนวิสัยที่ผู้คนกำลังทำอยู่และนำไปใช้กับสาขาเช่นการตลาดและการขายหรือในบางกรณีงานของหน่วยงานของรัฐหรือความยุติธรรมทางอาญา

การแบ่งสาขายังให้ความกระจ่างในการอภิปรายระหว่างประโยชน์สูงสุดและคำถามความเป็นส่วนตัว การใช้วิดีโอเหล่านี้ส่วนใหญ่จะสร้างรูปแบบการเรียนรู้ด้วยเครื่องที่ใช้ในการเฝ้าระวัง แต่สิ่งที่เกี่ยวกับคนที่ไม่ต้องการถูกเปิดเผย? เมื่อโปรแกรมการเรียนรู้ของเครื่องใหม่เหล่านี้ถูกปรับใช้ในพื้นที่สาธารณะสิทธิของบุคคลคืออะไรและมีการวาดเส้นนั้นไว้ที่ไหน

ไม่ว่าในกรณีใด บริษัท ต่าง ๆ กำลังใช้ทรัพยากรมนุษย์และวิดีโอประเภทนี้เพื่อเจาะลึกความก้าวหน้าในการเรียนรู้ของเครื่องจักรซึ่งจะทำให้คอมพิวเตอร์สามารถรับรู้สิ่งที่เกิดขึ้นรอบตัวพวกเขามากกว่าที่จะจำแนกภาพหรือทำงานกับหน่วยเสียงของ การพูด นี่คือการพัฒนาที่น่าสนใจและแย้งในปัญญาประดิษฐ์และเป็นสิ่งที่สมควรได้รับความสนใจในสื่อเทคโนโลยีและอื่น ๆ

เหตุใดโครงการการเรียนรู้ด้วยเครื่องบางโครงการอาจต้องการนักแสดงจำนวนมาก