Q:
การรวมกำไรสูงสุดช่วยให้ AlexNet เป็นเทคโนโลยีที่ยอดเยี่ยมสำหรับการประมวลผลภาพได้อย่างไร?
A:ใน AlexNet นวัตกรรมโครงข่ายประสาทเทียมแนวคิดของการรวมกำไรสูงสุดถูกแทรกลงในแบบจำลองที่ซับซ้อนด้วยเลเยอร์ convolutional หลายส่วนเพื่อช่วยในการปรับและปรับปรุงงานที่เครือข่ายประสาททำงานกับภาพที่สิ่งที่ผู้เชี่ยวชาญเรียก “ กลยุทธ์การสุ่มตัวอย่างที่ไม่ใช่เชิงเส้น”
AlexNet ได้รับการยอมรับอย่างกว้างขวางว่าเป็นซีเอ็นเอ็นที่ยอดเยี่ยมโดยได้รับรางวัล ILSVRC 2012 (การท้าทายการรับรู้ภาพขนาดใหญ่ของ ImageNet) ซึ่งถูกมองว่าเป็นเหตุการณ์ต้นน้ำสำหรับการเรียนรู้ของเครื่องจักรและโครงข่ายประสาทเทียม (บางคนเรียกว่า )
ในกรอบของเครือข่ายที่การฝึกอบรมแบ่งออกเป็นสอง GPUs มีเลเยอร์ convolutional ห้าเลเยอร์เลเยอร์ที่เชื่อมต่ออย่างสมบูรณ์สามเลเยอร์และการใช้งานร่วมกันสูงสุด
โดยพื้นฐานแล้วการรวมกำไรสูงสุดใช้ "พูล" ของเอาต์พุตจากชุดของเซลล์ประสาทและใช้กับค่าของเลเยอร์ที่ตามมา อีกวิธีหนึ่งในการทำความเข้าใจนี้คือวิธีการรวมกำไรสูงสุดสามารถรวมและทำให้ค่าง่ายขึ้นเพื่อให้ได้แบบจำลองที่เหมาะสมยิ่งขึ้น
การรวมกำไรสูงสุดสามารถช่วยคำนวณการไล่ระดับสี หนึ่งสามารถพูดได้ว่ามัน“ ลดภาระการคำนวณ” หรือ“ ลดการล้นเกิน” - ผ่านการสุ่มตัวอย่างการรวมกำไรสูงสุดประกอบสิ่งที่เรียกว่า
การลดมิติเกี่ยวข้องกับปัญหาของการมีรูปแบบที่ซับซ้อนที่ยากที่จะทำงานผ่านเครือข่ายประสาท ลองนึกภาพรูปร่างที่ซับซ้อนด้วยรูปทรงขรุขระขนาดเล็กจำนวนมากและทุก ๆ เส้นของเส้นนี้แทนด้วยจุดข้อมูล ด้วยการลดมิติข้อมูลวิศวกรกำลังช่วยให้โปรแกรมการเรียนรู้ของเครื่อง "ซูมออก" หรือสุ่มตัวอย่างจุดข้อมูลน้อยลงเพื่อทำให้แบบจำลองทั้งหมดเรียบง่ายขึ้น นั่นเป็นเหตุผลว่าทำไมหากคุณดูเลเยอร์ที่รวมกำไรสูงสุดและผลลัพธ์บางครั้งคุณสามารถเห็นการสร้างพิกเซลที่ง่ายขึ้นซึ่งสอดคล้องกับกลยุทธ์การลดขนาด
AlexNet ยังใช้ฟังก์ชั่นที่เรียกว่า rectified linear units (ReLU) และการรวมกำไรสูงสุดสามารถเสริมให้กับเทคนิคนี้ในการประมวลผลภาพผ่าน CNN
ผู้เชี่ยวชาญและผู้ที่เกี่ยวข้องในโครงการได้ส่งโมเดลภาพสมการและรายละเอียดอื่น ๆ มากมายเพื่อแสดงโครงสร้างเฉพาะของ AlexNet แต่โดยทั่วไปแล้วคุณสามารถนึกถึงการรวมกำไรสูงสุดเป็นการรวมตัวกันหรือรวมเอาเซลล์ประสาทเทียมหลายตัวเข้าด้วยกัน กลยุทธ์นี้เป็นส่วนหนึ่งของการสร้างโดยรวมของ CNN ซึ่งได้กลายเป็นตรงกันกับการมองเห็นเครื่องจักรที่ทันสมัยและการจำแนกภาพ
