บ้าน ฐานข้อมูล การใช้อัลกอริทึมในการทำนายการเลือกตั้ง: การแชทกับลินเซอร์

การใช้อัลกอริทึมในการทำนายการเลือกตั้ง: การแชทกับลินเซอร์

Anonim

Drew จะนำเสนอในการประชุม Big Data Innovation Summit วันที่ 30 และ 31 มกราคมในลาสเวกัส: http://analytics.theiegroup.com/bigdata-lasvegas ควบคู่ไปกับวิทยากรจากโอบามาในอเมริกา Best Buy, LinkedIn, The New York Times Nokia, Bitly, Barnes & Nobles, Walmart Labs และอีกมากมาย


ลิงค์ลงทะเบียน: http://bit.ly/Zs3wms


การสัมภาษณ์ครั้งนี้จัดทำโดย George Hill และตีพิมพ์ในนิตยสาร Big Data Innovation


ปฏิกิริยาแบบไหนที่คุณคาดการณ์ไว้?


ปฏิกิริยาส่วนใหญ่ได้มุ่งเน้นไปที่ความแตกต่างของความถูกต้องระหว่างพวกเราที่ศึกษาความคิดเห็นของประชาชนและการคาดการณ์ "ความรู้สึกลำไส้" ของเกจิและนักวิจารณ์ที่ได้รับความนิยม ในวันเลือกตั้งนักวิเคราะห์ข้อมูลเช่นฉัน Nate Silver (บล็อก New York Times FiveThirtyEight), Simon Jackman (มหาวิทยาลัยสแตนฟอร์ดและ Huffington Post) และ Sam Wang (Consortium Election Consortium) วางตำแหน่งโอกาสการเลือกตั้งของโอบามามากกว่า 90% อย่างถูกต้อง 332 คะแนนโหวตเลือกสำหรับโอบามาเป็นผลลัพธ์ที่น่าจะเป็นไปได้มากที่สุด ในขณะเดียวกันเกจิเช่น Karl Rove, George Will และ Steve Forbes กล่าวว่ารอมนีย์จะชนะ - และในบางกรณีทำได้อย่างง่ายดาย สิ่งนี้นำไปสู่การพูดคุยเรื่อง "ชัยชนะของบรรดาผู้" ซึ่งฉันหวังว่าจะนำไปสู่การเลือกตั้งในอนาคต


คุณประเมินอัลกอริทึมที่ใช้ในการคาดคะเนของคุณอย่างไร


รูปแบบการคาดการณ์ของฉันประเมินผลลัพธ์การลงคะแนนของรัฐและการลงคะแนนเลือกตั้งขั้นสุดท้ายในทุกวันของการรณรงค์เริ่มต้นในเดือนมิถุนายน ฉันต้องการให้การประเมินการคาดการณ์เหล่านี้มีความยุติธรรมและเป็นไปได้และอย่าปล่อยให้ห้องเลื้อยหลุดหากฉันทำผิด ดังนั้นประมาณหนึ่งเดือนก่อนการเลือกตั้งฉันโพสต์หลักเกณฑ์การประเมินแปดชุดบนเว็บไซต์ของฉันที่ฉันจะใช้เมื่อทราบผลลัพธ์ เมื่อมันปรากฏออกมาโมเดลก็ทำงานได้อย่างสมบูรณ์แบบ คาดการณ์ในช่วงฤดูร้อนที่โอบามาจะชนะทุกรัฐในปี 2008 ของเขาลบกับรัฐอินเดียนาและนอร์ ธ แคโรไลน่าและแทบจะไม่ได้รับการคาดการณ์นั้นแม้จะได้รับการสนับสนุนจากโอบามาเพิ่มขึ้นในเดือนกันยายน


จำนวนข้อมูลที่ใช้ตลอดทั้งแคมเปญนี้โดยนักวิเคราะห์อิสระและทีมงานรณรงค์มีจำนวนมากสิ่งนี้มีความหมายต่อการใช้ข้อมูลในปี 2559 อย่างไร


การรณรงค์ในปี 2012 ได้พิสูจน์แล้วว่าแหล่งข้อมูลเชิงปริมาณที่หลากหลายและหลากหลายนั้นสามารถจัดการได้รับความเชื่อถือและนำไปใช้อย่างประสบความสำเร็จในหลาย ๆ ด้าน เราบุคคลภายนอกสามารถทำนายผลการเลือกตั้งล่วงหน้าได้ ภายในแคมเปญมีความก้าวหน้าอย่างมากในการกำหนดเป้าหมายผู้มีสิทธิเลือกตั้งการติดตามความคิดเห็นการระดมทุนและผู้มีสิทธิ์เลือกตั้ง ตอนนี้เรารู้ว่าวิธีการเหล่านี้สามารถใช้งานได้ฉันคิดว่าจะไม่กลับไป ฉันคาดหวังว่านักข่าวและนักวิจารณ์การรณรงค์จะทำการสำรวจรวมอย่างจริงจังมากขึ้นในปี 2559 และถึงแม้ว่าโอบามาและพรรคเดโมแครตจะมีข้อได้เปรียบในด้านเทคโนโลยีการรณรงค์ในปัจจุบันฉันก็จะประหลาดใจถ้าพวกรีพับลิกันไม่ทัน


คุณคิดว่าความสำเร็จของแคมเปญที่ขับเคลื่อนด้วยข้อมูลนี้หมายถึงตอนนี้ผู้จัดการแคมเปญต้องเป็นนักวิเคราะห์และนักยุทธศาสตร์หรือไม่?


ผู้จัดการแคมเปญอาจไม่จำเป็นต้องเป็นนักวิเคราะห์ด้วยตนเอง แต่พวกเขาควรจะมีความชื่นชมมากขึ้นว่าข้อมูลและเทคโนโลยีสามารถถูกควบคุมเพื่อประโยชน์ของพวกเขาได้อย่างไร แคมเปญใช้การวิจัยเชิงสำรวจเพื่อกำหนดกลยุทธ์และวัดความเชื่อมั่นของผู้มีสิทธิเลือกตั้ง แต่ตอนนี้มีเครื่องมือที่ทรงพลังอื่น ๆ อีกมากมาย: เว็บไซต์เครือข่ายสังคมฐานข้อมูลผู้มีสิทธิเลือกตั้งสมาร์ทโฟนมือถือและการตลาดผ่านอีเมล และนั่นคือนอกจากความก้าวหน้าล่าสุดในวิธีการสำรวจและแบบจำลองความคิดเห็นทางสถิติ มีนวัตกรรมมากมายเกิดขึ้นในการเมืองการรณรงค์ของอเมริกาในขณะนี้


คุณสามารถทำนายผลการเลือกตั้งล่วงหน้าได้ 6 เดือนคุณคิดว่ากรอบเวลาสูงสุดที่เป็นจริงในการทำนายผลอย่างแม่นยำโดยใช้เทคนิคการวิเคราะห์ของคุณคืออะไร?


ประมาณสี่หรือห้าเดือนกลับมาไกลพอ ๆ กับวิทยาศาสตร์ที่ให้เราไปได้ในตอนนี้ และนั่นคือการผลักดันเล็กน้อย ก่อนหน้านั้นการสำรวจความคิดเห็นยังไม่ได้ให้ข้อมูลที่เพียงพอเกี่ยวกับผลลัพธ์ในที่สุด: มีคนจำนวนมากที่ไม่แน่ใจหรือยังไม่ได้เริ่มให้ความสนใจกับแคมเปญ ปัจจัยทางเศรษฐกิจและการเมืองในอดีตที่แสดงให้เห็นว่ามีความสัมพันธ์กับผลการเลือกตั้งก็เริ่มสูญเสียอำนาจการทำนายของพวกเขาเมื่อเราได้รับเกินกว่าช่วง 4-5 เดือน โชคดีที่ยังคงให้เวลากับแคมเปญในการวางแผนกลยุทธ์และตัดสินใจเกี่ยวกับการจัดสรรทรัพยากร

การใช้อัลกอริทึมในการทำนายการเลือกตั้ง: การแชทกับลินเซอร์