บ้าน เสียง ความสามารถในการเรียนรู้ของเครื่องใหม่จะช่วยให้สามารถขุดเอกสารสต็อกสำหรับข้อมูลทางการเงินได้อย่างไร

ความสามารถในการเรียนรู้ของเครื่องใหม่จะช่วยให้สามารถขุดเอกสารสต็อกสำหรับข้อมูลทางการเงินได้อย่างไร

Anonim

Q:

ความสามารถในการเรียนรู้ของเครื่องใหม่จะช่วยให้สามารถขุดเอกสารสต็อกสำหรับข้อมูลทางการเงินได้อย่างไร

A:

หนึ่งในขอบเขตใหม่ที่น่าตื่นเต้นของการเรียนรู้ของเครื่องจักรและ AI คือนักวิทยาศาสตร์และวิศวกรกำลังเริ่มใช้วิธีการต่างๆในการใช้ทรัพยากรรูปแบบใหม่อย่างสมบูรณ์เพื่อทำนายการเคลื่อนไหวของสต็อกและผลการลงทุน นี่คือตัวเปลี่ยนเกมที่ยิ่งใหญ่ในโลกการเงินและจะปฏิวัติกลยุทธ์การลงทุนอย่างลึกซึ้ง

หนึ่งในแนวคิดพื้นฐานสำหรับการขยายประเภทของการวิจัยสต็อกนี้คือภาษาศาสตร์เชิงคำนวณซึ่งเกี่ยวข้องกับการสร้างแบบจำลองของภาษาธรรมชาติ ผู้เชี่ยวชาญกำลังตรวจสอบวิธีการใช้เอกสารข้อความตั้งแต่เอกสารที่ยื่นต่อ SEC ไปจนถึงจดหมายของผู้ถือหุ้นไปจนถึงทรัพยากรที่ใช้ข้อความส่วนอื่น ๆ เพื่อเพิ่มหรือปรับการวิเคราะห์หุ้นหรือเพื่อพัฒนาการวิเคราะห์ใหม่ทั้งหมด

ดาวน์โหลดฟรี: การเรียนรู้ของเครื่องและเหตุผลที่สำคัญ

ข้อจำกัดความรับผิดชอบที่สำคัญคือทั้งหมดนี้สามารถทำได้ผ่านความก้าวหน้าใหม่ล่าสุดในเครือข่ายประสาทการเรียนรู้ของเครื่องและการวิเคราะห์ภาษาธรรมชาติ ก่อนการถือกำเนิดของ ML / AI เทคโนโลยีคอมพิวเตอร์ส่วนใหญ่ใช้การเขียนโปรแกรมเชิงเส้นเพื่ออินพุต "อ่าน" เอกสารข้อความไม่มีโครงสร้างสูงเกินไปที่จะเป็นประโยชน์ แต่ด้วยความก้าวหน้าที่เกิดขึ้นในการวิเคราะห์ภาษาธรรมชาติภายในไม่กี่ปีที่ผ่านมานักวิทยาศาสตร์พบว่ามันเป็นไปได้ที่จะ "ขุด" ภาษาธรรมชาติสำหรับผลลัพธ์เชิงปริมาณหรือกล่าวอีกนัยหนึ่งผลลัพธ์ที่สามารถคำนวณได้ในทางใดทางหนึ่ง

หลักฐานที่ดีที่สุดและตัวอย่างที่มีประโยชน์ที่สุดบางอย่างมาจากวิทยานิพนธ์และงานปริญญาเอกที่มีอยู่บนเว็บ ในบทความ "การประยุกต์ใช้การเรียนรู้ของเครื่องและภาษาศาสตร์เชิงคำนวณทางเศรษฐศาสตร์การเงิน" ตีพิมพ์ในเดือนเมษายน 2559 Lili Gao อธิบายกระบวนการที่เกี่ยวข้องโดยเฉพาะกับการขุดเอกสารของ บริษัท SEC การโทรของผู้ถือหุ้นและข้อความโซเชียลมีเดีย

"การแยกสัญญาณที่มีความหมายออกจากข้อมูลข้อความที่ไม่มีโครงสร้างและมิติข้อมูลสูงไม่ใช่เรื่องง่าย" Gao เขียน "อย่างไรก็ตามด้วยการพัฒนาของการเรียนรู้ด้วยเครื่องและเทคนิคทางภาษาคอมพิวเตอร์การประมวลผลและการวิเคราะห์งานเอกสารเชิงข้อความสามารถทำได้และการประยุกต์ใช้การวิเคราะห์ข้อความเชิงสถิติในสาขาสังคมศาสตร์ได้พิสูจน์แล้วว่าประสบความสำเร็จ" จากการอภิปรายของ Gao เกี่ยวกับการสร้างแบบจำลองและการสอบเทียบในบทคัดย่อเอกสารที่ได้รับการพัฒนาทั้งหมดแสดงให้เห็นว่าการวิเคราะห์ประเภทนี้มีรายละเอียดอย่างไร

แหล่งข้อมูลอื่น ๆ สำหรับโครงการที่ใช้งานอยู่นั้นรวมถึงหน้าต่างๆอย่างย่อของโครงการ GitHub นี้และทรัพยากร IEEE นี้พูดถึงการรับข้อมูลทางการเงินที่มีค่าจาก "การวิเคราะห์ความเชื่อมั่นของ Twitter" โดยเฉพาะ

บรรทัดล่างคือการใช้โมเดล NLP ใหม่เหล่านี้กำลังผลักดันให้เกิดนวัตกรรมอย่างรวดเร็วในการใช้เอกสารข้อความทุกประเภทไม่เพียง แต่สำหรับการวิเคราะห์ทางการเงิน แต่สำหรับการค้นพบที่ล้ำสมัยประเภทอื่น "ข้อมูล."

ความสามารถในการเรียนรู้ของเครื่องใหม่จะช่วยให้สามารถขุดเอกสารสต็อกสำหรับข้อมูลทางการเงินได้อย่างไร