สารบัญ:
คำจำกัดความ - ชุดภาษาธรรมชาติ (NLTK) หมายถึงอะไร?
ชุดเครื่องมือภาษาธรรมชาติ (NLTK) เป็นแพลตฟอร์มที่ใช้สำหรับการสร้างโปรแกรม Python ที่ทำงานกับข้อมูลภาษามนุษย์เพื่อใช้ในการประมวลผลภาษาธรรมชาติทางสถิติ (NLP)
มันมีห้องสมุดการประมวลผลข้อความสำหรับ tokenization, การแยก, การจำแนก, การเกิด, การติดแท็กและการให้เหตุผลเชิงความหมาย นอกจากนี้ยังรวมถึงการสาธิตแบบกราฟิกและชุดข้อมูลตัวอย่างพร้อมกับหนังสือทำอาหารและหนังสือที่อธิบายหลักการที่อยู่เบื้องหลังภารกิจการประมวลผลภาษาพื้นฐานที่ NLTK ให้การสนับสนุน
Techopedia อธิบายชุดภาษาธรรมชาติ (NLTK)
ชุดเครื่องมือภาษาธรรมชาติเป็นห้องสมุดโอเพ่นซอร์สสำหรับภาษาการเขียนโปรแกรมภาษาไพ ธ อนที่เขียนโดยสตีเวนเบิร์ด, เอ็ดเวิร์ดโลเพอร์และอีวานไคลน์เพื่อใช้ในการพัฒนาและการศึกษามันมาพร้อมกับคู่มือเชิงปฏิบัติที่แนะนำหัวข้อในภาษาศาสตร์เชิงคำนวณรวมถึงการเขียนโปรแกรมพื้นฐานสำหรับ Python ซึ่งเหมาะสำหรับนักภาษาศาสตร์ที่ไม่มีความรู้เชิงลึกเกี่ยวกับการเขียนโปรแกรมวิศวกรและนักวิจัยที่ต้องการเจาะลึกภาษาศาสตร์เชิงคำนวณนักเรียนและนักการศึกษา
NLTK ประกอบด้วยแหล่งข้อมูลมากกว่า 50 corpora และศัพท์เช่น Penn Treebank Corpus, Open Multnet Wordnet, Corpus รายงานปัญหาและอรรถาภิธานของ Lin
