สารบัญ:
คำจำกัดความ - Apache Lucene แปลว่าอะไร?
Apache Lucene เป็นโครงการโอเพ่นซอร์สสำหรับห้องสมุดเครื่องมือค้นหาข้อความที่มีประสิทธิภาพสูงและเต็มรูปแบบซึ่งเขียนขึ้นโดยใช้ Java
มีความสามารถในการค้นหาข้อความแบบเต็มภายในเอกสารดังนั้นจึงเป็นเทคโนโลยีที่เหมาะสำหรับแอพพลิเคชั่นที่ต้องการคุณสมบัตินี้โดยเฉพาะอย่างยิ่งหากเป็นแพลตฟอร์มข้ามแพลตฟอร์ม
มันได้รับการพัฒนาครั้งแรกโดย Doug Cutting ในปี 1999 และกลายเป็นส่วนหนึ่งของตระกูล Java ของ Apache Foundation จาการ์ตามูลนิธิโอเพ่นซอร์สในเดือนกันยายน 2001 มันได้รับการอัพเกรดเป็นโครงการ Apache ระดับสูงสุดในเดือนกุมภาพันธ์ 2005
Techopedia อธิบาย Apache Lucene
Apache Lucene เป็นเสิร์ชเอ็นจิ้นประสิทธิภาพสูงที่มีคอนเซปต์ของ "เอกสารที่ประกอบด้วยฟิลด์ของข้อความ" ที่สถาปัตยกรรมตรรกะหลัก สิ่งนี้ให้ความยืดหยุ่นที่ดีเยี่ยมและช่วยให้ Lucene API เป็นอิสระจากรูปแบบไฟล์ใด ๆ
ข้อความจากรูปแบบใด ๆ เช่น MS Word, HTML, XML, PDF และ OpenDocument สามารถทำดัชนีได้ตราบใดที่สามารถแยกข้อมูลที่เป็นข้อความซึ่งหมายความว่ามันไม่สามารถทำอะไรกับรูปภาพได้
Lucene เหมาะสำหรับแอปพลิเคชันใด ๆ ที่ต้องการการจัดทำดัชนีข้อความแบบเต็มและความสามารถในการค้นหา แต่เป็นที่รู้จักอย่างกว้างขวางว่าเป็นยูทิลิตี้ที่ยอดเยี่ยมสำหรับการใช้งานเสิร์ชเอ็นจิ้นอินเทอร์เน็ต
คุณสมบัติรวมถึง:
- การจัดทำดัชนีที่ปรับขนาดได้และประสิทธิภาพสูง - สามารถประมวลผลได้มากกว่า 150 Gb ต่อชั่วโมงสำหรับฮาร์ดแวร์ที่ทันสมัยและต้องการเพียง 1 Mb ต่อความต้องการหน่วยความจำจำนวนมาก
- อัลกอริทึมการค้นหาที่มีประสิทธิภาพแม่นยำและมีประสิทธิภาพ - มันมีข้อความค้นหาที่ทรงพลังหลายประเภทเช่นวลี, สัญลักษณ์แทน, ความใกล้เคียงและข้อความค้นหาช่วง นอกจากนี้ยังมีการค้นหาและจัดเรียงตามเขตข้อมูลใด ๆ
- Cross platform - การใช้งานจาวาบริสุทธิ์และยังมีในภาษาการเขียนโปรแกรมอื่น ๆ