บ้าน ฐานข้อมูล Apache lucene คืออะไร - คำจำกัดความจาก techopedia

Apache lucene คืออะไร - คำจำกัดความจาก techopedia

สารบัญ:

Anonim

คำจำกัดความ - Apache Lucene แปลว่าอะไร?

Apache Lucene เป็นโครงการโอเพ่นซอร์สสำหรับห้องสมุดเครื่องมือค้นหาข้อความที่มีประสิทธิภาพสูงและเต็มรูปแบบซึ่งเขียนขึ้นโดยใช้ Java

มีความสามารถในการค้นหาข้อความแบบเต็มภายในเอกสารดังนั้นจึงเป็นเทคโนโลยีที่เหมาะสำหรับแอพพลิเคชั่นที่ต้องการคุณสมบัตินี้โดยเฉพาะอย่างยิ่งหากเป็นแพลตฟอร์มข้ามแพลตฟอร์ม

มันได้รับการพัฒนาครั้งแรกโดย Doug Cutting ในปี 1999 และกลายเป็นส่วนหนึ่งของตระกูล Java ของ Apache Foundation จาการ์ตามูลนิธิโอเพ่นซอร์สในเดือนกันยายน 2001 มันได้รับการอัพเกรดเป็นโครงการ Apache ระดับสูงสุดในเดือนกุมภาพันธ์ 2005

Techopedia อธิบาย Apache Lucene

Apache Lucene เป็นเสิร์ชเอ็นจิ้นประสิทธิภาพสูงที่มีคอนเซปต์ของ "เอกสารที่ประกอบด้วยฟิลด์ของข้อความ" ที่สถาปัตยกรรมตรรกะหลัก สิ่งนี้ให้ความยืดหยุ่นที่ดีเยี่ยมและช่วยให้ Lucene API เป็นอิสระจากรูปแบบไฟล์ใด ๆ


ข้อความจากรูปแบบใด ๆ เช่น MS Word, HTML, XML, PDF และ OpenDocument สามารถทำดัชนีได้ตราบใดที่สามารถแยกข้อมูลที่เป็นข้อความซึ่งหมายความว่ามันไม่สามารถทำอะไรกับรูปภาพได้


Lucene เหมาะสำหรับแอปพลิเคชันใด ๆ ที่ต้องการการจัดทำดัชนีข้อความแบบเต็มและความสามารถในการค้นหา แต่เป็นที่รู้จักอย่างกว้างขวางว่าเป็นยูทิลิตี้ที่ยอดเยี่ยมสำหรับการใช้งานเสิร์ชเอ็นจิ้นอินเทอร์เน็ต


คุณสมบัติรวมถึง:

  • การจัดทำดัชนีที่ปรับขนาดได้และประสิทธิภาพสูง - สามารถประมวลผลได้มากกว่า 150 Gb ต่อชั่วโมงสำหรับฮาร์ดแวร์ที่ทันสมัยและต้องการเพียง 1 Mb ต่อความต้องการหน่วยความจำจำนวนมาก
  • อัลกอริทึมการค้นหาที่มีประสิทธิภาพแม่นยำและมีประสิทธิภาพ - มันมีข้อความค้นหาที่ทรงพลังหลายประเภทเช่นวลี, สัญลักษณ์แทน, ความใกล้เคียงและข้อความค้นหาช่วง นอกจากนี้ยังมีการค้นหาและจัดเรียงตามเขตข้อมูลใด ๆ
  • Cross platform - การใช้งานจาวาบริสุทธิ์และยังมีในภาษาการเขียนโปรแกรมอื่น ๆ
Apache lucene คืออะไร - คำจำกัดความจาก techopedia