สารบัญ:
ผ่านการวิเคราะห์ข้อมูลขนาดใหญ่เท่านั้นที่มูลค่าจริงของข้อมูลขนาดใหญ่จะชัดเจน แต่การวิเคราะห์เหล่านี้ต้องการความรู้ทางสถิติและทางเทคนิคในการใช้งานโซลูชันข้อมูลขนาดใหญ่ ดังนั้นสมมติฐานก็คือคุณต้องเป็นนักวิทยาศาสตร์ด้านข้อมูลเพื่อดึงข้อมูลเชิงลึกที่มีความหมายจากข้อมูลขนาดใหญ่ นี่คือที่มาของ Apache Drill มันให้ความยืดหยุ่นในการวิเคราะห์ข้อมูลขนาดใหญ่บน Hadoop โดยไม่จำเป็นต้องมีความรู้เกี่ยวกับนักวิทยาศาสตร์ด้านข้อมูล
Apache Drill - มันคืออะไร
Apache Drill เป็นซอฟต์แวร์เฟรมเวิร์กที่สามารถปั่นข้อมูลขนาดใหญ่และส่งมอบข้อมูลเชิงลึกที่คุณต้องการซ่อนอยู่ใต้เพตาไบต์ของชุดข้อมูล ในทางเทคนิค Apache Drill เป็นโอเพ่นซอร์สมาตรฐาน ANSI SQL ซึ่งสามารถใช้เป็นเอ็นจินเคียวรีที่มีความหน่วงแฝงต่ำบนกรอบงานการเขียนโปรแกรมที่ได้รับความนิยมของ Java Hadoop
นอกจากนี้ยังสามารถทำงานกับกลุ่มฐานข้อมูล NoSQL เช่น MongoDB, HBase และเซิร์ฟเวอร์คลาวด์ดาต้าเช่น Amazon S3 และ Google Cloud Storage นอกจากนี้ยังเพิ่มระดับของ API มาตรฐานอุตสาหกรรมอื่น ๆ (อินเตอร์เฟสการเขียนโปรแกรมแอปพลิเคชัน) เช่น ODBC / JDBC และ RESTful API