บ้าน เสียง ฉันจะเรียนรู้การใช้ hadoop เพื่อวิเคราะห์ข้อมูลขนาดใหญ่ได้อย่างไร

ฉันจะเรียนรู้การใช้ hadoop เพื่อวิเคราะห์ข้อมูลขนาดใหญ่ได้อย่างไร

Anonim

Q:

ฉันจะเรียนรู้การใช้ Hadoop เพื่อวิเคราะห์ข้อมูลขนาดใหญ่ได้อย่างไร

A:

ชุดซอฟต์แวร์ Apache ที่เรียกว่า Hadoop กำลังกลายเป็นทรัพยากรที่ได้รับความนิยมอย่างมากในการจัดการกับชุดข้อมูลขนาดใหญ่ เฟรมเวิร์กซอฟต์แวร์การจัดการข้อมูลประเภทนี้สร้างขึ้นเพื่อช่วยในการรวบรวมข้อมูลในรูปแบบเฉพาะตามการออกแบบที่อาจทำให้โครงการข้อมูลบางประเภทมีประสิทธิภาพมากขึ้น ที่กล่าวว่า Hadoop เป็นเพียงเครื่องมือหนึ่งในการจัดการชุดข้อมูลขนาดใหญ่

หนึ่งในวิธีแรกและพื้นฐานที่สุดในการเรียนรู้เกี่ยวกับการวิเคราะห์ข้อมูลขนาดใหญ่ด้วย Hadoop คือการเข้าใจองค์ประกอบระดับสูงของ Hadoop และสิ่งที่ทำ เหล่านี้รวมถึง Hadoop YARN "แพลตฟอร์มการจัดการทรัพยากร" ที่สามารถนำไปใช้กับการตั้งค่าเครือข่ายบางประเภทรวมถึงชุด Hadoop MapReduce ของฟังก์ชั่นที่ใช้กับชุดข้อมูลขนาดใหญ่ นอกจากนี้ยังมีระบบไฟล์แบบกระจาย Hadoop (HDFS) ซึ่งช่วยในการจัดเก็บข้อมูลข้ามระบบแบบกระจายเพื่อให้สามารถจัดทำดัชนีหรือดึงข้อมูลได้อย่างรวดเร็วและมีประสิทธิภาพ

นอกเหนือจากนี้ผู้ที่ต้องการทำความคุ้นเคยกับ Hadoop สามารถดูแหล่งข้อมูลที่เผยแพร่เป็นรายบุคคลสำหรับมืออาชีพที่อธิบายซอฟต์แวร์ในระดับที่สัมพันธ์กันได้ ตัวอย่างจาก Chris Stucchio ที่บล็อกส่วนตัวให้คะแนนที่ยอดเยี่ยมเกี่ยวกับ Hadoop และ data scale หนึ่งในประเด็นพื้นฐานคือ Hadoop อาจใช้งานบ่อยกว่าที่จำเป็นและอาจไม่ใช่ทางออกที่ดีที่สุดสำหรับแต่ละโครงการ การทบทวนแหล่งข้อมูลประเภทนี้จะช่วยให้มืออาชีพคุ้นเคยกับรายละเอียดการใช้ Hadoop มากขึ้นในทุกสถานการณ์ Stucchio ยังให้คำอุปมาอุปมัยสำหรับฟังก์ชั่นที่เกี่ยวข้องกับ Hadoop กับงานทางกายภาพที่เฉพาะเจาะจง นี่คือตัวอย่างการนับจำนวนหนังสือในห้องสมุดในขณะที่ฟังก์ชั่น Hadoop อาจทำลายห้องสมุดนั้นออกเป็นส่วน ๆ โดยจัดให้มีการนับแต่ละรายการที่ผสมกันเป็นผลลัพธ์ข้อมูลรวมหนึ่งรายการ

วิธีการเชิงลึกที่ผู้เชี่ยวชาญสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ Hadoop และการประยุกต์ใช้กับข้อมูลขนาดใหญ่คือการใช้ทรัพยากรและโปรแกรมการฝึกอบรมที่เฉพาะเจาะจง ตัวอย่างเช่น บริษัท การเรียนรู้ออนไลน์ Cloudera ผู้ให้บริการฝึกอบรมระยะไกลที่โดดเด่นมีตัวเลือกที่น่าสนใจมากมายเกี่ยวกับการใช้ Hadoop และการจัดการข้อมูลประเภทเดียวกัน

ฉันจะเรียนรู้การใช้ hadoop เพื่อวิเคราะห์ข้อมูลขนาดใหญ่ได้อย่างไร