บ้าน ในข่าว 10 ข้อมูลขนาดใหญ่ทำและไม่ควรทำ

10 ข้อมูลขนาดใหญ่ทำและไม่ควรทำ

สารบัญ:

Anonim

ข้อมูลขนาดใหญ่มีสัญญามากมายสำหรับอุตสาหกรรมทุกประเภท หากข้อมูลขนาดใหญ่นี้ได้รับการใช้ประโยชน์อย่างมีประสิทธิภาพและมีประสิทธิภาพข้อมูลนั้นอาจมีผลกระทบอย่างมีนัยสำคัญในการตัดสินใจและการวิเคราะห์ แต่ประโยชน์ของข้อมูลขนาดใหญ่สามารถทำได้หากจัดการในลักษณะที่มีโครงสร้าง แนวปฏิบัติที่ดีที่สุดของข้อมูลขนาดใหญ่นั้นได้ถูกกำหนดขึ้นเรื่อย ๆ แต่ก็มีบางสิ่งที่ควรทำและไม่ควรทำเมื่อมีการนำไปใช้


คำแนะนำต่อไปนี้ขึ้นอยู่กับประสบการณ์จริงและความรู้ที่รวบรวมจากโครงการในชีวิตจริง นี่คือข้อมูลขนาดใหญ่อันดับต้น ๆ ที่ควรทำและไม่ควรทำ

เกี่ยวข้องกับส่วนธุรกิจทั้งหมดในโครงการข้อมูลขนาดใหญ่

ความคิดริเริ่มด้านข้อมูลขนาดใหญ่ไม่ใช่กิจกรรมที่แยกได้และเป็นอิสระและการมีส่วนร่วมของทุกหน่วยธุรกิจจะต้องได้รับคุณค่าและความเข้าใจที่แท้จริง ข้อมูลขนาดใหญ่สามารถช่วยให้องค์กรใช้ประโยชน์จากข้อมูลจำนวนมากและได้รับข้อมูลเชิงลึกเกี่ยวกับพฤติกรรมของลูกค้าเหตุการณ์แนวโน้มการคาดการณ์และอื่น ๆ ซึ่งเป็นไปไม่ได้ด้วยสแนปชอตของข้อมูลซึ่งรวบรวมเฉพาะส่วนหนึ่งของ ดังนั้น บริษัท ต่าง ๆ จึงให้ความสำคัญกับข้อมูลทุกประเภทที่มาจากหน่วยงาน / หน่วยธุรกิจที่เป็นไปได้มากขึ้นเพื่อทำความเข้าใจกับรูปแบบที่ถูกต้อง

ประเมินโมเดลโครงสร้างพื้นฐานทั้งหมดสำหรับการใช้งานข้อมูลขนาดใหญ่

ปริมาณข้อมูลและการจัดการนั้นเป็นข้อกังวลหลักสำหรับการริเริ่มข้อมูลขนาดใหญ่ เนื่องจากข้อมูลขนาดใหญ่เกี่ยวข้องกับเพตาไบต์ของข้อมูลทางออกเดียวในการจัดการคือใช้ศูนย์ข้อมูล ในขณะเดียวกันส่วนประกอบต้นทุนจะต้องได้รับการพิจารณาก่อนที่จะเลือกและทำให้สถานที่จัดเก็บเสร็จสมบูรณ์ บริการคลาวด์มักจะเป็นทางเลือกที่ดีที่สุด แต่บริการของสภาพแวดล้อมคลาวด์ที่แตกต่างกันจะต้องได้รับการประเมินเพื่อพิจารณาบริการที่เหมาะสม เนื่องจากการจัดเก็บข้อมูลเป็นหนึ่งในองค์ประกอบที่สำคัญที่สุดในการใช้งานข้อมูลขนาดใหญ่ใด ๆ จึงเป็นปัจจัยที่ควรได้รับการประเมินอย่างรอบคอบในการริเริ่มข้อมูลขนาดใหญ่ (รับมุมมองอื่นในการท้าทายข้อมูลขนาดใหญ่ในปัจจุบันเกิดจากความหลากหลายไม่ใช่ปริมาณหรือความเร็ว)

พิจารณาแหล่งข้อมูลดั้งเดิมในการวางแผนข้อมูลขนาดใหญ่

มีแหล่งข้อมูลขนาดใหญ่หลายแห่งและจำนวนแหล่งข้อมูลก็เพิ่มขึ้นทุกวัน ข้อมูลจำนวนมากนี้ถูกใช้เป็นอินพุตในการประมวลผลข้อมูลขนาดใหญ่ เป็นผลให้บาง บริษัท คิดว่าแหล่งข้อมูลดั้งเดิมไม่มีประโยชน์ นี่ไม่ใช่ความจริงเนื่องจากข้อมูลดั้งเดิมนี้เป็นองค์ประกอบที่สำคัญสำหรับความสำเร็จของเรื่องราวข้อมูลขนาดใหญ่ ข้อมูลดั้งเดิมมีข้อมูลที่มีค่าดังนั้นควรใช้ร่วมกับแหล่งข้อมูลขนาดใหญ่อื่น ๆ มูลค่าที่แท้จริงของข้อมูลขนาดใหญ่สามารถรับได้หากแหล่งข้อมูลทั้งหมด (ดั้งเดิมและไม่ใช่ข้อมูลดั้งเดิม) ถูกนำมาพิจารณา (เรียนรู้เพิ่มเติมเกี่ยวกับ Take That, Big Data! ทำไม Data ขนาดเล็กอาจบรรจุ Punch ที่ใหญ่กว่าได้)

พิจารณาชุดข้อมูลที่สอดคล้องกัน

ในสภาพแวดล้อมข้อมูลขนาดใหญ่ข้อมูลมาจากแหล่งต่าง ๆ รูปแบบโครงสร้างและประเภทของข้อมูลแตกต่างจากแหล่งหนึ่งไปอีกแหล่งหนึ่ง ส่วนที่สำคัญที่สุดคือข้อมูลจะไม่ถูกล้างออกเมื่อมาถึงสภาพแวดล้อมข้อมูลขนาดใหญ่ของคุณ ดังนั้นก่อนที่คุณจะเชื่อถือข้อมูลที่เข้ามาคุณต้องตรวจสอบความสอดคล้องโดยการสังเกตและวิเคราะห์ซ้ำ ๆ เมื่อยืนยันความสอดคล้องของข้อมูลแล้วสามารถถือว่าเป็นชุดข้อมูลเมตาที่สอดคล้องกัน การค้นหาชุดข้อมูลเมตาที่สอดคล้องกันโดยการสังเกตอย่างระมัดระวังของรูปแบบคือการออกกำลังกายที่สำคัญในการวางแผนข้อมูลขนาดใหญ่

ทำการแจกจ่ายข้อมูล

ปริมาณข้อมูลเป็นข้อกังวลหลักเมื่อเราพิจารณาสภาพแวดล้อมการประมวลผล เนื่องจากปริมาณข้อมูลจำนวนมากที่ข้อมูลขนาดใหญ่เกี่ยวข้องจึงไม่สามารถทำการประมวลผลบนเซิร์ฟเวอร์เดียวได้ การแก้ปัญหาคือสภาพแวดล้อม Hadoop ซึ่งเป็นสภาพแวดล้อมการคำนวณแบบกระจายที่ทำงานบนฮาร์ดแวร์สินค้าโภคภัณฑ์ มันให้พลังของการประมวลผลที่เร็วขึ้นในหลาย ๆ โหนด (เรียนรู้เพิ่มเติมใน 7 สิ่งที่ควรรู้เกี่ยวกับ Hadoop)

อย่าพึ่งพาวิธีการวิเคราะห์ข้อมูลขนาดใหญ่เพียงครั้งเดียว

มีเทคโนโลยีหลากหลายในตลาดสำหรับการประมวลผลข้อมูลขนาดใหญ่ รากฐานของเทคโนโลยีข้อมูลขนาดใหญ่ทั้งหมดคือ Apache Hadoop และ MapReduce ดังนั้นจึงเป็นสิ่งสำคัญในการประเมินเทคโนโลยีที่ถูกต้องเพื่อวัตถุประสงค์ที่ถูกต้อง แนวทางการวิเคราะห์ที่สำคัญบางอย่าง ได้แก่ การวิเคราะห์เชิงพยากรณ์การวิเคราะห์เชิงกำหนดการวิเคราะห์ข้อความการวิเคราะห์ข้อมูลสตรีม ฯลฯ การเลือกวิธีการ / แนวทางที่เหมาะสมนั้นเป็นสิ่งสำคัญเพื่อให้บรรลุเป้าหมายที่ต้องการ เป็นการดีที่สุดที่จะหลีกเลี่ยงการพึ่งพาวิธีการเดียว แต่เพื่อตรวจสอบวิธีการต่าง ๆ และเลือกคู่ที่สมบูรณ์แบบสำหรับโซลูชันของคุณ

อย่าเริ่มต้นโครงการข้อมูลขนาดใหญ่ขนาดใหญ่ก่อนที่คุณจะพร้อม

ขอแนะนำเสมอให้เริ่มต้นด้วยขั้นตอนเล็ก ๆ สำหรับการริเริ่มข้อมูลขนาดใหญ่ ดังนั้นเริ่มต้นด้วยโครงการนำร่องเพื่อเพิ่มความเชี่ยวชาญแล้วไปสู่การปฏิบัติจริง ศักยภาพของข้อมูลขนาดใหญ่นั้นน่าประทับใจมาก แต่คุณค่าที่แท้จริงจะเกิดขึ้นได้ก็ต่อเมื่อเราลดความผิดพลาดและได้รับความเชี่ยวชาญมากขึ้น

อย่าใช้ข้อมูลแยก

แหล่งข้อมูลขนาดใหญ่กระจัดกระจายรอบตัวเราและเพิ่มขึ้นทุกวัน มันเป็นสิ่งสำคัญที่จะรวมข้อมูลทั้งหมดเหล่านี้เพื่อรับเอาท์พุทการวิเคราะห์ที่ถูกต้อง มีเครื่องมือต่าง ๆ ในตลาดสำหรับการรวมข้อมูล แต่ควรประเมินอย่างเหมาะสมก่อนการใช้งาน การรวมข้อมูลขนาดใหญ่เป็นงานที่ซับซ้อนเนื่องจากข้อมูลจากแหล่งต่าง ๆ มีรูปแบบที่แตกต่างกัน แต่จำเป็นอย่างยิ่งที่จะต้องได้รับผลการวิเคราะห์ที่ดี

อย่าเพิกเฉยต่อความปลอดภัยของข้อมูล

ความปลอดภัยของข้อมูลเป็นข้อพิจารณาที่สำคัญในการวางแผนข้อมูลขนาดใหญ่ ในขั้นต้น (ก่อนทำการประมวลผลใด ๆ ) ข้อมูลจะอยู่ในรูปแบบเพตาไบต์ดังนั้นการรักษาความปลอดภัยจึงไม่ได้นำไปใช้อย่างเคร่งครัด แต่หลังจากการประมวลผลบางอย่างคุณจะได้รับชุดย่อยของข้อมูลที่ให้ข้อมูลเชิงลึกบางอย่าง ณ จุดนี้ความปลอดภัยของข้อมูลกลายเป็นสิ่งจำเป็น ยิ่งมีการประมวลผลและปรับข้อมูลให้ละเอียดมากเท่าใดก็ยิ่งมีค่ามากขึ้นสำหรับองค์กร ข้อมูลผลลัพธ์ที่ได้รับการปรับช่องรับสัญญาณนี้เป็นทรัพย์สินทางปัญญาและต้องปลอดภัย การรักษาความปลอดภัยข้อมูลจะต้องดำเนินการเป็นส่วนหนึ่งของวงจรชีวิตข้อมูลขนาดใหญ่

อย่าเพิกเฉยส่วนประสิทธิภาพของการวิเคราะห์ข้อมูลขนาดใหญ่

ผลลัพธ์ของการวิเคราะห์ข้อมูลขนาดใหญ่มีประโยชน์เฉพาะเมื่อให้ประสิทธิภาพที่ดีเท่านั้น ข้อมูลขนาดใหญ่ให้ข้อมูลเชิงลึกมากขึ้นตามการประมวลผลข้อมูลจำนวนมากด้วยความเร็วที่เร็วขึ้น ดังนั้นจึงเป็นสิ่งสำคัญในการจัดการอย่างมีประสิทธิภาพและประสิทธิผล หากประสิทธิภาพของข้อมูลขนาดใหญ่ไม่ได้รับการจัดการอย่างรอบคอบมันจะทำให้เกิดปัญหาและทำให้ความพยายามทั้งหมดไม่มีความหมาย


ในการสนทนาของเราเราได้มุ่งเน้นไปที่สิ่งที่ควรทำและไม่ควรทำกับข้อมูลขนาดใหญ่ ข้อมูลขนาดใหญ่เป็นพื้นที่เกิดใหม่และเมื่อมีการดำเนินการ บริษัท หลายแห่งยังอยู่ในช่วงการวางแผน จำเป็นต้องเข้าใจแนวทางปฏิบัติที่ดีที่สุดของข้อมูลขนาดใหญ่เพื่อลดความเสี่ยงและข้อผิดพลาด จุดอภิปรายได้มาจากประสบการณ์โครงการจริงดังนั้นมันจะให้แนวทางบางอย่างสำหรับการทำให้กลยุทธ์ข้อมูลขนาดใหญ่ประสบความสำเร็จ

10 ข้อมูลขนาดใหญ่ทำและไม่ควรทำ