สารบัญ:
จีโนมคลินิกเป็นเรื่องที่น่าสนใจซึ่งผู้คนกำลังทำงานกับเทคโนโลยีที่ทันสมัยเพื่อประมวลผลผลลัพธ์ที่รวดเร็วและแม่นยำ มีซีเควนของจีโนมจำนวนมากที่มีอยู่ในท้องตลาดและพวกมันกำลังผลิตเพตาไบต์ของข้อมูลลำดับ ที่นี่ Hadoop เป็นแพลตฟอร์มที่สมบูรณ์แบบสำหรับกระบวนการทำงานของฟังก์ชั่นจีโนมที่ซับซ้อน Hadoop สามารถจัดเก็บและเรียงลำดับข้อมูลจำนวนมหาศาลและสามารถทำการวิเคราะห์ที่มีความหมาย (หากต้องการทราบว่าข้อมูลนี้มีความหมายมากเพียงใดโปรดอ่านการทำความเข้าใจบิตไบต์และหลายรายการ)
ปัจจุบันและอนาคตของจีโนม
วันนี้การทำแผนที่จีโนมได้ถึงจุดสูงสุดของการพัฒนา ผู้คนจำนวนมากที่เกี่ยวข้องกับอุตสาหกรรมจีโนมิกส์นั้นเต็มไปด้วยความอยากรู้อยากเห็นและเมื่อมีโอกาสใหม่ ๆ นำเสนอตัวเองเทคโนโลยีที่ดีกว่าคือความต้องการของชั่วโมง การหาลำดับจีโนมเป็นงานที่ทำซ้ำ ๆ และใช้ทรัพยากรมาก ในปี 2013 เพียงอย่างเดียวมีการผลิตข้อมูลประมาณ 15 เพตาไบต์และมีเพียง 2, 000 ซีเควนเท่านั้น จำนวนขากรรไกรล่างนี้รวมถึงข้อมูลลำดับจีโนมของมนุษย์ที่มีการเรียงลำดับ 300 KB ในอัตราการผลิตข้อมูลนี้สามารถประมาณได้ว่าภายในปี 2561 จะมีการผลิตข้อมูลประมาณหนึ่งไบต์ นี้จะเกิดจากการเติบโตของ sequencers ซึ่งจะสร้างข้อมูลมากขึ้นต่อการทำงาน อีกเหตุผลหนึ่งก็คือการมีเครื่องหาลำดับจีโนมที่ทรงพลังและราคาไม่แพง ตั้งแต่ปี 2008 ราคาของเครื่องจักรเหล่านี้ได้ลดลงอย่างต่อเนื่อง นี่เป็นเพราะเครื่องจักรรุ่นต่อไปที่ทรงพลังที่เข้าสู่ตลาด
ความต้องการของอุตสาหกรรมการทำแผนที่จีโนม
อัลกอริทึมที่ซับซ้อนใช้สำหรับการประมวลผลข้อมูลที่รวบรวมจากจีโนมมนุษย์ จากนั้นข้อมูลนี้จะต้องถูกจัดเก็บ มันอาจถูกตรวจสอบในอนาคตเพื่อเปรียบเทียบกับข้อมูลต้นฉบับ งานการประมวลผลและการจัดเก็บข้อมูล 100 GB นั้นไม่ยากเกินไปโดยเฉพาะเมื่อคุณกำลังทำกับเครื่องที่ทรงพลังที่ใช้ในศูนย์ลำดับ การศึกษาแสดงให้เห็นว่าข้อมูลจำนวนนี้สามารถประมวลผลได้ในเวลาเพียงประมาณ 1, 000 ชั่วโมงของ CPU ดังนั้นมันจึงง่ายมาก ในอัตราความก้าวหน้าทางเทคนิคนี้เห็นได้ชัดว่าอุตสาหกรรมจีโนมจะประมวลผลเร็ว ๆ นี้หลายพันกิกะไบต์ในเวลาเพียงไม่กี่วินาที
