Q:
พื้นฐานสี่ข้อในการเป็นนักวิทยาศาสตร์ข้อมูลที่ดีคืออะไร
A:ดังที่ผู้เชี่ยวชาญหลายคนชี้ให้เห็นว่าการเป็นนักวิทยาศาสตร์ข้อมูลที่ยอดเยี่ยมนั้นต้องการการผสมผสานระหว่างทักษะและประสบการณ์ที่สร้างขึ้นจากการเรียนรู้และการวิเคราะห์ที่ซับซ้อน นักวิทยาศาสตร์ด้านข้อมูลในฐานะผู้ดูแลระบบและผู้ดูแลทรัพย์สินข้อมูลที่มีค่าเป็นที่ต้องการอย่างมากในทุกวันนี้ ลองดูว่าทักษะพื้นฐานบางอย่างเกี่ยวข้องกันอย่างไร
องค์ประกอบพื้นฐานสี่ข้อแรกของงานนักวิทยาศาสตร์ด้านข้อมูลคือคณิตศาสตร์และสถิติ นักวิทยาศาสตร์ข้อมูลที่ดีควรเรียนรู้ที่จะพูดคุยเกี่ยวกับแนวคิดทางคณิตศาสตร์ต่าง ๆ ที่เกี่ยวข้องกับการเรียนรู้ของเครื่องที่มีผู้ดูแลและไม่ได้รับการดูแลรวมถึงประเภทอัลกอริทึมเช่นต้นไม้ตัดสินใจป่าสุ่มการถดถอยโลจิสติกส์ โดยทั่วไปพวกเขาควรมีการจัดการที่ดีในการทำงานกับสมการทางคณิตศาสตร์และสถิติโดยใช้ทรัพยากรการวิเคราะห์ทางสถิติ
องค์ประกอบพื้นฐานที่สำคัญอันดับสองของงานวิทยาศาสตร์ข้อมูลเกี่ยวข้องกับการเขียนโปรแกรมและการจัดการฐานข้อมูล บุคคลควรมีความแข็งแกร่งในภาษาสคริปต์เช่น Python และภาษาทางสถิติเช่น R พร้อมด้วยประสบการณ์และทักษะด้วยฐานข้อมูลและซีแมนทิกส์ SQL และเทคนิคการดำเนินงาน ความรู้เกี่ยวกับส่วนประกอบซอฟต์แวร์เช่น Hadoop, MapReduce, Hive และ Pig ก็น่าดึงดูดสำหรับนายจ้างเช่นกัน
องค์ประกอบพื้นฐานที่สามของการเป็นนักวิทยาศาสตร์ข้อมูลที่ดีคือองค์ประกอบทางทฤษฎีและปรัชญาของการทำความเข้าใจวิทยาศาสตร์ข้อมูลและการเรียนรู้ของเครื่อง บุคคลเหล่านี้ควรเป็นนักแก้ปัญหาที่เริ่มต้นด้วยตนเองด้วยความอยากรู้อยากเห็นพวกเขากำลังรวมการวิเคราะห์เชิงปริมาณดิบเข้ากับความเข้าใจอย่างสร้างสรรค์ของกระบวนการเรียนรู้ของเครื่องจักรและกระบวนการข้อมูล แทนที่จะเป็นแค่ตัวเลขทางเทคนิคคนพวกเขาควรมีพื้นฐานที่ลึกซึ้งในความหมายของการสร้างโครงการการเรียนรู้ของเครื่องและทำงานกับความคิดริเริ่มด้านวิทยาศาสตร์ข้อมูลในแง่ของเป้าหมายสุดท้ายและผลลัพธ์สุดท้าย
เสาหลักที่สี่ของการเรียนรู้ที่จะเป็นนักวิทยาศาสตร์ด้านข้อมูลที่ดีนั้นเกี่ยวข้องกับการทำงานกับผู้คนและสามารถใช้ข้อมูลในรูปแบบที่เหมาะสมกับผู้อื่น
นักวิทยาศาสตร์ข้อมูลที่ดีสามารถเป็นนักเล่าเรื่องได้พวกเขาสามารถแปลข้อมูลเชิงปริมาณเป็นเรื่องเล่าและข้อมูลเชิงลึก ดังนั้นพวกเขาควรมีทักษะการสื่อสารที่ดีเพื่อให้สามารถนำงานของพวกเขาไปที่โต๊ะและเผยแพร่ให้ผู้มีส่วนได้ส่วนเสียหลายคนหรือกลุ่มเป้าหมายได้อย่างมีประสิทธิภาพ นี่คือทักษะสำคัญบางประเภทที่สร้างนักวิทยาศาสตร์ข้อมูลที่ดีซึ่งพร้อมที่จะเข้าร่วมในอุตสาหกรรมไอทีที่รวดเร็วและก้าวหน้าในปัจจุบัน




