บ้าน ฐานข้อมูล การสร้างสถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจ

การสร้างสถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจ

Anonim

โดยเจ้าหน้าที่ Techopedia 28 กันยายน 2559

Takeaway: Host Rebecca Jozwiak กล่าวถึงโซลูชั่นสถาปัตยกรรมข้อมูลกับ Eric Little of OSTHUS, Malcolm Chisholm จาก First San Francisco Partners และ Ron Huizenga จาก IDERA

คุณยังไม่ได้เข้าสู่ระบบโปรดเข้าสู่ระบบหรือลงทะเบียนเพื่อดูวิดีโอ

Rebecca Jozwiak: ท่านสุภาพบุรุษและสุภาพสตรีสวัสดีและยินดีต้อนรับสู่ Hot Technologies ประจำปี 2559 วันนี้เรากำลังพูดถึง“ การสร้างสถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจ” เป็นหัวข้อที่น่าสนใจอย่างแน่นอน ชื่อของฉันคือรีเบคก้า Jozwiak ฉันจะเป็นโฮสต์ของคุณสำหรับการออกอากาศทางเว็บในวันนี้ เราทวีตพร้อมแฮชแท็กของ # HotTech16 ดังนั้นหากคุณอยู่ใน Twitter อยู่แล้วโปรดเข้าร่วมได้เช่นกัน หากคุณมีข้อสงสัยในเวลาใด ๆ โปรดส่งคำถามเหล่านั้นไปที่บานหน้าต่างถาม - ตอบที่ด้านล่างขวาของหน้าจอและเราจะทำให้แน่ใจว่าพวกเขาจะได้รับคำตอบ ถ้าไม่เราจะตรวจสอบให้แน่ใจว่าแขกของเราได้รับพวกเขาสำหรับคุณ

ดังนั้นวันนี้เรามีผู้เล่นตัวจริงที่น่าสนใจจริงๆ วันนี้เรามีผู้ตีจำนวนมากมากมาย เรามี Eric Little, รองประธานด้านวิทยาศาสตร์ข้อมูลจาก OSTHUS เรามี Malcolm Chisholm ประธานเจ้าหน้าที่ฝ่ายนวัตกรรมซึ่งเป็นชื่อที่ยอดเยี่ยมมากสำหรับ First San Francisco Partners และเรามี Ron Huizenga ผู้จัดการผลิตภัณฑ์อาวุโสจาก IDERA และคุณรู้ไหมว่า IDERA เป็นโซลูชั่นการจัดการข้อมูลและการสร้างแบบจำลองที่สมบูรณ์แบบจริงๆ และวันนี้เขาจะให้ตัวอย่างแก่เราเกี่ยวกับวิธีการทำงานของเขา แต่ก่อนที่เราจะไปถึงจุดนั้น Eric Little ฉันจะส่งบอลให้คุณ

Eric Little: โอเคขอบคุณมาก ดังนั้นฉันจะผ่านหัวข้อสองสามที่นี่ที่ฉันคิดว่าจะเกี่ยวข้องกับการพูดคุยของรอนเล็กน้อยและหวังว่าจะตั้งเวทีสำหรับบางหัวข้อเหล่านี้เช่นกันถาม - ตอบบางอย่าง

ดังนั้นสิ่งที่ฉันสนใจในสิ่งที่ IDERA ทำคือฉันคิดว่าพวกเขาชี้ให้เห็นอย่างถูกต้องว่าสภาพแวดล้อมที่ซับซ้อนกำลังผลักดันคุณค่าทางธุรกิจจำนวนมากในทุกวันนี้ และโดยสภาพแวดล้อมที่ซับซ้อนเราหมายถึงสภาพแวดล้อมข้อมูลที่ซับซ้อน และเทคโนโลยีกำลังเคลื่อนไหวอย่างรวดเร็วและยากที่จะติดตามในสภาพแวดล้อมทางธุรกิจในปัจจุบัน ดังนั้นคนที่ทำงานในพื้นที่เทคโนโลยีมักจะเห็นว่าคุณมีลูกค้าที่กำลังแก้ไขปัญหาด้วย“ ฉันจะใช้ข้อมูลขนาดใหญ่ได้อย่างไร ฉันจะรวมความหมายได้อย่างไร ฉันจะเชื่อมโยงข้อมูลใหม่นี้เข้ากับข้อมูลเก่าของฉันได้อย่างไร” และต่อ ๆ ไปและสิ่งเหล่านี้นำเราไปสู่ข้อมูลขนาดใหญ่ทั้งสี่นี้ที่ผู้คนคุ้นเคยกันดีและฉันเข้าใจว่าอาจมีมากกว่าสี่ บางครั้ง - ฉันเคยเห็นมากถึงแปดหรือเก้า - แต่โดยปกติแล้วเมื่อผู้คนพูดถึงสิ่งต่าง ๆ เช่นข้อมูลขนาดใหญ่หรือถ้าคุณกำลังพูดถึงข้อมูลขนาดใหญ่คุณมักจะมองสิ่งที่เป็นระดับองค์กร และผู้คนก็จะบอกว่าโอเคลองคิดดูปริมาณข้อมูลของคุณซึ่งปกติแล้วจะเป็นจุดสนใจนั่นคือคุณมีอยู่แค่ไหน ความเร็วของข้อมูลเกี่ยวข้องกับความเร็วที่ฉันสามารถเคลื่อนที่ไปรอบ ๆ หรือว่าเร็วแค่ไหนที่ฉันสามารถสืบค้นหรือรับคำตอบและอื่น ๆ และโดยส่วนตัวแล้วฉันคิดว่าด้านซ้ายของสิ่งนั้นคือสิ่งที่ถูกแก้ไขและจัดการอย่างรวดเร็วโดยวิธีการที่แตกต่างกันมากมาย แต่ทางด้านขวาฉันเห็นความสามารถมากมายสำหรับการปรับปรุงและเทคโนโลยีใหม่มากมายที่กำลังมาถึงเบื้องหน้า และนั่นเกี่ยวข้องกับคอลัมน์ที่สามนั่นคือความหลากหลายของข้อมูล

ดังนั้นในคำอื่น ๆ บริษัท ส่วนใหญ่ในปัจจุบันกำลังดูข้อมูลที่มีโครงสร้างกึ่งโครงสร้างและไม่มีโครงสร้าง ข้อมูลรูปภาพเริ่มเป็นหัวข้อร้อนแรงดังนั้นเพื่อให้สามารถใช้สายตาคอมพิวเตอร์ดูที่พิกเซลสามารถขูดข้อความ NLP การแยกเอนทิตีคุณมีข้อมูลกราฟที่ออกมาจากแบบจำลองทางสถิติหรือออกมาในเชิงความหมาย โมเดลคุณมีข้อมูลเชิงสัมพันธ์ที่มีอยู่ในตารางและอื่น ๆ ดังนั้นการดึงข้อมูลทั้งหมดเข้าด้วยกันและประเภทที่แตกต่างกันทั้งหมดนี้แสดงถึงความท้าทายที่ยิ่งใหญ่และคุณจะเห็นสิ่งนี้ได้ใน Gartner และคนอื่น ๆ ที่ติดตามแนวโน้มในอุตสาหกรรม

แล้วสิ่งสุดท้ายที่ผู้คนพูดถึงในข้อมูลขนาดใหญ่มักจะเป็นความคิดที่ไม่ชัดเจนซึ่งเป็นความไม่แน่นอนของข้อมูลของคุณ, ความคลุมเครือของมัน คุณรู้ได้ดีแค่ไหนว่าข้อมูลของคุณเป็นอย่างไรคุณเข้าใจสิ่งที่อยู่ในนั้นและคุณรู้ได้อย่างไร ความสามารถในการใช้สถิติและความสามารถในการใช้ข้อมูลบางประเภทเกี่ยวกับสิ่งที่คุณอาจรู้หรือใช้บริบทอาจมีค่า ดังนั้นความสามารถในการดูข้อมูลด้วยวิธีนี้ในแง่ของจำนวนเงินที่คุณมีความเร็วในการเคลื่อนย้ายไปรอบ ๆ หรือรับข้อมูลทุกประเภทของข้อมูลที่คุณอาจมีในองค์กรของคุณและคุณมั่นใจว่าคุณอยู่ที่ไหน มันคืออะไรมันคืออะไรคุณภาพมันอยู่ในและอื่น ๆ สิ่งนี้ต้องการความพยายามขนาดใหญ่และมีการประสานงานระหว่างบุคคลจำนวนมากในการจัดการข้อมูลอย่างมีประสิทธิภาพ ดังนั้นการสร้างแบบจำลองข้อมูลจึงมีความสำคัญมากขึ้นในโลกปัจจุบัน โมเดลข้อมูลที่ดีนั้นกำลังขับเคลื่อนความสำเร็จอย่างมากในแอปพลิเคชันระดับองค์กร

คุณมีแหล่งข้อมูลจากแหล่งข้อมูลต่าง ๆ เช่นที่เรากำลังพูดซึ่งต้องการการรวมกลุ่มที่แตกต่างกันมากมาย ดังนั้นการดึงข้อมูลทั้งหมดเข้าด้วยกันจึงเป็นประโยชน์อย่างมากในการเรียกใช้คิวรีตัวอย่างเช่นข้ามแหล่งข้อมูลหลายประเภทและดึงข้อมูลกลับมา แต่เพื่อที่จะทำเช่นนั้นคุณต้องมีกลยุทธ์การทำแผนที่ที่ดีดังนั้นการทำแผนที่ข้อมูลประเภทนั้นและการติดตามการแมปเหล่านั้นอาจเป็นความท้าทายที่แท้จริง แล้วคุณมีปัญหานี้แล้วฉันจะเชื่อมโยงข้อมูลดั้งเดิมของฉันกับแหล่งข้อมูลใหม่เหล่านี้ได้อย่างไร สมมติว่าฉันมีกราฟฉันจะนำข้อมูลเชิงสัมพันธ์ทั้งหมดมาใส่ในกราฟหรือไม่? โดยทั่วไปนั่นไม่ใช่ความคิดที่ดี แล้วผู้คนจะสามารถจัดการตัวแบบข้อมูลเหล่านี้ทั้งหมดที่เกิดขึ้นได้อย่างไร? การวิเคราะห์จะต้องดำเนินการบนแหล่งข้อมูลและชุดค่าผสมต่าง ๆ เหล่านี้จำนวนมาก ดังนั้นคำตอบที่ออกมาจากนี้คำตอบที่ผู้คนจำเป็นต้องตัดสินใจทางธุรกิจที่ดีจริงๆจึงเป็นสิ่งสำคัญ

ดังนั้นนี่ไม่ใช่แค่การสร้างเทคโนโลยีเพื่อประโยชน์ของเทคโนโลยีมันคือสิ่งที่ฉันกำลังจะทำฉันจะทำอะไรได้บ้างฉันจะใช้การวิเคราะห์แบบไหนและความสามารถตามที่ฉันได้ทำไปแล้ว พูดถึงเพื่อดึงสิ่งนี้เข้าด้วยกันเพื่อรวมเข้าด้วยกันมันสำคัญมากจริงๆ และการวิเคราะห์ประเภทหนึ่งเหล่านี้ก็จะทำงานในสิ่งต่างๆเช่นการค้นหาแบบติดต่อกับภายนอกและการสืบค้น นั่นเป็นความต้องการจริงๆ โดยปกติแล้วแบบสอบถามของคุณจะต้องมีการข้ามเธรดในแหล่งข้อมูลหลายประเภทและดึงข้อมูลกลับมาในความน่าเชื่อถือ

องค์ประกอบสำคัญอย่างหนึ่งที่มักจะโดยเฉพาะอย่างยิ่งผู้คนกำลังมองหาสิ่งสำคัญเช่นเทคโนโลยีความหมาย - และนี่คือสิ่งที่ฉันหวังว่ารอนจะพูดถึงวิธีการ IDERA - วิธีที่คุณแยกหรือจัดการ model model ของข้อมูลของคุณจาก data layer นั้นจากข้อมูลดิบ? ลงมาที่ชั้นข้อมูลคุณอาจมีฐานข้อมูลคุณอาจมีข้อมูลเอกสารคุณอาจมีข้อมูลสเปรดชีตคุณอาจมีข้อมูลภาพ หากคุณอยู่ในพื้นที่เช่นอุตสาหกรรมยาคุณจะได้รับข้อมูลทางวิทยาศาสตร์มากมาย จากนั้นคนส่วนใหญ่มักจะมองหาวิธีสร้างแบบจำลองที่ช่วยให้พวกเขาสามารถรวมข้อมูลนั้นได้อย่างรวดเร็วและเมื่อคุณกำลังมองหาข้อมูลตอนนี้คุณไม่ต้องการดึงข้อมูลทั้งหมดลงในเลเยอร์แบบจำลองของคุณ สิ่งที่คุณกำลังดูที่เลเยอร์โมเดลที่ต้องทำคือให้สิ่งที่เป็นตัวแทนของคุณคำศัพท์สามัญประเภททั่วไปของเอนทิตีและความสัมพันธ์และความสามารถในการเข้าถึงข้อมูลที่เป็นจริง ดังนั้นต้องบอกว่ามันคืออะไรและต้องบอกว่ามันอยู่ที่ไหนและต้องบอกว่าจะไปดึงมันกลับมาได้อย่างไร

ดังนั้นนี่จึงเป็นวิธีการที่ประสบความสำเร็จในการขับเคลื่อนเทคโนโลยีความหมายไปข้างหน้าซึ่งเป็นพื้นที่ที่ฉันทำงานเป็นจำนวนมาก ดังนั้นคำถามที่ฉันต้องการโพสต์ให้รอนและฉันคิดว่าจะมีประโยชน์ในส่วนของคำถาม & คำตอบคือการดูว่าแพลตฟอร์ม IDERA นี้ประสบความสำเร็จได้อย่างไร ดังนั้นเลเยอร์โมเดลแยกจากชั้นข้อมูลจริงหรือไม่ พวกเขารวมมากขึ้น? มันทำงานอย่างไรและผลลัพธ์และประโยชน์บางประการที่พวกเขาเห็นจากวิธีการของพวกเขาคืออะไร? ดังนั้นข้อมูลอ้างอิงก็มีความสำคัญเช่นกัน ดังนั้นถ้าคุณจะมีตัวแบบข้อมูลเหล่านี้ถ้าคุณจะสามารถรวมกลุ่มและค้นหาสิ่งต่าง ๆ ได้คุณจะต้องมีข้อมูลอ้างอิงที่ดี แต่ปัญหาคือข้อมูลอ้างอิงนั้นยากที่จะรักษา ดังนั้นการตั้งชื่อมาตรฐานในตัวเองบ่อยครั้งจึงเป็นเรื่องยาก กลุ่มหนึ่งจะเรียกสิ่งที่เป็น X และกลุ่มหนึ่งจะเรียกสิ่งที่ว่า Y และตอนนี้คุณมีปัญหาว่าจะมีคนค้นหา X และ Y ได้อย่างไรเมื่อพวกเขากำลังมองหาข้อมูลประเภทนี้? เนื่องจากคุณไม่ต้องการให้ข้อมูลเพียงบางส่วนกับพวกเขาคุณจึงต้องการให้ทุกสิ่งที่เกี่ยวข้องกับพวกเขา ในขณะเดียวกันการเปลี่ยนแปลงข้อกำหนดซอฟต์แวร์จะเลิกใช้แล้วคุณจะติดตามและรักษาข้อมูลอ้างอิงนั้นตลอดเวลาอย่างไร

และอีกครั้งเทคโนโลยีความหมายโดยเฉพาะอย่างยิ่งการใช้สิ่งต่าง ๆ เช่น taxonomies และคำศัพท์พจนานุกรมข้อมูลได้จัดทำวิธีการพื้นที่มาตรฐานในการทำสิ่งนี้ซึ่งมีความแข็งแกร่งสูงจริง ๆ มันใช้มาตรฐานบางประเภท แต่ชุมชนฐานข้อมูลได้ทำสิ่งนี้เพื่อ เวลานานเช่นกันในรูปแบบที่แตกต่างกัน ฉันคิดว่าหนึ่งในกุญแจที่นี่คือการคิดเกี่ยวกับวิธีการใช้แบบจำลองเอนทิตี้แบบสัมพันธ์วิธีใช้แบบจำลองกราฟหรือวิธีการบางอย่างที่นี่ซึ่งจะทำให้คุณมีความหวังในการจัดการข้อมูลอ้างอิงของคุณ และแน่นอนว่าเมื่อคุณมีข้อมูลอ้างอิงแล้วกลยุทธ์การแมปต้องจัดการชื่อและเอนทิตีที่หลากหลาย ดังนั้นผู้เชี่ยวชาญเฉพาะด้านมักต้องการใช้คำศัพท์ของตนเอง

ดังนั้นความท้าทายในเรื่องนี้อยู่เสมอคุณจะให้ข้อมูลกับใครได้บ้าง แต่ทำให้มันเกี่ยวข้องกับวิธีที่พวกเขาพูดถึงมัน ดังนั้นกลุ่มหนึ่งอาจมีวิธีหนึ่งในการดูบางอย่างเช่นคุณอาจเป็นนักเคมีที่ทำงานกับยาและคุณอาจเป็นนักชีววิทยาเชิงโครงสร้างที่ทำงานกับยาตัวเดียวกันและคุณอาจมีชื่อแตกต่างกันสำหรับหน่วยงานประเภทเดียวกัน ที่เกี่ยวข้องกับสาขาของคุณ คุณต้องหาวิธีที่จะนำคำศัพท์ส่วนบุคคลเหล่านั้นมารวมกันเพราะวิธีการอื่นคือคุณต้องบังคับให้คนละทิ้งคำศัพท์และใช้คนอื่นซึ่งพวกเขามักไม่ชอบ อีกจุดหนึ่งที่นี่คือการจัดการกับคำพ้องความหมายจำนวนมากได้ยากดังนั้นจึงมีคำที่แตกต่างกันมากมายในข้อมูลของคนจำนวนมากที่สามารถอ้างถึงสิ่งเดียวกัน คุณมีปัญหาในการอ้างอิงที่นั่นโดยใช้ชุดความสัมพันธ์แบบหนึ่งต่อหนึ่ง ข้อกำหนดเฉพาะแตกต่างกันไปในแต่ละอุตสาหกรรมดังนั้นหากคุณกำลังคิดหาวิธีแก้ปัญหาที่ครอบคลุมสำหรับการจัดการข้อมูลประเภทนี้แบบพกพาได้ง่ายเพียงใดจากโครงการหนึ่งหรือแอปพลิเคชันหนึ่งไปยังอีกแอปหนึ่ง นั่นอาจเป็นความท้าทายอีกประการหนึ่ง

ระบบอัตโนมัติมีความสำคัญและเป็นความท้าทาย มีราคาแพงในการจัดการข้อมูลอ้างอิงด้วยตนเอง การทำแผนที่ด้วยตนเองมีราคาแพงและมีค่าใช้จ่ายสูงที่ผู้เชี่ยวชาญด้านเนื้อหาจะหยุดทำงานประจำวันและต้องเข้าไปแก้ไขพจนานุกรมข้อมูลและคำจำกัดความที่อัปเดตอยู่เรื่อย ๆ เป็นต้น คำศัพท์ที่จำลองได้แสดงค่ามาก ดังนั้นสิ่งเหล่านี้จึงเป็นคำศัพท์ที่บ่อยครั้งซึ่งคุณสามารถค้นหาได้จากภายนอกองค์กรของคุณ ตัวอย่างเช่นหากคุณทำงานกับน้ำมันดิบจะมีคำศัพท์บางประเภทที่คุณสามารถยืมจากพื้นที่โอเพนซอร์ซเหมือนกับในอุตสาหกรรมยาเหมือนกับอุตสาหกรรมธนาคารและการเงินเหมือนกับในพื้นที่เหล่านี้ ผู้คนกำลังนำคำศัพท์ทั่วไปที่ใช้ซ้ำได้แบบจำลองได้มาใช้ซ้ำเพื่อให้คนใช้

และอีกครั้งเมื่อดูที่เครื่องมือ IDERA ฉันอยากรู้ว่าพวกเขาจัดการเรื่องนี้อย่างไรในแง่ของการใช้มาตรฐานต่างๆ ในโลกความหมายคุณมักจะเห็นสิ่งต่าง ๆ เช่นแบบจำลอง SKOS ที่ให้มาตรฐานอย่างน้อยกว้างกว่า / แคบกว่าความสัมพันธ์และสิ่งเหล่านั้นอาจทำได้ยากในแบบจำลอง ER แต่คุณรู้หรือไม่เป็นไปไม่ได้มันแค่ขึ้นอยู่กับว่า เครื่องจักรและการเชื่อมโยงที่คุณสามารถจัดการกับระบบประเภทเหล่านั้นได้

ดังนั้นในที่สุดฉันก็อยากจะเปรียบเทียบเครื่องยนต์ความหมายบางอย่างที่ฉันเห็นในอุตสาหกรรมและถามรอนกับเขาสักหน่อยเพื่อพูดคุยเกี่ยวกับวิธีการที่ระบบ IDERA ใช้ร่วมกับเทคโนโลยีความหมายใด ๆ มันสามารถรวมกับร้านค้าสามฐานข้อมูลกราฟ? มันง่ายแค่ไหนที่จะใช้แหล่งข้อมูลภายนอกเพราะสิ่งต่าง ๆ เหล่านั้นในโลกความหมายสามารถยืมโดยใช้ SPARQL Endpoint ได้? คุณสามารถนำเข้าโมเดล RDF หรือนกฮูกโดยตรงในแบบจำลองของคุณ - อ้างอิงกลับไปที่พวกเขา - ตัวอย่างเช่นยีน ontology หรือ ontology โปรตีนที่สามารถอาศัยอยู่ที่ไหนสักแห่งในพื้นที่ของตัวเองด้วยโครงสร้างการกำกับของตัวเองและฉันสามารถนำเข้าทั้งหมดหรือ ส่วนหนึ่งของสิ่งที่ฉันต้องการในโมเดลของฉันเอง และฉันอยากรู้ว่า IDERA เข้าใกล้ปัญหานี้อย่างไร คุณต้องรักษาทุกอย่างภายในหรือมีวิธีที่จะไปใช้รูปแบบมาตรฐานอื่น ๆ และดึงพวกเขาในและวิธีการทำงานอย่างไร และสิ่งสุดท้ายที่ฉันพูดถึงที่นี่คืองานที่ทำด้วยมือเกี่ยวข้องกับการสร้างอภิธานศัพท์และที่เก็บข้อมูลเมตาอย่างไร

ดังนั้นฉันจึงรู้ว่ารอนจะแสดงให้เราเห็นถึงการสาธิตเกี่ยวกับสิ่งต่าง ๆ เหล่านี้ซึ่งน่าสนใจจริงๆ แต่ปัญหาที่ฉันมักจะเห็นการให้คำปรึกษากับลูกค้าก็คือว่ามีข้อผิดพลาดเกิดขึ้นมากมายถ้าคนเขียนคำจำกัดความของตัวเองหรือเมตาดาต้าของตัวเอง ดังนั้นคุณจะได้รับการสะกดผิดคุณจะได้รับข้อผิดพลาดไขมันนิ้วนั่นเป็นสิ่งหนึ่ง คุณยังทำให้คนที่อาจนำบางสิ่งมาจากคุณรู้เพียงแค่วิกิพีเดียหรือแหล่งที่ไม่จำเป็นต้องมีคุณภาพที่คุณอาจต้องการในคำนิยามของคุณหรือคำจำกัดความของคุณมาจากมุมมองของคนคนหนึ่งเท่านั้นดังนั้นจึงไม่สมบูรณ์และไม่ชัดเจน กระบวนการกำกับดูแลทำงานอย่างไร แน่นอนว่าการกำกับดูแลนั้นเป็นประเด็นที่ใหญ่มาก ๆ ทุกครั้งที่คุณพูดถึงข้อมูลอ้างอิงและทุกครั้งที่คุณพูดถึงว่าข้อมูลนี้จะสอดคล้องกับข้อมูลหลักของใครบางคนได้อย่างไรพวกเขาจะใช้เมทาดาทาของพวกเขาอย่างไร เป็นต้น

ดังนั้นฉันแค่อยากจะเอาหัวข้อเหล่านี้ออกไป สิ่งเหล่านี้เป็นสิ่งที่ฉันเห็นในพื้นที่ธุรกิจในการให้คำปรึกษาที่หลากหลายและพื้นที่ที่แตกต่างกันมากมายและฉันสนใจที่จะดูว่ารอนจะแสดงให้เราเห็นด้วย IDERA เพื่อชี้ให้เห็นหัวข้อเหล่านี้บางอย่าง . ขอบคุณมาก ๆ

Rebecca Jozwiak: ขอบคุณมาก Eric และฉันชอบความคิดเห็นของคุณมากว่ามีข้อผิดพลาดมากมายเกิดขึ้นได้หากผู้คนกำลังเขียนคำจำกัดความหรือข้อมูลเมตาของตัวเอง ฉันรู้ว่าในโลกสื่อสารมวลชนมีมนต์ที่ว่า "หลาย ๆ ตาทำให้เกิดข้อผิดพลาดเล็กน้อย" แต่เมื่อพูดถึงการใช้งานจริงมือจำนวนมากในขวดโถคุกกี้มีแนวโน้มที่จะทำให้คุณมีคุกกี้ที่แตกมากใช่ไหม?

Eric Little: ใช่แล้วและเชื้อโรค

Rebecca Jozwiak: ใช่แล้ว โดยที่ฉันจะไปข้างหน้าและผ่านมันไปที่ Malcolm Chisholm Malcolm พื้นเป็นของคุณ

Malcolm Chisholm: ขอบคุณมากรีเบคก้า ฉันอยากจะดูเล็กน้อยเกี่ยวกับสิ่งที่เอริคพูดถึงและเพิ่มการสังเกตบางอย่างที่รอนรู้ว่าอาจสนใจที่จะตอบสนองด้วยการพูดถึง“ ไปสู่สถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจ ” - การขับเคลื่อนธุรกิจหมายถึงอะไรและทำไมจึงมีความสำคัญ หรือมันเป็นแค่รูปแบบหนึ่งของการโฆษณา ฉันไม่คิดว่ามันเป็น

ถ้าเราดูว่าเกิดอะไรขึ้นตั้งแต่นั้นมาคุณรู้ไหมว่าคอมพิวเตอร์เมนเฟรมมีให้บริการใน บริษัท จริง ๆ ตั้งแต่ประมาณปี 2507 จนถึงปัจจุบันเราจะเห็นว่ามีการเปลี่ยนแปลงมากมาย และการเปลี่ยนแปลงเหล่านี้ฉันจะสรุปว่าเป็นการเปลี่ยนจากการเป็นศูนย์กลางของกระบวนการไปสู่การเป็นศูนย์กลางข้อมูล และนั่นคือสิ่งที่ทำให้สถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจมีความสำคัญและมีความเกี่ยวข้องในทุกวันนี้ และฉันคิดว่าคุณรู้ใช่มั้ยไม่ใช่แค่คำศัพท์ แต่เป็นสิ่งที่จริงอย่างแน่นอน

แต่เราสามารถชื่นชมมันได้อีกเล็กน้อยหากเราดำดิ่งลงไปในประวัติศาสตร์ดังนั้นย้อนเวลากลับไปสู่ยุค 1960 และหลังจากนั้นไม่นานเมนเฟรมก็มีอิทธิพล สิ่งเหล่านี้ให้ทางกับพีซีที่คุณกบฏผู้ใช้จริง ๆ เมื่อพีซีเข้ามาการจลาจลต่อต้านระบบไอทีจากส่วนกลางที่พวกเขาคิดว่าไม่ได้เติมเต็มความต้องการของพวกเขา นั่นทำให้เกิดการกระจายการคำนวณอย่างรวดเร็วเมื่อพีซีเชื่อมโยงเข้าด้วยกัน จากนั้นอินเทอร์เน็ตก็เริ่มเกิดขึ้นซึ่งทำให้ขอบเขตขององค์กรไม่ชัดเจน - ตอนนี้มันสามารถโต้ตอบกับบุคคลภายนอกในแง่ของการแลกเปลี่ยนข้อมูลซึ่งไม่เคยเกิดขึ้นมาก่อน และตอนนี้เราได้เข้าสู่ยุคของคลาวด์และข้อมูลขนาดใหญ่ที่ซึ่งคลาวด์เป็นแพลตฟอร์มซึ่งเป็นโครงสร้างพื้นฐานการซื้อขายสินค้าโภคภัณฑ์จริง ๆ ดังนั้นเราจึงออกจากที่เคยเป็นมามันเป็นเรื่องของความต้องการไอที เรามีความจุของคลาวด์ที่พร้อมใช้งานสำหรับเราและสอดคล้องกับข้อมูลขนาดใหญ่ที่เอริคมีอยู่คุณจึงพูดคุยอย่างละเอียด และโดยรวมเมื่อเราเห็นว่าการเปลี่ยนแปลงของเทคโนโลยีเกิดขึ้นมันกลายเป็นศูนย์กลางข้อมูลมากขึ้นเราใส่ใจกับข้อมูลมากขึ้น เช่นเดียวกับอินเทอร์เน็ตการแลกเปลี่ยนข้อมูลเป็นอย่างไร ด้วยข้อมูลขนาดใหญ่ v ของข้อมูลสี่ตัวขึ้นไป

ในเวลาเดียวกันและที่สำคัญกว่านั้นกรณีการใช้งานทางธุรกิจก็เปลี่ยนไป เมื่อมีการนำคอมพิวเตอร์มาใช้เป็นครั้งแรกพวกเขาจะถูกใช้เพื่อทำให้เป็นอัตโนมัติเช่นหนังสือและบันทึก และทุกสิ่งที่เป็นกระบวนการแบบแมนนวลที่เกี่ยวข้องกับบัญชีแยกประเภทหรือสิ่งต่าง ๆ เช่นนั้นถูกตั้งโปรแกรมไว้ที่บ้าน ที่เปลี่ยนไปในยุค 80 เพื่อความพร้อมใช้งานของแพคเกจการดำเนินงาน คุณไม่จำเป็นต้องเขียนบัญชีเงินเดือนของคุณเองอีกต่อไปคุณสามารถซื้อสิ่งที่ทำ ส่งผลให้มีการปรับลดขนาดใหญ่ในเวลาหรือการปรับโครงสร้างในแผนกไอทีจำนวนมาก แต่แล้วระบบธุรกิจอัจฉริยะด้วยสิ่งต่าง ๆ เช่นคลังข้อมูลปรากฏส่วนใหญ่ในยุค 90 ตามมาด้วยรูปแบบธุรกิจดอทคอมซึ่งแน่นอนว่ามันเป็นความบ้าคลั่งที่ยิ่งใหญ่ จากนั้น MDM ด้วย MDM คุณจะเริ่มเห็นว่าเราไม่ได้คิดเกี่ยวกับระบบอัตโนมัติ เราแค่มุ่งเน้นไปที่การจัดการข้อมูลเป็นข้อมูล จากนั้นทำการวิเคราะห์ซึ่งแสดงถึงมูลค่าที่คุณจะได้รับจากข้อมูล และภายในการวิเคราะห์คุณจะเห็น บริษัท ที่ประสบความสำเร็จอย่างมากซึ่งรูปแบบธุรกิจหลักหมุนรอบข้อมูล Google, Twitter, Facebook จะเป็นส่วนหนึ่งของสิ่งนั้น แต่คุณสามารถโต้เถียงได้ว่า Walmart คืออะไร

ตอนนี้ธุรกิจกำลังคิดถึงข้อมูลจริงๆ เราจะได้รับประโยชน์จากข้อมูลได้อย่างไร? ข้อมูลสามารถขับเคลื่อนธุรกิจกลยุทธ์และเราอยู่ในยุคทองของข้อมูลได้อย่างไร เมื่อพิจารณาแล้วสิ่งที่เกิดขึ้นในแง่ของสถาปัตยกรรมข้อมูลของเราหากข้อมูลไม่ได้รับการพิจารณาว่าเป็นเพียงความสิ้นเปลืองที่เกิดจากแบ็คเอนด์ของแอพพลิเคชั่น แต่เป็นศูนย์กลางของโมเดลธุรกิจของเราจริงๆ ส่วนหนึ่งของปัญหาที่เราประสบความสำเร็จคือไอทีติดอยู่กับวงจรการพัฒนาระบบซึ่งเป็นผลมาจากการที่ต้องจัดการกับขั้นตอนการทำงานอัตโนมัติของระบบในยุคแรก ๆ ของไอทีและทำงานใน โครงการเป็นสิ่งที่คล้ายกัน สำหรับไอที - และนี่คือภาพล้อเลียนนิดหน่อย - แต่สิ่งที่ฉันพยายามจะพูดคืออุปสรรคบางประการในการรับสถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจนั้นเป็นเพราะเรายอมรับวัฒนธรรมในด้านไอทีอย่างไร้เหตุผล ซึ่งเกิดขึ้นตั้งแต่อายุยังน้อย

ดังนั้นทุกอย่างจึงเป็นโครงการ บอกรายละเอียดความต้องการของคุณให้ฉันฟัง หากสิ่งต่าง ๆ ไม่ทำงานอาจเป็นเพราะคุณไม่ได้บอกความต้องการของคุณ นั่นไม่ได้ผลกับข้อมูลในวันนี้เพราะเราไม่ได้เริ่มต้นด้วยกระบวนการที่ไม่ได้ทำเองโดยอัตโนมัติหรือคุณรู้ไหมการแปลงทางเทคนิคของกระบวนการทางธุรกิจเราเริ่มต้นบ่อยครั้งมากด้วยข้อมูลการผลิตที่มีอยู่แล้วที่เรากำลังพยายามอยู่ เพื่อรับคุณค่าจาก แต่ไม่มีใครที่สนับสนุนโครงการที่เน้นข้อมูลเป็นศูนย์กลางเข้าใจข้อมูลนั้นอย่างลึกซึ้ง เราต้องทำการค้นหาข้อมูลเราต้องทำการวิเคราะห์ข้อมูลต้นฉบับ และนั่นไม่ตรงกับการพัฒนาระบบจริง ๆ คุณรู้ไหมว่าวงจรชีวิตของ SDLC ซึ่ง Agile ที่ฉันจะรักษาไว้นั้นเป็นรุ่นที่ดีกว่า

และสิ่งที่กำลังมุ่งเน้นคือเทคโนโลยีและฟังก์ชั่นไม่ใช่ข้อมูล ตัวอย่างเช่นเมื่อเราทำการทดสอบในขั้นตอนการทดสอบโดยทั่วไปแล้วการทำงานของฉันจะใช้งานสมมติว่า ETL ของฉัน แต่เราไม่ได้ทดสอบข้อมูล เราไม่ได้ทดสอบสมมติฐานของเราเกี่ยวกับแหล่งข้อมูลที่เข้ามาถ้าเราทำเราอาจจะมีรูปร่างที่ดีขึ้นและในฐานะคนที่ทำโครงการคลังข้อมูลและประสบกับการเปลี่ยนแปลงขั้นต้นทำให้ ETL ของฉันพัง และในความเป็นจริงสิ่งที่เราต้องการเห็นคือการทดสอบเป็นขั้นตอนเบื้องต้นในการตรวจสอบคุณภาพข้อมูลการผลิตอย่างต่อเนื่อง ดังนั้นเราจึงมีทัศนคติมากมายที่นี่เป็นเรื่องยากที่จะบรรลุสถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจเพราะเราอยู่ภายใต้ยุคของกระบวนการเป็นศูนย์กลาง เราจำเป็นต้องเปลี่ยนไปใช้ข้อมูลเป็นศูนย์กลาง และนี่ไม่ใช่การเปลี่ยนแปลงโดยรวมคุณรู้ว่ายังมีกระบวนการทำงานมากมายที่ต้องทำ แต่เราไม่ได้คิดในแง่ของข้อมูลเป็นศูนย์กลางเมื่อเราต้องการและสถานการณ์ที่เกิดขึ้นเมื่อเราจริง ๆ จำเป็นต้องทำเช่นนั้น

ตอนนี้ธุรกิจตระหนักถึงคุณค่าของข้อมูลพวกเขาต้องการปลดล็อกข้อมูลดังนั้นเราจะทำอย่างไร ดังนั้นเราจะทำการเปลี่ยนแปลงอย่างไร เราใส่ข้อมูลที่เป็นหัวใจของกระบวนการพัฒนา และเราปล่อยให้ผู้นำธุรกิจพร้อมด้วยข้อกำหนดด้านข้อมูล และเราเข้าใจว่าไม่มีใครเข้าใจแหล่งข้อมูลที่มีอยู่ในตอนเริ่มโครงการ คุณสามารถยืนยันได้ว่าโครงสร้างข้อมูลและข้อมูลนั้นอยู่ที่นั่นผ่านทางไอทีและการดำเนินงานตามลำดับดังนั้นเราจึงควรรู้ แต่จริงๆแล้วเราไม่ทำ นี่คือการพัฒนาข้อมูลเป็นศูนย์กลาง ดังนั้นเราต้องคิดว่าเราทำที่ไหนและทำอย่างไรเราจะสร้างแบบจำลองข้อมูลในโลกของข้อมูลเป็นศูนย์กลางเราจะต้องมีข้อเสนอแนะลูปให้กับผู้ใช้ในแง่ของการปรับแต่งความต้องการข้อมูลของพวกเขาในขณะที่เราทำการค้นหาข้อมูล คาดการณ์การวิเคราะห์ข้อมูลต้นฉบับและในขณะที่เราค่อยๆได้รับความมั่นใจมากขึ้นเกี่ยวกับข้อมูลของเรา และตอนนี้ฉันกำลังพูดถึงโครงการแบบดั้งเดิมมากขึ้นเช่นฮับ MDM หรือคลังข้อมูลไม่จำเป็นต้องเป็นโครงการข้อมูลขนาดใหญ่ถึงแม้ว่าโครงการนี้จะยังอยู่ก็ตาม ดังนั้นลูปป้อนกลับเหล่านั้นจึงรวมตัวสร้างข้อมูลคุณค่อย ๆ พัฒนารูปแบบข้อมูลของพวกเขาและโต้ตอบกับผู้ใช้เพื่อให้แน่ใจว่าข้อกำหนดด้านข้อมูลได้รับการปรับปรุงตามสิ่งที่เป็นไปได้สิ่งที่มีอยู่จากแหล่งข้อมูลตามที่พวกเขาเข้าใจดีขึ้น มันไม่ใช่กรณีของรูปแบบข้อมูลอีกต่อไปคุณรู้ไหมว่าในสถานะที่ไม่ได้อยู่ที่นั่นหรือทำเสร็จสมบูรณ์มันค่อย ๆ นำมาซึ่งความสำคัญของมัน

ในทำนองเดียวกันยิ่งไปกว่านั้นเรายังมีการประกันคุณภาพที่เราพัฒนากฎสำหรับการทดสอบคุณภาพข้อมูลเพื่อให้แน่ใจว่าข้อมูลนั้นอยู่ในพารามิเตอร์ที่เราตั้งสมมติฐาน เข้าไปข้างในเอริคหมายถึงการเปลี่ยนแปลงข้อมูลอ้างอิงซึ่งอาจเกิดขึ้น คุณไม่ต้องการที่จะเป็นผู้ตกเป็นเหยื่อของการเปลี่ยนแปลงที่ไม่มีการจัดการในพื้นที่นั้นดังนั้นกฎการประกันคุณภาพสามารถเข้าไปในการผลิตหลังการตรวจสอบคุณภาพของข้อมูลอย่างต่อเนื่อง ดังนั้นคุณสามารถเริ่มต้นดูว่าเราจะเป็นศูนย์กลางของข้อมูลหรือไม่วิธีที่เราพัฒนา data-centric นั้นแตกต่างจาก SDLC และ Agile ที่มีฟังก์ชั่นการใช้งานค่อนข้างมาก จากนั้นเราก็ต้องใส่ใจกับมุมมองทางธุรกิจเช่นกัน เรามี - และสะท้อนสิ่งที่ Eric พูดอีกครั้ง - เรามีตัวแบบข้อมูลที่กำหนดพิมพ์เขียวเรื่องข้อมูลสำหรับฐานข้อมูลของเรา แต่ในขณะเดียวกันเราก็ต้องการโมเดลเชิงแนวคิดเหล่านั้นมุมมองทางธุรกิจของข้อมูลที่ยังไม่ได้ทำ ที่ผ่านมา. บางครั้งเราคิดว่าคิดว่าแบบจำลองข้อมูลสามารถทำได้ทั้งหมด แต่เราจำเป็นต้องมีมุมมองแนวคิดความหมายและดูข้อมูลทำให้มันผ่านเลเยอร์นามธรรมซึ่งแปลโมเดลการจัดเก็บข้อมูลเป็นธุรกิจ ดู. และอีกครั้งทุกสิ่งที่ Eric กำลังพูดถึงในแง่ของความหมายกลายเป็นสิ่งสำคัญที่จะทำเช่นนั้นดังนั้นเราจึงมีงานสร้างแบบจำลองเพิ่มเติม ฉันคิดว่านั่นเป็นสิ่งที่น่าสนใจถ้าคุณได้รับการจัดอันดับในฐานะผู้สร้างแบบจำลองข้อมูลเหมือนที่ฉันทำและมีอะไรใหม่ ๆ

และในที่สุดฉันก็อยากจะบอกว่าสถาปัตยกรรมที่ใหญ่กว่านั้นก็ต้องสะท้อนความเป็นจริงใหม่นี้เช่นกัน ยกตัวอย่างเช่นลูกค้าเก่า MDM ก็โอเคเราจะนำข้อมูลลูกค้าของเราเข้าสู่ศูนย์กลางที่เราสามารถรับรู้ได้ในแง่ของคุณภาพข้อมูลสำหรับแอปพลิเคชันแบ็คออฟฟิศ ซึ่งจากมุมมองกลยุทธ์ทางธุรกิจเป็นชนิดของหาว อย่างไรก็ตามในวันนี้เรากำลังดูฮับ MDM ของลูกค้าที่มีข้อมูลโปรไฟล์ลูกค้าเพิ่มเติมในพวกเขาไม่ใช่แค่ข้อมูลคงที่ซึ่งจะมีส่วนต่อประสานสองทิศทางกับแอปพลิเคชันธุรกรรมของลูกค้า ใช่พวกเขายังคงสนับสนุน back office แต่ตอนนี้เรารู้เกี่ยวกับพฤติกรรมเหล่านี้ของลูกค้าของเราเช่นกัน นี่มันแพงกว่าการสร้าง นี่คือการสร้างที่ซับซ้อนมากขึ้น แต่ขับเคลื่อนด้วยธุรกิจในลักษณะที่ MDM ลูกค้าดั้งเดิมไม่ใช่ คุณกำลังปิดการวางแนวธุรกิจกับการออกแบบที่เรียบง่ายซึ่งง่ายต่อการใช้งาน แต่สำหรับธุรกิจนี่คือสิ่งที่พวกเขาต้องการเห็น เราอยู่ในยุคใหม่จริง ๆ และฉันคิดว่ามีหลายระดับที่เราต้องตอบสนองต่อสถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจและฉันคิดว่ามันเป็นเวลาที่น่าตื่นเต้นมากที่จะทำสิ่งต่าง ๆ

ดังนั้นขอขอบคุณกลับไปหาคุณรีเบคก้า

Rebecca Jozwiak: ขอบคุณ Malcolm และฉันสนุกกับสิ่งที่คุณพูดเกี่ยวกับแบบจำลองข้อมูลจะต้องดึงข้อมูลมุมมองทางธุรกิจเพราะไม่เหมือนที่คุณพูดซึ่งแตกต่างจากที่คุณพูดที่ซึ่งไอทีจัดการสายบังเหียนมานานและมันก็ไม่ใช่กรณีนั้นอีกแล้ว วัฒนธรรมต้องเปลี่ยนไป และฉันค่อนข้างแน่ใจว่ามีสุนัขอยู่เบื้องหลังที่เห็นด้วยกับคุณ 100% และด้วยการที่ฉันจะส่งบอลให้รอน ฉันตื่นเต้นมากที่จะได้เห็นตัวอย่างของคุณ รอนพื้นเป็นของคุณ

Ron Huizenga: ขอบคุณมากและก่อนที่เราจะกระโดดเข้าไปในนั้นฉันจะผ่านสไลด์สองสามครั้งจากนั้นตัวอย่างเล็กน้อยเพราะเนื่องจาก Eric และ Malcolm ได้ชี้ให้เห็นว่านี่เป็นหัวข้อที่กว้างและลึกมากและ กับสิ่งที่เรากำลังพูดถึงในวันนี้เราแค่ขูดพื้นผิวของมันเพราะมีหลายด้านและหลายสิ่งหลายอย่างที่เราต้องพิจารณาและมองจากสถาปัตยกรรมที่ขับเคลื่อนด้วยธุรกิจ และวิธีการของเราคือการสร้างมูลค่าที่แท้จริงจากโมเดลให้เป็นจริงเพราะคุณสามารถใช้มันเป็นยานพาหนะในการสื่อสารเช่นเดียวกับเลเยอร์เพื่อเปิดใช้งานระบบอื่น ๆ ไม่ว่าคุณกำลังทำสถาปัตยกรรมที่มุ่งเน้นบริการหรือสิ่งอื่น ๆ แบบจำลองจะกลายเป็นสัดส่วนหลักของสิ่งที่เกิดขึ้นจริง ๆ ด้วยข้อมูลเมตาทั้งหมดที่อยู่รอบ ๆ และข้อมูลที่คุณมีในธุรกิจของคุณ

แม้ว่าสิ่งที่ฉันต้องการจะพูดคือเกือบจะก้าวถอยหลังไปแล้วเพราะมัลคอล์มได้สัมผัสกับประวัติความเป็นมาของวิธีการแก้ปัญหาที่มีวิวัฒนาการและประเภทของสิ่งนั้น วิธีหนึ่งที่จะชี้ให้เห็นถึงความสำคัญของการมีสถาปัตยกรรมข้อมูลเสียงเป็นกรณีการใช้งานที่ฉันเคยพบบ่อยเมื่อฉันปรึกษาก่อนที่จะเข้ามามีบทบาทในการจัดการผลิตภัณฑ์และนั่นคือฉันจะเข้าสู่องค์กร ไม่ว่าพวกเขาจะทำการเปลี่ยนแปลงทางธุรกิจหรือเพียงแค่แทนที่ระบบที่มีอยู่แล้วและสิ่งนั้น ๆ และมันก็เห็นได้อย่างรวดเร็วว่าองค์กรยากจนเข้าใจข้อมูลของตัวเองได้อย่างไร หากคุณใช้กรณีการใช้งานเฉพาะอย่างเช่นกรณีนี้ไม่ว่าคุณจะเป็นที่ปรึกษาหรืออาจเป็นบุคคลที่เพิ่งเริ่มต้นกับองค์กรหรือองค์กรของคุณได้รับการสร้างขึ้นในช่วงหลายปีที่ผ่านมาด้วยการซื้อ บริษัท ที่แตกต่างกัน ขึ้นกับสภาพแวดล้อมที่ซับซ้อนมากอย่างรวดเร็วด้วยจำนวนของเทคโนโลยีที่แตกต่างกันใหม่เช่นเดียวกับเทคโนโลยีแบบดั้งเดิมโซลูชั่น ERP และทุกอย่างอื่น

ดังนั้นสิ่งหนึ่งที่เราสามารถทำได้จริง ๆ ด้วยวิธีการสร้างแบบจำลองของเราคือการตอบคำถามว่าฉันจะเข้าใจเรื่องทั้งหมดนี้ได้อย่างไร? เราสามารถเริ่มรวบรวมข้อมูลเข้าด้วยกันเพื่อให้ธุรกิจสามารถใช้ประโยชน์จากข้อมูลที่เรามีอย่างถูกต้อง และมันออกมาเป็นสิ่งที่เรามีอยู่ในสภาพแวดล้อมเหล่านั้น? ฉันจะใช้โมเดลเพื่อขับเคลื่อนข้อมูลที่ฉันต้องการและเข้าใจข้อมูลนั้นดีกว่าได้อย่างไร จากนั้นเรามีเมตาดาต้าแบบดั้งเดิมสำหรับสิ่งต่าง ๆ ทั้งหมดเช่นแบบจำลองข้อมูลเชิงสัมพันธ์และเราเคยเห็นสิ่งต่าง ๆ เช่นคำจำกัดความและพจนานุกรมข้อมูลคุณรู้ประเภทข้อมูลและประเภทของสิ่งนั้น แต่แล้วข้อมูลเมตาเพิ่มเติมที่คุณต้องการจับเพื่อให้ความหมายมากกว่านั้นจริงๆ เช่นเอนทิตีที่เป็นตัวเลือกจริง ๆ ที่ควรเป็นออบเจ็กต์ข้อมูลอ้างอิงซึ่งควรเป็นออบเจ็กต์การจัดการข้อมูลหลักและประเภทของสิ่งเหล่านั้นและรวมเข้าด้วยกัน และข้อมูลไหลผ่านองค์กรอย่างไร ข้อมูลไหลจากการที่พวกเขาบริโภคจากมุมมองกระบวนการ แต่ยังรวมถึงสายดาต้าในแง่ของการเดินทางของข้อมูลผ่านธุรกิจของเราและวิธีที่มันทำผ่านระบบต่าง ๆ หรือผ่านแหล่งข้อมูลดังนั้นเราจึงรู้ เมื่อเราสร้างโซลูชัน I หรือสิ่งต่าง ๆ เหล่านั้นเรากำลังใช้ข้อมูลที่ถูกต้องสำหรับงานที่ทำอยู่

และที่สำคัญมากคือเราจะทำให้ผู้มีส่วนได้ส่วนเสียทั้งหมดร่วมมือกันได้อย่างไรและโดยเฉพาะอย่างยิ่งผู้มีส่วนได้เสียทางธุรกิจเพราะพวกเขาเป็นคนที่ให้ความหมายที่แท้จริงแก่เราว่าข้อมูลนั้นคืออะไร ธุรกิจ ณ สิ้นวันเป็นเจ้าของข้อมูล พวกเขาให้คำจำกัดความสำหรับคำศัพท์และสิ่งต่าง ๆ ที่เอริคพูดถึงดังนั้นเราจึงจำเป็นต้องมีที่สำหรับผูกทั้งหมดไว้ด้วยกัน และวิธีที่เราทำคือการสร้างแบบจำลองข้อมูลและสถาปัตยกรรมพื้นที่เก็บข้อมูลของเรา

ฉันจะสัมผัสกับบางสิ่ง ฉันจะพูดเกี่ยวกับ ER / Studio Enterprise Team Edition โดยพื้นฐานแล้วฉันจะพูดถึงผลิตภัณฑ์สถาปัตยกรรมข้อมูลที่เราทำการสร้างแบบจำลองข้อมูลและสิ่งประเภทนั้น แต่มีส่วนประกอบอื่น ๆ อีกมากมายของชุดที่ฉันเพิ่งจะสัมผัสในเวลาสั้น ๆ คุณจะเห็นตัวอย่างหนึ่งของสถาปนิกธุรกิจซึ่งเราสามารถทำแบบจำลองแนวคิด แต่เรายังสามารถทำแบบจำลองกระบวนการทางธุรกิจและเราสามารถผูกแบบจำลองกระบวนการเหล่านั้นในการเชื่อมโยงข้อมูลจริงที่เรามีในแบบจำลองข้อมูลของเรา มันช่วยให้เรานำเนคไทนั้นมารวมกัน สถาปนิกซอฟต์แวร์ช่วยให้เราสามารถสร้างโครงสร้างเพิ่มเติมเช่นการสร้างแบบจำลอง UML บางอย่างและประเภทของสิ่งเหล่านั้นเพื่อให้การสนับสนุน logics ให้กับระบบและกระบวนการอื่น ๆ ที่เรากำลังพูดถึง แต่ที่สำคัญอย่างยิ่งเมื่อเราเลื่อนลงไปเรามีที่เก็บข้อมูลและเซิร์ฟเวอร์ทีมและฉันจะพูดถึงสิ่งนั้นในลักษณะเดียวกันสองครึ่ง พื้นที่เก็บข้อมูลเป็นที่ที่เราจัดเก็บข้อมูลเมตาดาต้าที่มีรูปแบบทั้งหมดรวมทั้งข้อมูลเมตาธุรกิจทั้งหมดในแง่ของอภิธานศัพท์ทางธุรกิจและข้อกำหนด และเนื่องจากเรามีสภาพแวดล้อมแบบอิงพื้นที่เก็บข้อมูลเราจึงสามารถเชื่อมต่อสิ่งต่าง ๆ เหล่านี้ทั้งหมดเข้าด้วยกันในสภาพแวดล้อมเดียวกันนั้นและจากนั้นเราสามารถทำให้สิ่งเหล่านั้นพร้อมสำหรับการบริโภคได้ไม่เพียง แต่สำหรับคนทางด้านเทคนิคเท่านั้น และนั่นคือวิธีที่เราเริ่มผลักดันการทำงานร่วมกัน

แล้วชิ้นสุดท้ายที่ฉันจะพูดถึงสั้น ๆ ก็คือเมื่อคุณเดินเข้าไปในสภาพแวดล้อมเหล่านี้มันไม่ใช่แค่ฐานข้อมูลที่คุณมีอยู่ คุณจะมีฐานข้อมูลจำนวนมากที่เก็บข้อมูลคุณจะต้องมีจำนวนมากสิ่งที่ฉันจะเรียกสิ่งประดิษฐ์ดั้งเดิม บางทีคนอาจใช้ Visio หรือไดอะแกรมอื่น ๆ เพื่อทำแผนที่สิ่งต่าง ๆ บางทีพวกเขาอาจมีเครื่องมือสร้างแบบจำลองอื่น ๆ และสิ่งนั้น ดังนั้นสิ่งที่เราสามารถทำได้กับ MetaWizard นั้นจะดึงข้อมูลบางส่วนนั้นและนำมาไว้ในแบบจำลองของเราทำให้เป็นปัจจุบันและสามารถใช้งานได้บริโภคในแบบปัจจุบันอีกครั้งแทนที่จะแค่นั่งอยู่ตรงนั้น ตอนนี้มันกลายเป็นส่วนหนึ่งของแบบจำลองการทำงานของเราซึ่งสำคัญมาก

เมื่อคุณเดินเข้าไปในองค์กรอย่างที่ฉันพูดระบบที่แตกต่างออกไปจำนวนมากมีโซลูชัน ERP จำนวนมากโซลูชันของแผนกที่ไม่ตรงกัน หลายองค์กรกำลังใช้โซลูชัน SaaS ซึ่งควบคุมและจัดการจากภายนอกด้วยดังนั้นเราจึงไม่ควบคุมฐานข้อมูลและสิ่งต่าง ๆ เหล่านั้นในโฮสต์บนโฮสต์เหล่านั้น แต่เรายังจำเป็นต้องทราบว่าข้อมูลนั้นมีลักษณะอย่างไรและแน่นอน ข้อมูลเมตาที่อยู่รอบ ๆ สิ่งที่เราค้นพบก็คือระบบมรดกที่ล้าสมัยจำนวนมากที่ยังไม่ได้รับการกำจัดเพราะวิธีการใช้โครงการที่มัลคอล์มเคยพูดถึง เป็นเรื่องที่น่าแปลกใจว่าองค์กรต่างๆจะหมุนเวียนโครงการได้อย่างไรพวกเขาจะแทนที่ระบบหรือโซลูชัน แต่มีงบประมาณโครงการไม่เพียงพอที่จะเหลือทิ้งเพื่อรื้อถอนโซลูชันที่ล้าสมัยดังนั้นตอนนี้พวกเขากำลังเข้าใกล้ และเราต้องหาสิ่งที่เราสามารถกำจัดได้จริงในสภาพแวดล้อมของเรารวมถึงสิ่งที่มีประโยชน์ในอนาคต และนั่นก็เชื่อมโยงกับกลยุทธ์การรื้อถอนที่ไม่ดี นั่นเป็นส่วนหนึ่งและพัสดุของสิ่งเดียวกัน

สิ่งที่เราค้นพบเพราะมีองค์กรจำนวนมากที่ถูกสร้างขึ้นจากโซลูชันที่แตกต่างกันทั้งหมดนี้คือเราเห็นอินเทอร์เฟซแบบจุดต่อจุดจำนวนมากที่มีข้อมูลจำนวนมากเคลื่อนย้ายไปมาในหลาย ๆ ที่ เราจำเป็นต้องสามารถหาเหตุผลเข้าข้างตนเองและหาว่าสายข้อมูลที่ฉันพูดถึงมาก่อนเพื่อให้เราสามารถมีกลยุทธ์ที่เหนียวแน่นมากขึ้นเช่นการใช้สถาปัตยกรรมที่มุ่งเน้นบริการรถบัสบริการขององค์กรและสิ่งต่าง ๆ เหล่านั้นเพื่อส่งข้อมูลที่ถูกต้อง ในรูปแบบการเผยแพร่และสมัครสมาชิกที่เราใช้อย่างถูกต้องทั่วธุรกิจของเรา และแน่นอนว่าเรายังต้องทำการวิเคราะห์บางประเภทไม่ว่าเราจะใช้คลังข้อมูลดาต้ามาร์ทกับ ETL แบบดั้งเดิมหรือใช้ทะเลสาบข้อมูลใหม่บางส่วน ทุกอย่างลงมาในสิ่งเดียวกัน มันคือข้อมูลทั้งหมดไม่ว่าจะเป็นข้อมูลขนาดใหญ่ไม่ว่าจะเป็นข้อมูลดั้งเดิมในฐานข้อมูลเชิงสัมพันธ์เราจำเป็นต้องรวบรวมข้อมูลทั้งหมดเข้าด้วยกันเพื่อให้เราสามารถจัดการและรู้ว่าเรากำลังทำอะไรกับโมเดลของเรา

อีกครั้งความซับซ้อนที่เราจะทำคือเรามีหลายขั้นตอนที่เราต้องการจะทำ ก่อนอื่นคุณเดินเข้ามาและคุณอาจไม่มีพิมพ์เขียวเหล่านั้นว่าภูมิทัศน์ข้อมูลนั้นเป็นอย่างไร ในเครื่องมือสร้างแบบจำลองข้อมูลเช่น ER / Studio Data Architect คุณจะต้องทำวิศวกรรมย้อนกลับเป็นจำนวนมากในแง่ของการชี้ไปที่แหล่งข้อมูลที่อยู่ข้างนอกนำพวกเขาเข้าด้วยกัน แบบจำลองที่แสดงถึงธุรกิจทั้งหมด สิ่งสำคัญคือเราต้องการที่จะย่อยสลายโมเดลเหล่านั้นเช่นกันตามสายธุรกิจเพื่อให้เราสามารถเชื่อมโยงกับพวกมันในกลุ่มย่อย ๆ ที่นักธุรกิจของเราสามารถเกี่ยวข้องและนักวิเคราะห์ธุรกิจและผู้มีส่วนได้ส่วนเสียอื่น ๆ ที่ทำงานอยู่ บนมัน

มาตรฐานการตั้งชื่อมีความสำคัญอย่างยิ่งและฉันกำลังพูดถึงมันในสองสามวิธีที่แตกต่างกันที่นี่ มาตรฐานการตั้งชื่อในแง่ของวิธีที่เราตั้งชื่อสิ่งต่าง ๆ ในแบบจำลองของเรา มันค่อนข้างง่ายที่จะทำในแบบจำลองเชิงตรรกะที่เรามีแบบแผนการตั้งชื่อที่ดีและพจนานุกรมข้อมูลที่ดีสำหรับแบบจำลองของเรา แต่จากนั้นเราจะเห็นแบบแผนการตั้งชื่อแบบต่าง ๆ สำหรับแบบจำลองทางกายภาพเหล่านี้จำนวนมากที่เรานำเข้ามา วิศวกรรมย้อนกลับบ่อยครั้งที่เราเห็นชื่อย่อและสิ่งที่ฉันจะพูดถึง และเราจำเป็นต้องแปลชื่อเหล่านั้นกลับเป็นชื่อภาษาอังกฤษที่มีความหมายซึ่งมีความหมายต่อธุรกิจเพื่อให้เราสามารถเข้าใจว่าชิ้นข้อมูลเหล่านี้คืออะไรที่เรามีในสภาพแวดล้อม แล้วการแมปสากลก็คือวิธีที่เรารวมมันเข้าด้วยกัน

ยิ่งกว่านั้นเราจะทำเอกสารและกำหนดเพิ่มเติมและนั่นคือสิ่งที่เราสามารถจำแนกข้อมูลของเราเพิ่มเติมด้วยสิ่งที่เรียกว่า Attachments ซึ่งฉันจะแสดงสไลด์สองแผ่นให้คุณดู จากนั้นปิดวงเราต้องการใช้ความหมายทางธุรกิจนั้นซึ่งเป็นที่ที่เราผูกไว้ในอภิธานศัพท์ทางธุรกิจของเราและสามารถเชื่อมโยงมันกับสิ่งประดิษฐ์รูปแบบที่แตกต่างกันของเราดังนั้นเรารู้เมื่อเราพูดถึงคำศัพท์ทางธุรกิจ ดำเนินการในข้อมูลของเราทั่วทั้งองค์กร และสุดท้ายนี้ฉันได้พูดคุยเกี่ยวกับความจริงที่ว่าเราต้องการทั้งหมดนี้เพื่อเป็นพื้นที่เก็บข้อมูลที่มีการทำงานร่วมกันและความสามารถในการเผยแพร่จำนวนมากดังนั้นผู้มีส่วนได้เสียของเราจึงสามารถใช้ประโยชน์ได้ ฉันจะพูดเกี่ยวกับวิศวกรรมย้อนกลับอย่างรวดเร็วพอสมควร ฉันได้ให้ไฮไลท์ที่รวดเร็วแก่คุณแล้ว ฉันจะแสดงให้คุณเห็นในตัวอย่างจริงเพื่อแสดงให้คุณเห็นบางสิ่งที่เราสามารถนำเข้าไปได้

และฉันต้องการพูดคุยเกี่ยวกับรูปแบบและไดอะแกรมต่าง ๆ ที่เราจะผลิตในสถานการณ์ประเภทนี้ เห็นได้ชัดว่าเราจะทำแบบจำลองแนวคิดในหลายกรณี ฉันจะไม่ใช้เวลามากกับเรื่องนั้น ฉันต้องการพูดคุยเกี่ยวกับแบบจำลองเชิงตรรกะแบบจำลองทางกายภาพและแบบจำลองชนิดพิเศษที่เราสามารถสร้างได้ และเป็นสิ่งสำคัญที่เราสามารถสร้างสิ่งเหล่านี้ทั้งหมดในแพลตฟอร์มการสร้างแบบจำลองเดียวกันเพื่อให้เราสามารถรวมเข้าด้วยกัน ซึ่งรวมถึงโมเดลมิติและโมเดลที่ใช้แหล่งข้อมูลใหม่บางส่วนเช่น NoSQL ที่ฉันจะแสดงให้คุณเห็น แล้วโมเดลเชื้อสายข้อมูลมีหน้าตาเป็นอย่างไร? และเราจะเชื่อมโยงข้อมูลนั้นเป็นรูปแบบกระบวนการทางธุรกิจได้อย่างไรสิ่งที่เราจะพูดถึงต่อไป

ฉันจะเปลี่ยนไปใช้สภาพแวดล้อมการสร้างแบบจำลองที่นี่เพียงเพื่อให้ภาพรวมที่สูงและรวดเร็วมาก และฉันเชื่อว่าคุณน่าจะเห็นหน้าจอของฉันได้แล้ว ก่อนอื่นฉันต้องการพูดคุยเกี่ยวกับตัวแบบข้อมูลแบบดั้งเดิม และวิธีที่เราต้องการจัดระเบียบแบบจำลองเมื่อเรานำมันเข้ามาคือเราต้องการที่จะย่อยสลายมัน ดังนั้นสิ่งที่คุณเห็นที่นี่ทางด้านซ้ายมือคือเรามีแบบจำลองแบบลอจิคัลและแบบกายภาพในไฟล์แบบจำลองนี้โดยเฉพาะ สิ่งต่อไปคือเราสามารถแยกย่อยสลายตามแนวธุรกิจได้นั่นคือสาเหตุที่คุณเห็นโฟลเดอร์ สีฟ้าอ่อนเป็นแบบจำลองเชิงตรรกะและสีเขียวเป็นแบบจำลองทางกายภาพ และเรายังสามารถเจาะลึกได้ดังนั้นภายใน ER / Studio หากคุณมีการสลายตัวทางธุรกิจคุณสามารถไปที่ระดับลึกหรือโมเดลย่อยได้มากเท่าที่คุณต้องการและการเปลี่ยนแปลงที่คุณทำในระดับต่ำจะสะท้อนให้เห็นถึงระดับที่สูงขึ้นโดยอัตโนมัติ ระดับ ดังนั้นมันจึงกลายเป็นสภาพแวดล้อมการสร้างแบบจำลองที่ทรงพลังอย่างรวดเร็ว

สิ่งที่ฉันต้องการชี้ให้เห็นว่าเป็นสิ่งสำคัญมากที่จะเริ่มดึงข้อมูลนี้เข้าด้วยกันคือเราสามารถมีแบบจำลองทางกายภาพหลายรูปแบบที่สอดคล้องกับแบบจำลองแบบตรรกะเดียวเช่นกัน บ่อยครั้งที่คุณอาจมีแบบจำลองเชิงตรรกะ แต่คุณอาจมีแบบจำลองทางกายภาพบนแพลตฟอร์มที่แตกต่างกันและประเภทของสิ่งนั้น อาจเป็นหนึ่งในอินสแตนซ์ของ SQL Server ซึ่งอาจเป็นอีกอินสแตนซ์ของออราเคิล เรามีความสามารถในการเชื่อมโยงทั้งหมดเข้าด้วยกันในสภาพแวดล้อมการสร้างแบบจำลองเดียวกัน และอีกครั้งสิ่งที่ฉันได้มาที่นี่คือโมเดลคลังข้อมูลจริงที่สามารถทำได้อีกครั้งอยู่ในสภาพแวดล้อมการสร้างแบบจำลองเดียวกันหรือเราสามารถมีไว้ในที่เก็บและเชื่อมโยงกับสิ่งต่าง ๆ ได้เช่นกัน

สิ่งที่ฉันต้องการแสดงให้คุณเห็นในเรื่องนี้คือสิ่งอื่น ๆ และรูปแบบอื่น ๆ ของโมเดลที่เราเข้าร่วม ดังนั้นเมื่อเราเข้าสู่โมเดลข้อมูลแบบดั้งเดิมเช่นนี้เราจะเคยเห็นเอนทิตีทั่วไปที่มีคอลัมน์และเมตาดาต้าและประเภทของสิ่งนั้น แต่มุมมองนั้นแตกต่างกันอย่างรวดเร็วเมื่อเราเริ่มจัดการกับเทคโนโลยี NoSQL ที่ใหม่กว่าเหล่านี้ หรือเป็นบางคนที่ยังคงต้องการเรียกพวกเขาว่าเป็นเทคโนโลยีข้อมูลขนาดใหญ่

ดังนั้นตอนนี้สมมติว่าเรามีรังอยู่ในสภาพแวดล้อมของเรา หากเราสลับวิศวกรจากสภาพแวดล้อม Hive และเราสามารถส่งต่อและย้อนกลับวิศวกรจาก Hive ด้วยเครื่องมือสร้างแบบจำลองที่เหมือนกันนี้เราจะเห็นบางสิ่งที่แตกต่างกันเล็กน้อย เรายังคงเห็นข้อมูลทั้งหมดเป็นโครงสร้างที่นั่น แต่ TDL ของเราแตกต่างกัน พวกคุณที่เคยเห็น SQL สิ่งที่คุณจะเห็นตอนนี้คือ Hive QL ซึ่งคล้ายกับ SQL มาก แต่จากเครื่องมือเดียวกันคุณสามารถเริ่มทำงานกับภาษาสคริปต์ที่แตกต่างกันได้ ดังนั้นคุณสามารถสร้างแบบจำลองในสภาพแวดล้อมนี้สร้างมันออกมาในสภาพแวดล้อม Hive แต่ที่สำคัญในสถานการณ์ที่ฉันได้อธิบายไว้คุณสามารถย้อนกลับวิศวกรรมทั้งหมดเข้าด้วยกันและทำความเข้าใจกับมันและเริ่มต่อเข้าด้วยกันเช่นกัน .

ลองหาอีกอันที่แตกต่างกันหน่อย MongoDB เป็นอีกแพลตฟอร์มหนึ่งที่เราให้การสนับสนุน และเมื่อคุณเริ่มเข้าสู่สภาพแวดล้อมประเภท JSON ที่คุณมีที่เก็บเอกสาร JSON เป็นสัตว์ที่แตกต่างกันและมีโครงสร้างในสิ่งนั้นซึ่งไม่สอดคล้องกับแบบจำลองเชิงสัมพันธ์ ในไม่ช้าคุณจะเริ่มจัดการกับแนวคิดเช่นวัตถุฝังตัวและอาร์เรย์ของวัตถุที่ฝังตัวเมื่อคุณเริ่มทำการสอบสวน JSON และแนวคิดเหล่านั้นไม่มีอยู่ในสัญกรณ์เชิงสัมพันธ์แบบดั้งเดิม สิ่งที่เราทำที่นี่คือเราได้ขยายสัญลักษณ์และแค็ตตาล็อกของเราเพื่อให้สามารถจัดการกับมันในสภาพแวดล้อมเดียวกัน

หากคุณมองไปทางซ้ายตรงนี้แทนที่จะมองสิ่งต่าง ๆ เช่นเอนทิตีและตารางเราเรียกมันว่าวัตถุ และคุณเห็นสัญลักษณ์ต่าง ๆ คุณยังคงเห็นสัญกรณ์อ้างอิงทั่วไปที่นี่ แต่เอนทิตีสีน้ำเงินที่ฉันแสดงในแผนภาพนี้เป็นวัตถุฝังตัวจริง ๆ และเราแสดงความสำคัญต่าง ๆ กัน ความสำคัญของเพชรหมายถึงว่ามันเป็นวัตถุที่ปลายด้านหนึ่ง แต่ความสำคัญเชิงหนึ่งของความหมายเดียวที่เรามีภายในสำนักพิมพ์หากเราปฏิบัติตามความสัมพันธ์นั้นเรามีวัตถุที่อยู่ฝังตัว ในการซักถาม JSON เราพบว่ามันเป็นโครงสร้างของวัตถุที่ฝังอยู่ในผู้อุปถัมภ์ แต่จริงๆแล้วมันถูกฝังเป็นอาร์เรย์ของวัตถุ เราเห็นว่าไม่เพียง แต่ผ่านตัวเชื่อมต่อเท่านั้น แต่ถ้าคุณดูเอนทิตีที่แท้จริงคุณจะเห็นว่าคุณเห็นที่อยู่ภายใต้ผู้อุปถัมภ์ซึ่งจัดว่าเป็นอาร์เรย์ของวัตถุด้วย คุณได้รับมุมมองที่สื่อความหมายอย่างมากว่าคุณจะนำสิ่งนั้นเข้ามาได้อย่างไร

และอีกครั้งตอนนี้สิ่งที่เราเห็นในไม่กี่วินาทีก็คือโมเดลเชิงสัมพันธ์ดั้งเดิมที่มีหลายระดับเราสามารถทำสิ่งเดียวกันกับ Hive ได้เราสามารถทำสิ่งเดียวกันกับ MongoDB และแหล่งข้อมูลขนาดใหญ่อื่น ๆ เช่น ดี. สิ่งที่เราสามารถทำได้และฉันแค่จะแสดงให้คุณเห็นอย่างรวดเร็วนี้คือฉันพูดคุยเกี่ยวกับความจริงของการนำสิ่งต่าง ๆ จากพื้นที่อื่น ฉันจะสมมติว่าฉันจะนำเข้าแบบจำลองจากฐานข้อมูลหรือวิศวกรรมย้อนกลับ แต่ฉันจะนำมาจากข้อมูลเมตาภายนอก เพียงเพื่อให้คุณได้รับมุมมองที่รวดเร็วของสิ่งต่าง ๆ ที่เราสามารถนำเข้ามาได้

อย่างที่คุณเห็นเรามีสิ่งต่าง ๆ มากมายที่เราสามารถนำข้อมูลเมตามาสู่สภาพแวดล้อมการสร้างแบบจำลองของเรา เริ่มจากสิ่งต่าง ๆ เช่น Amazon Redshift, Cassandra, แพลตฟอร์มข้อมูลขนาดใหญ่อื่น ๆ มากมายดังนั้นคุณจะเห็นรายการเหล่านี้มากมาย นี่คือตามลำดับตัวอักษร เราเห็นแหล่งข้อมูลขนาดใหญ่จำนวนมากและสิ่งนั้น นอกจากนี้เรายังเห็นสภาพแวดล้อมการสร้างแบบจำลองแบบดั้งเดิมหรือแบบเก่าจำนวนมากซึ่งเราสามารถนำข้อมูลเมตานั้นผ่าน ถ้าฉันผ่านที่นี่ - และฉันจะไม่ใช้เวลากับพวกเขาทุกคน - เราเห็นสิ่งต่าง ๆ มากมายที่เราสามารถนำมาจากในแง่ของการสร้างแบบจำลองแพลตฟอร์มและแพลตฟอร์มข้อมูล และสิ่งที่สำคัญมากที่ต้องตระหนักถึงที่นี่ก็เป็นอีกส่วนหนึ่งที่เราสามารถทำได้เมื่อเราเริ่มพูดคุยเกี่ยวกับ data lineage ใน Enterprise Team Edition เราสามารถสอบถามแหล่ง ETL ได้ไม่ว่าจะเป็นการแมป Talend หรือ SQL Server Information Services เราสามารถ ที่จริงแล้วนำมาใช้ในการเริ่มแผนภาพสายดาต้าของเราเช่นกันและวาดภาพสิ่งที่เกิดขึ้นในการเปลี่ยนแปลงเหล่านั้น โดยสิ้นเชิงจากกล่องเรามีสะพานที่แตกต่างกันกว่า 130 แห่งซึ่งเป็นส่วนหนึ่งของผลิตภัณฑ์ Enterprise Team Edition ดังนั้นจริง ๆ แล้วมันช่วยให้เราสามารถรวบรวมสิ่งประดิษฐ์ทั้งหมดในสภาพแวดล้อมแบบจำลองเดียวได้อย่างรวดเร็ว

ท้ายสุด แต่ไม่ท้ายสุดฉันต้องการพูดคุยเกี่ยวกับความจริงที่ว่าเราไม่สามารถมองข้ามความจริงที่ว่าเราต้องการโครงสร้างประเภทอื่นหากเรากำลังทำคลังข้อมูลหรือการวิเคราะห์ประเภทใด ๆ เรายังต้องการมีความสามารถในการทำสิ่งต่าง ๆ เช่นแบบจำลองมิติที่เรามีตารางข้อเท็จจริงและเรามีมิติและสิ่งต่าง ๆ เหล่านั้น สิ่งหนึ่งที่ฉันต้องการแสดงให้คุณเห็นเช่นกันคือเราสามารถมีส่วนขยายไปยังข้อมูลเมตาของเราที่ช่วยให้เราจัดหมวดหมู่ประเภทของมิติข้อมูลและทุกอย่างอื่น ดังนั้นหากฉันดูที่แท็บข้อมูลมิติที่นี่ตัวอย่างหนึ่งมันจะตรวจจับโดยอัตโนมัติตามรูปแบบของโมเดลที่เห็นและให้จุดเริ่มต้นว่าคุณคิดว่ามันเป็นมิติหรือ ตารางข้อเท็จจริง แต่นอกเหนือจากนั้นสิ่งที่เราสามารถทำได้คือภายในมิติและประเภทของสิ่งนั้นเรายังมีมิติประเภทต่าง ๆ ที่เราสามารถใช้เพื่อจำแนกข้อมูลในสภาพแวดล้อมประเภทคลังข้อมูลด้วย ความสามารถที่ทรงพลังมาก ๆ ที่เรากำลังเย็บเข้าด้วยกัน

ฉันจะกระโดดเข้าไปในนี้เนื่องจากฉันอยู่ในสภาพแวดล้อมการสาธิตในขณะนี้และแสดงให้คุณเห็นสองสามสิ่งอื่น ๆ ก่อนที่ฉันจะกระโดดกลับไปที่ภาพนิ่ง หนึ่งในสิ่งที่เราเพิ่งเพิ่มลงใน ER / Studio Data Architect คือเราพบสถานการณ์ - และนี่เป็นกรณีการใช้งานทั่วไปเมื่อคุณทำงานในโครงการ - นักพัฒนาคิดในแง่ของวัตถุในขณะที่ข้อมูลของเรา ผู้สร้างแบบจำลองมักจะคิดในแง่ของตารางและเอนทิตีและสิ่งประเภทนั้น นี่เป็นรูปแบบข้อมูลที่ง่ายมาก แต่มันแสดงถึงแนวคิดพื้นฐานบางประการที่นักพัฒนาหรือแม้แต่นักวิเคราะห์ธุรกิจหรือผู้ใช้ทางธุรกิจอาจคิดว่าเป็นวัตถุหรือแนวคิดทางธุรกิจที่แตกต่างกัน มันยากมากที่จะจำแนกสิ่งเหล่านี้จนกระทั่งตอนนี้ แต่สิ่งที่เราทำใน ER / Studio Enterprise Team Edition ในรีลีสปี 2016 คือตอนนี้เรามีแนวคิดที่เรียกว่า Business Data Objects และสิ่งที่ทำให้เราทำคือช่วยให้เราสามารถแค็ปซูลกลุ่มของเอนทิตีหรือตารางลงในออบเจ็กต์ธุรกิจที่แท้จริง

ตัวอย่างเช่นสิ่งที่เราได้มาที่นี่ในมุมมองใหม่นี้คือส่วนหัวใบสั่งซื้อและบรรทัดการสั่งซื้อถูกดึงเข้าด้วยกันตอนนี้พวกเขาถูกห่อหุ้มเป็นวัตถุเราจะคิดว่าพวกเขาเป็นหน่วยงานเมื่อเรายืนยันข้อมูล และเรารวบรวมพวกเขาเข้าด้วยกันดังนั้นจึงเป็นเรื่องง่ายมากที่จะเกี่ยวข้องกับผู้ชมที่แตกต่างกัน พวกเขากำลังนำมาใช้ซ้ำได้ตลอดทั้งสภาพแวดล้อมการสร้างแบบจำลอง พวกเขาเป็นวัตถุจริงไม่ใช่เพียงแค่การวาดรูป แต่เรายังได้รับประโยชน์เพิ่มเติมว่าเมื่อเราสื่อสารจากมุมมองของแบบจำลองจริงเราสามารถเลือกยุบหรือขยายพวกเขาเพื่อให้เราสามารถสร้างมุมมองสรุปสำหรับการสนทนากับผู้มีส่วนได้ส่วนเสีย และแน่นอนว่าเราสามารถให้มุมมองที่ละเอียดยิ่งขึ้นเหมือนที่เราเห็นที่นี่สำหรับผู้ชมด้านเทคนิคเพิ่มเติม มันทำให้เรามียานพาหนะในการสื่อสารที่ดีจริงๆ สิ่งที่เราเห็นตอนนี้คือการรวมรูปแบบต่าง ๆ หลายแบบเข้าด้วยกันโดยเพิ่มแนวคิดของวัตถุข้อมูลทางธุรกิจและตอนนี้ฉันจะพูดเกี่ยวกับวิธีที่เราใช้ความหมายเพิ่มเติมกับสิ่งเหล่านี้จริง ๆ และวิธีที่เรารวมเข้าด้วยกัน สภาพแวดล้อมโดยรวม

ฉันแค่พยายามหา WebEx ของฉันกลับมาที่นี่เพื่อที่ฉันจะสามารถทำได้ กลับไปที่สไลด์สุดฮอต ฉันจะเลื่อนไปข้างหน้าอย่างรวดเร็วไม่กี่สไลด์ที่นี่เพราะคุณได้เห็นสิ่งเหล่านี้ในรูปแบบการสาธิตแล้ว ฉันต้องการพูดเกี่ยวกับมาตรฐานการตั้งชื่ออย่างรวดเร็ว เราต้องการนำไปใช้และบังคับใช้มาตรฐานการตั้งชื่อที่แตกต่างกัน สิ่งที่เราต้องการทำคือเรามีความสามารถในการจัดเก็บเทมเพลตมาตรฐานการตั้งชื่อในที่เก็บของเราโดยทั่วไปจะสร้างความหมายนั้นผ่านคำหรือวลีหรือตัวย่อและมัดพวกเขากลับไปเป็นคำภาษาอังกฤษที่มีความหมาย เราจะใช้คำศัพท์ทางธุรกิจคำย่อสำหรับแต่ละคำและเราสามารถระบุคำสั่งกรณีและเพิ่มคำนำหน้าและคำต่อท้าย กรณีการใช้งานทั่วไปสำหรับกรณีนี้คือเมื่อผู้คนสร้างแบบจำลองเชิงตรรกะและจากนั้นจะก้าวไปข้างหน้าเพื่อสร้างแบบจำลองทางกายภาพที่พวกเขาอาจใช้ตัวย่อและทุกอย่างอื่น

สิ่งที่สวยงามคือมันทรงพลังและมีประสิทธิภาพยิ่งกว่าในการย้อนกลับหากเราสามารถบอกได้ว่ามาตรฐานการตั้งชื่อเหล่านั้นบางอย่างอยู่ในฐานข้อมูลทางกายภาพบางส่วนที่เราได้ออกแบบวิศวกรรมย้อนกลับเราสามารถใช้ตัวย่อเหล่านั้น คำและนำพวกเขาไปข้างหลังเป็นวลีภาษาอังกฤษ ตอนนี้เราสามารถหาชื่อที่ถูกต้องสำหรับข้อมูลของเรา อย่างที่ฉันพูดกรณีการใช้งานทั่วไปคือเราจะก้าวไปข้างหน้าตรรกะกับกายภาพและแมปที่เก็บข้อมูลและสิ่งประเภทนั้น หากคุณดูภาพหน้าจอทางด้านขวามือคุณจะเห็นว่ามีชื่อย่อจากชื่อแหล่งที่มาและเมื่อเราใช้เทมเพลตมาตรฐานการตั้งชื่อเราได้รับชื่อเต็มจริง ๆ แล้ว และเราสามารถใส่ช่องว่างและทุกอย่างเช่นนี้ถ้าเราต้องการขึ้นอยู่กับเทมเพลตมาตรฐานการตั้งชื่อที่เราใช้ เราสามารถทำให้มันดูได้ แต่เราต้องการให้มันเข้ามาในแบบจำลองของเรา เมื่อเรารู้ว่ามีบางสิ่งที่เรียกว่าจริง ๆ แล้วเราจะเริ่มแนบคำนิยามกับมันเพราะถ้าเรารู้ว่ามันคืออะไรเราจะใช้ความหมายกับมันได้อย่างไร?

สิ่งที่ดีคือเราสามารถเรียกสิ่งนี้ได้จริงเมื่อเราทำทุกสิ่ง ฉันพูดถึงวิศวกรรมย้อนกลับเราสามารถเรียกใช้แม่แบบมาตรฐานการตั้งชื่อได้พร้อมกันเมื่อเรากำลังทำวิศวกรรมย้อนกลับ ดังนั้นในขั้นตอนเดียวผ่านตัวช่วยสร้างสิ่งที่เราสามารถทำได้คือถ้าเรารู้ว่าอนุสัญญาคืออะไรเราสามารถทำวิศวกรรมฐานข้อมูลทางกายภาพกลับคืนมันจะนำมันกลับมาเป็นแบบจำลองทางกายภาพในสภาพแวดล้อมการสร้างแบบจำลองและ ก็จะใช้หลักการตั้งชื่อเหล่านั้นด้วย ดังนั้นเราจะเห็นว่าการแสดงชื่อเหมือนภาษาอังกฤษในรูปแบบโลจิคัลที่สอดคล้องกันในสภาพแวดล้อมอย่างไร เราสามารถทำมันและรวมเข้ากับการสร้าง XML Schema เพื่อให้เราสามารถทำแบบจำลองและผลักมันออกมาพร้อมกับตัวย่อของเราไม่ว่าเราจะทำ SOA frameworks หรือสิ่งประเภทนั้นดังนั้นเราจึงสามารถผลักดันการตั้งชื่อแบบต่างๆ ที่จริงเราเก็บไว้ในรูปแบบของตัวเอง มันทำให้เรามีความสามารถที่ทรงพลังมาก

นี่เป็นตัวอย่างของสิ่งที่ดูเหมือนว่าฉันมีแม่แบบ อันนี้แสดงให้เห็นจริง ๆ ว่าฉันมี EMP สำหรับ“ พนักงาน”, SAL สำหรับ“ เงินเดือน” PLN สำหรับ“ วางแผน” ในการประชุมมาตรฐานการตั้งชื่อ ฉันยังสามารถใช้พวกเขาเพื่อให้พวกเขาทำงานแบบโต้ตอบในขณะที่ฉันกำลังสร้างแบบจำลองและวางสิ่งต่าง ๆ ถ้าฉันใช้ตัวย่อนี้และฉันพิมพ์ใน "แผนการเงินเดือนของพนักงาน" ในชื่อนิติบุคคลมันจะทำหน้าที่แม่แบบมาตรฐานการตั้งชื่อ ฉันได้นิยามไว้ที่นี่แล้วมันจะให้ EMP_SAL_PLN แก่ฉันเมื่อฉันสร้างเอนทิตีและให้ชื่อทางกายภาพที่เกี่ยวข้องทันที

ดีอีกครั้งเมื่อเราออกแบบและส่งต่อวิศวกรรมเช่นกัน เรามีแนวคิดที่ไม่เหมือนใครและนี่คือจุดเริ่มต้นที่เราจะนำสภาพแวดล้อมเหล่านี้มารวมกัน และมันเรียกว่าการจับคู่แบบสากล เมื่อเรานำแบบจำลองเหล่านี้ทั้งหมดเข้าสู่สภาพแวดล้อมของเราแล้วสิ่งที่เราสามารถทำได้โดยสมมติว่าตอนนี้เราได้ใช้แบบแผนการตั้งชื่อเหล่านี้และพวกมันหาง่ายเราสามารถใช้โครงสร้างที่เรียกว่า Universal Mappings ใน ER / สตูดิโอ เราสามารถเชื่อมโยงเอนทิตี้ของรุ่นต่างๆได้ เมื่อใดก็ตามที่เราเห็น“ ลูกค้า” - เราอาจจะมี“ ลูกค้า” ในระบบที่แตกต่างกันและฐานข้อมูลที่แตกต่างกันมากมาย - เราสามารถเริ่มเชื่อมโยงทุกคนเข้าด้วยกันเพื่อที่เมื่อฉันทำงานกับมันในรุ่นเดียวฉัน สามารถดูว่าอาการของลูกค้าในรุ่นอื่น ๆ อยู่ที่ไหน และเนื่องจากเรามีโมเดลเลเยอร์ที่เป็นตัวแทนเราจึงสามารถผูกเข้ากับแหล่งข้อมูลและนำมาลงในที่ที่เราใช้สอบถามข้อมูลซึ่งฐานข้อมูลเหล่านี้อาศัยอยู่เช่นกัน มันทำให้เรามีความสามารถในการผูกทั้งหมดนี้เข้าด้วยกันอย่างแน่นหนา

ฉันแสดงให้คุณเห็นวัตถุข้อมูลทางธุรกิจ ฉันต้องการพูดคุยเกี่ยวกับส่วนขยายข้อมูลเมตาที่เราเรียกว่าไฟล์แนบอย่างรวดเร็ว มันช่วยให้เราสามารถสร้างข้อมูลเมตาเพิ่มเติมสำหรับวัตถุโมเดลของเราได้ บ่อยครั้งที่ฉันจะตั้งค่าคุณสมบัติประเภทนี้เพื่อขับเคลื่อนสิ่งต่าง ๆ มากมายจากมุมมองการกำกับดูแลข้อมูลและคุณภาพของข้อมูลและเพื่อช่วยเราในการจัดการข้อมูลหลักและนโยบายการเก็บข้อมูล แนวคิดพื้นฐานคือคุณสร้างการจำแนกประเภทเหล่านี้และคุณสามารถแนบได้ทุกที่ที่คุณต้องการในระดับตารางระดับคอลัมน์ประเภทของสิ่งเหล่านั้น แน่นอนกรณีการใช้งานที่พบบ่อยที่สุดคือเอนทิตีคือตารางและจากนั้นฉันสามารถกำหนด: วัตถุข้อมูลหลักของฉันคืออะไรตารางอ้างอิงของฉันคืออะไรตารางการทำธุรกรรมของฉันคืออะไร? จากมุมมองคุณภาพข้อมูลฉันสามารถจำแนกประเภทในแง่ของความสำคัญต่อธุรกิจเพื่อให้เราสามารถจัดลำดับความสำคัญของการล้างข้อมูลและประเภทของสิ่งนั้น

สิ่งที่มักถูกมองข้ามคือนโยบายการเก็บรักษาข้อมูลประเภทต่างๆในองค์กรของเราคืออะไร เราสามารถตั้งค่าเหล่านี้และเราสามารถแนบกับสิ่งประดิษฐ์ข้อมูลประเภทต่างๆในสภาพแวดล้อมการสร้างแบบจำลองของเราและแน่นอนที่เก็บของเราเช่นกัน ความสวยงามคือสิ่งที่แนบมาเหล่านี้อาศัยอยู่ในพจนานุกรมข้อมูลของเราดังนั้นเมื่อเราใช้พจนานุกรมข้อมูลองค์กรในสภาพแวดล้อมเราสามารถแนบไฟล์เหล่านี้กับหลายรุ่นได้ เราต้องกำหนดพวกเขาเพียงครั้งเดียวและเราสามารถใช้ประโยชน์จากพวกเขาซ้ำแล้วซ้ำอีกในโมเดลที่แตกต่างกันในสภาพแวดล้อมของเรา นี่เป็นเพียงสกรีนช็อตสั้น ๆ เพื่อแสดงว่าคุณสามารถระบุได้จริงเมื่อคุณทำสิ่งที่แนบมาชิ้นส่วนทั้งหมดที่คุณต้องการแนบ และตัวอย่างนี้ตรงนี้คือรายการค่าดังนั้นเมื่อพวกมันเข้าไปคุณสามารถเลือกจากรายการค่าคุณมีการควบคุมมากมายในสภาพแวดล้อมการสร้างแบบจำลองของสิ่งที่ถูกเลือกและคุณสามารถกำหนดสิ่งที่เป็นค่าเริ่มต้น value คือถ้าไม่ได้เลือกค่า ดังนั้นพลังงานมากมายที่นั่น พวกเขาอาศัยอยู่ในพจนานุกรมข้อมูล

บางสิ่งที่ฉันต้องการแสดงให้คุณเห็นอีกเล็กน้อยบนหน้าจอนี้นอกจากนี้คุณจะเห็นประเภทของสิ่งที่แนบมาที่ส่วนบนด้านล่างคุณเห็นข้อมูลความปลอดภัยของข้อมูล เราสามารถนำนโยบายความปลอดภัยของข้อมูลไปใช้กับข้อมูลต่างๆในสภาพแวดล้อมได้เช่นกัน สำหรับการแมปการปฏิบัติตามกฎระเบียบที่แตกต่างกันการจำแนกประเภทความปลอดภัยของข้อมูลเราจัดส่งจำนวนหนึ่งออกมาจากกล่องที่คุณสามารถสร้างและเริ่มใช้งานได้ แต่คุณสามารถกำหนดการแมปและมาตรฐานการปฏิบัติตามข้อกำหนดของคุณเองได้เช่นกัน ไม่ว่าคุณกำลังทำ HIPAA หรือโครงการอื่น ๆ และคุณสามารถเริ่มสร้างชุดข้อมูลเมตาที่สมบูรณ์แบบนี้ในสภาพแวดล้อมของคุณ

จากนั้นอภิธานศัพท์และข้อกำหนด - นี่คือสิ่งที่ความหมายทางธุรกิจเชื่อมโยงกันเรามักจะมีพจนานุกรมข้อมูลออกมาบ่อยครั้งที่องค์กรมักใช้เป็นจุดเริ่มต้นในการขับไล่อภิธานศัพท์ แต่คำศัพท์และการใช้คำฟุ่มเฟือยคือ มักเทคนิคมาก ดังนั้นสิ่งที่เราสามารถทำได้คือเราสามารถทำได้ถ้าเราต้องการใช้สิ่งเหล่านั้นเป็นจุดเริ่มต้นเพื่อขับไล่อภิธานศัพท์ แต่เราต้องการให้ธุรกิจเป็นเจ้าของสิ่งเหล่านี้ สิ่งที่เราทำในสภาพแวดล้อมเซิร์ฟเวอร์ทีมคือเราได้ให้ความสามารถแก่ผู้ใช้ในการสร้างคำจำกัดความทางธุรกิจและจากนั้นเราสามารถเชื่อมโยงพวกเขาไปยังสิ่งประดิษฐ์โมเดลต่างๆที่พวกเขาสอดคล้องกับในสภาพแวดล้อมการสร้างแบบจำลองเช่นกัน นอกจากนี้เรายังรับรู้ถึงจุดที่ถูกกล่าวถึงก่อนหน้านี้ซึ่งก็คือยิ่งมีคนพิมพ์มากเท่าไหร่ก็ยิ่งมีโอกาสเกิดข้อผิดพลาดของมนุษย์มากขึ้นเท่านั้น สิ่งที่เราทำในโครงสร้างอภิธานศัพท์ของเราคือหนึ่งเราสนับสนุนลำดับชั้นของอภิธานศัพท์เพื่อให้เราสามารถมีอภิธานศัพท์ประเภทต่าง ๆ หรือสิ่งต่าง ๆ ในองค์กร แต่ที่สำคัญคือถ้าคุณมีแหล่งข้อมูลเหล่านี้อยู่แล้ว ด้วยข้อกำหนดและทุกสิ่งที่กำหนดเราสามารถนำเข้า CSV เพื่อดึงสิ่งเหล่านี้ลงในสภาพแวดล้อมการสร้างแบบจำลองของเราและเซิร์ฟเวอร์ทีมของเราหรืออภิธานศัพท์ของเราเช่นกันจากนั้นเริ่มเชื่อมโยงจากที่นั่น และทุกครั้งที่มีการเปลี่ยนแปลงสิ่งที่มีหลักฐานการตรวจสอบอย่างเต็มรูปแบบของภาพก่อนและหลังในแง่ของคำจำกัดความและทุกอย่างและสิ่งที่คุณจะเห็นการมาในอนาคตอันใกล้นี้ก็เป็นขั้นตอนการอนุญาตมากกว่า เพื่อให้เราสามารถควบคุมได้ว่าใครเป็นผู้รับผิดชอบการอนุมัติโดยคณะกรรมการหรือบุคคลและประเภทของสิ่งนั้นเพื่อให้กระบวนการกำกับดูแลมีความแข็งแกร่งยิ่งขึ้นเมื่อเราก้าวไปข้างหน้า

สิ่งนี้ยังทำเพื่อเราคือเมื่อเรามีอภิธานศัพท์เหล่านี้ในอภิธานศัพท์เซิร์ฟเวอร์ทีมของเรานี่คือตัวอย่างของการแก้ไขในเอนทิตีในรูปแบบตัวเองที่ฉันได้นำขึ้นมาที่นี่ มันอาจมีการเชื่อมโยงคำศัพท์ แต่สิ่งที่เราทำก็คือถ้ามีคำที่อยู่ในอภิธานศัพท์นั้นที่ปรากฏในบันทึกย่อหรือคำอธิบายของสิ่งที่เรามีในหน่วยงานของเราที่นี่คำเหล่านั้นจะแสดงโดยอัตโนมัติในสีไฮเปอร์ลิงก์ที่อ่อนลง เลื่อนเมาส์ไปที่พวกเราจริง ๆ แล้วจะเห็นคำนิยามจากอภิธานศัพท์ทางธุรกิจเช่นกัน มันยังช่วยให้เรามีข้อมูลที่สมบูรณ์ยิ่งขึ้นเมื่อเราบริโภคข้อมูลเองด้วยคำศัพท์ทั้งหมดที่อยู่ข้างนอก มันช่วยเสริมประสบการณ์และใช้ความหมายกับทุกสิ่งที่เราทำงานด้วย

ดังนั้นอีกครั้งนั่นเป็นทางลัดที่เร็วมาก เห็นได้ชัดว่าเราสามารถใช้เวลาหลายวันกับเรื่องนี้ในขณะที่เราเจาะเข้าไปในส่วนต่าง ๆ แต่นี่เป็นการบินผ่านพื้นผิวที่รวดเร็วมาก สิ่งที่เราพยายามทำคือเข้าใจว่าสภาพแวดล้อมของข้อมูลที่ซับซ้อนนั้นเป็นอย่างไร เราต้องการปรับปรุงการเปิดเผยข้อมูลส่วนต่างๆเหล่านั้นทั้งหมดและทำงานร่วมกันเพื่อขับออกด้วย ER / Studio เราต้องการเปิดใช้งานการสร้างแบบจำลองข้อมูลที่มีประสิทธิภาพและอัตโนมัติมากขึ้น และนั่นคือข้อมูลทุกประเภทที่เรากำลังพูดถึงไม่ว่าจะเป็นข้อมูลขนาดใหญ่ข้อมูลเชิงสัมพันธ์แบบดั้งเดิมที่เก็บเอกสารหรือสิ่งอื่นใด และอีกครั้งเราประสบความสำเร็จเพราะเรามีความสามารถในการส่งต่อและวิศวกรรมย้อนกลับที่มีประสิทธิภาพสำหรับแพลตฟอร์มที่แตกต่างกันและเครื่องมืออื่น ๆ ที่คุณอาจมี และมันคือทั้งหมดที่เกี่ยวกับการแบ่งปันและการสื่อสารทั่วทั้งองค์กรกับผู้มีส่วนได้ส่วนเสียทั้งหมดที่เกี่ยวข้อง นั่นคือสิ่งที่เราใช้ความหมายผ่านมาตรฐานการตั้งชื่อ จากนั้นเราจะใช้คำจำกัดความผ่านอภิธานศัพท์ทางธุรกิจของเรา จากนั้นเราสามารถทำการจำแนกประเภทเพิ่มเติมสำหรับความสามารถด้านการกำกับดูแลอื่น ๆ ทั้งหมดของเราด้วยส่วนขยายข้อมูลเมตาเช่นส่วนขยายคุณภาพข้อมูลการจัดประเภทสำหรับการจัดการข้อมูลหลักหรือการจำแนกประเภทอื่น ๆ ที่คุณต้องการใช้กับข้อมูลนั้น จากนั้นเราสามารถสรุปเพิ่มเติมและปรับปรุงการสื่อสารให้มากขึ้นด้วยวัตถุข้อมูลทางธุรกิจกับกลุ่มผู้มีส่วนได้เสียที่แตกต่างกันโดยเฉพาะระหว่างผู้สร้างแบบจำลองและนักพัฒนา

และสิ่งที่สำคัญมากเกี่ยวกับสิ่งนี้คือสิ่งที่สำคัญคือพื้นที่เก็บข้อมูลแบบรวมที่มีความสามารถในการจัดการการเปลี่ยนแปลงที่แข็งแกร่งมาก ฉันไม่มีเวลาแสดงวันนี้เพราะมันค่อนข้างซับซ้อน แต่ที่เก็บมีความสามารถในการจัดการการเปลี่ยนแปลงและเส้นทางการตรวจสอบที่แข็งแกร่งมาก คุณสามารถตั้งชื่อรุ่นคุณสามารถตั้งชื่อรุ่นและเรายังมีความสามารถสำหรับผู้ที่กำลังทำการจัดการการเปลี่ยนแปลงเราสามารถผูกสิ่งนั้นไว้ในงานของคุณ เรามีความสามารถในวันนี้ที่จะนำงานเข้ามาและเชื่อมโยงการเปลี่ยนแปลงแบบจำลองของคุณกับงานเช่นเดียวกับนักพัฒนาที่จะเชื่อมโยงการเปลี่ยนแปลงรหัสของพวกเขากับงานหรือเรื่องราวของผู้ใช้ที่พวกเขากำลังทำงานด้วยเช่นกัน

นั่นเป็นภาพรวมที่รวดเร็วมาก ฉันหวังว่ามันจะเพียงพอที่จะปลุกความอยากอาหารของคุณเพื่อให้เราสามารถสนทนาอย่างลึกซึ้งยิ่งขึ้นในการแยกหัวข้อเหล่านี้บางส่วนเมื่อเราก้าวไปข้างหน้าในอนาคต ขอบคุณสำหรับเวลาของคุณและกลับมาหาคุณรีเบคก้า

Rebecca Jozwiak: ขอบคุณรอนที่วิเศษมากและฉันมีคำถามจากผู้ชมบ้างเล็กน้อย แต่ฉันต้องการให้นักวิเคราะห์ของเรามีโอกาสที่จะจมฟันของพวกเขาในสิ่งที่คุณต้องพูด เอริคฉันจะไปข้างหน้าและบางทีถ้าคุณต้องการที่จะอยู่สไลด์นี้หรือคนอื่นทำไมคุณไม่ไปก่อน หรือคำถามอื่น ๆ

Eric Little: แน่นอน ขออภัยคำถามคืออะไรรีเบคก้า คุณต้องการให้ฉันถามอะไรบางอย่างที่เฉพาะเจาะจงหรือ …

Rebecca Jozwiak: ฉันรู้ว่าคุณมีคำถามสำหรับรอนในตอนแรก หากคุณต้องการขอให้เขาพูดถึงสิ่งเหล่านี้หรือบางส่วนของพวกเขาออกจากสไลด์หรือสิ่งอื่นใดที่ทำให้คุณสนใจที่คุณอยากถาม? เกี่ยวกับฟังก์ชั่นการสร้างแบบจำลองของ IDERA

Eric Little: ใช่แล้วอย่างใดอย่างหนึ่งรอนดังนั้นคุณจะทำอย่างไรดูเหมือนว่าไดอะแกรมที่คุณแสดงเป็นไดอะแกรมความสัมพันธ์เอนทิตี้แบบทั่วไปเหมือนกับที่คุณใช้ในการสร้างฐานข้อมูลถูกต้องหรือไม่

Ron Huizenga: ใช่โดยทั่วไปแล้วพูด แต่แน่นอนว่าเรามีแบบขยายสำหรับร้านขายเอกสารและสิ่งประเภทนั้นเช่นกัน เราต่างจากสัญกรณ์เชิงสัมพันธ์ที่บริสุทธิ์จริง ๆ เราได้เพิ่มสัญลักษณ์เพิ่มเติมสำหรับร้านค้าเหล่านั้นด้วย

Eric Little: มีวิธีที่พวกคุณสามารถใช้การสร้างแบบจำลองกราฟแบบกราฟหรือไม่ดังนั้นจึงมีวิธีการรวมตัวอย่างเช่นสมมติว่าฉันมีบางอย่างที่เป็น Quadrant ยอดนิยมเครื่องมือแต่งเพลง TopBraid หรือฉันได้ทำบางสิ่งบางอย่าง ในProtégéหรือคุณก็รู้เช่นเดียวกับนักการเงินใน FIBO พวกเขาทำงานหลายอย่างในซีแมนทิกส์ RDF stuff - มีวิธีที่จะนำการสร้างแบบจำลองประเภทความสัมพันธ์เอนทิตี้ของกราฟมาใช้ในเครื่องมือนี้และใช้ประโยชน์ มัน?

Ron Huizenga: เรากำลังดูว่าเราสามารถจัดการกราฟได้อย่างไร เราไม่ได้จัดการฐานข้อมูลกราฟอย่างชัดเจนและสิ่งประเภทนี้ในวันนี้ แต่เรากำลังมองหาวิธีที่เราสามารถทำได้เพื่อขยายข้อมูลเมตาของเรา ฉันหมายความว่าเราสามารถนำสิ่งต่าง ๆ เข้ามาใน XML และสิ่งประเภทนั้นได้ในตอนนี้ถ้าอย่างน้อยเราก็สามารถแปล XML เพื่อนำมาเป็นจุดเริ่มต้นได้ แต่เรากำลังมองหาวิธีที่สง่างามกว่าในการนำสิ่งนั้นเข้ามา

และฉันยังแสดงให้คุณเห็นว่ารายการของวิศวกรรมสะพานย้อนกลับที่เรามีเช่นกันดังนั้นเราจึงมักจะมองหาการขยายไปยังบริดจ์เหล่านั้นสำหรับแพลตฟอร์มเฉพาะเช่นกัน มันเป็นความพยายามอย่างต่อเนื่องและต่อเนื่องหากเป็นไปได้ที่จะเริ่มใช้โครงสร้างใหม่เหล่านี้และแพลตฟอร์มที่แตกต่างกันออกไป แต่ฉันสามารถพูดได้ว่าเราอยู่ในระดับแนวหน้าในการทำเช่นนั้น สิ่งที่ฉันแสดงให้เห็นเช่น MongoDB และสิ่งประเภทนั้นเราเป็นผู้จำหน่ายข้อมูลแบบจำลองรายแรกที่ทำสิ่งนั้นในผลิตภัณฑ์ของเราเอง

Eric Little: โอเคใช่ ดังนั้นคำถามอื่นที่ฉันมีให้คุณก็คือในแง่ของการกำกับดูแลและการดูแลรักษา - เมื่อคุณใช้ตัวอย่างเมื่อคุณแสดงตัวอย่างของบุคคลที่เป็น "ลูกจ้าง" ฉันเชื่อว่ามันเป็น " เงินเดือน "จากนั้นคุณมี" แผน "มีวิธีจัดการอย่างไรตัวอย่างเช่นคนประเภทต่าง ๆ ที่อาจมี - สมมติว่าคุณมีสถาปัตยกรรมขนาดใหญ่ใช่ไหมสมมติว่าคุณมีองค์กรขนาดใหญ่และ ผู้คนเริ่มดึงสิ่งต่าง ๆ เข้าด้วยกันในเครื่องมือนี้และคุณมีกลุ่มหนึ่งตรงนี้ที่มีคำว่า "พนักงาน" และกลุ่มหนึ่งตรงนี้ที่มีคำว่า "คนงาน" และอีกคนหนึ่งที่นี่บอกว่า "เงินเดือน" และอีกคนพูดว่า “ค่าจ้าง”.

พวกคุณกระทบยอดและจัดการและควบคุมความแตกต่างเหล่านั้นอย่างไร? เพราะฉันรู้ว่าเราจะทำมันอย่างไรในโลกกราฟคุณรู้ว่าคุณจะใช้รายการคำเหมือนหรือคุณจะบอกว่ามีแนวคิดเดียวและมีคุณสมบัติหลายอย่างหรือคุณสามารถพูดในโมเดล SKOS ที่ฉันมีป้ายกำกับที่ต้องการและฉันมี ป้ายกำกับอื่น ๆ อีกมากมายที่ฉันสามารถใช้ได้ พวกคุณทำยังไง?

Ron Huizenga: เราทำได้หลายวิธีแล้วเรามาพูดถึงคำศัพท์ก่อนกัน แน่นอนว่าสิ่งหนึ่งที่เราทำคือเราต้องการให้มีคำศัพท์ที่กำหนดไว้หรือถูกลงโทษและในอภิธานศัพท์ทางธุรกิจที่เห็นได้ชัดคือที่ที่เราต้องการ และเราอนุญาตให้มีการเชื่อมโยงไปยังคำพ้องความหมายในอภิธานศัพท์ทางธุรกิจเช่นกันดังนั้นสิ่งที่คุณสามารถทำได้คือคุณสามารถพูดได้ว่านี่คือคำศัพท์ของฉัน แต่คุณยังสามารถกำหนดความหมายของคำพ้องความหมายทั้งหมด

แน่นอนว่าสิ่งที่น่าสนใจคือเมื่อคุณเริ่มมองข้ามภูมิทัศน์ข้อมูลอันกว้างใหญ่นี้กับระบบต่าง ๆ เหล่านี้ที่คุณออกไปข้างนอกคุณไม่สามารถออกไปที่นั่นและเปลี่ยนตารางที่เกี่ยวข้องและสิ่งต่าง ๆ เหล่านั้นเป็น สอดคล้องกับมาตรฐานการตั้งชื่อนั้นเนื่องจากอาจเป็นแพ็คเกจที่คุณซื้อดังนั้นคุณจึงไม่สามารถควบคุมการเปลี่ยนแปลงฐานข้อมูลหรือสิ่งใด ๆ ได้เลย

สิ่งที่เราสามารถทำได้นอกเหนือจากความสามารถในการเชื่อมโยงคำศัพท์อภิธานศัพท์คือผ่านการแมปสากลที่ฉันพูดคุยเกี่ยวกับสิ่งที่เราจะทำและชนิดของวิธีการที่แนะนำคือการมีแบบจำลองตรรกะครอบคลุมที่วางสิ่ง แนวคิดทางธุรกิจที่แตกต่างกันเหล่านี้คือสิ่งที่คุณกำลังพูดถึง ผูกคำศัพท์ทางธุรกิจลงในคำศัพท์เหล่านั้นและสิ่งที่ดีคือตอนนี้คุณมีโครงสร้างนี้ที่แสดงถึงเอนทิตีแบบโลจิคัลตามเดิมจากนั้นคุณสามารถเริ่มเชื่อมโยงจากเอนทิตีแบบลอจิคัลนั้นไปยังการใช้งานทั้งหมด ระบบต่าง ๆ

จากนั้นคุณต้องเห็นว่าคุณสามารถเห็นได้ว่า "คน" ที่นี่เรียกว่า "พนักงาน" ในระบบนี้ “ เงินเดือน” ที่นี่เรียกว่า“ ค่าจ้าง” ที่นี่ในระบบอื่นนี้ เพราะคุณจะเห็นว่าคุณจะเห็นการแสดงออกที่แตกต่างกันของสิ่งเหล่านั้นเพราะคุณได้เชื่อมโยงเข้าด้วยกัน

Eric Little: โอเคเยี่ยมเลยเข้าใจแล้ว ในแง่นั้นมันปลอดภัยหรือไม่ที่จะบอกว่าเป็นวิธีการเชิงวัตถุ

Ron Huizenga: ค่อนข้าง มันเข้มข้นขึ้นเล็กน้อยกว่าที่ฉันคิดว่าคุณสามารถพูดได้ ฉันหมายความว่าคุณสามารถใช้วิธีการเชื่อมโยงด้วยตนเองและผ่านการตรวจสอบและดำเนินการทั้งหมดด้วยเช่นกัน สิ่งหนึ่งที่ฉันไม่มีโอกาสพูดถึง - เพราะอีกครั้งเรามีความสามารถมากมาย - เรามีอินเทอร์เฟซแบบอัตโนมัติเต็มรูปแบบในเครื่องมือ Data Architect ด้วย และความสามารถของมาโครซึ่งเป็นภาษาโปรแกรมในเครื่องมือจริงๆ ดังนั้นเราสามารถทำสิ่งต่าง ๆ เช่นเขียนแมโครออกไปและซักถามและสร้างลิงก์ให้คุณ เราใช้สำหรับการนำเข้าและส่งออกข้อมูลเราสามารถใช้สำหรับการเปลี่ยนแปลงสิ่งต่าง ๆ หรือเพิ่มคุณสมบัติเหตุการณ์ตามโมเดลหรือเราสามารถใช้เพื่อรันเป็นแบทช์เพื่อออกไปและซักถามสิ่งต่าง ๆ และสร้างโครงสร้างที่แตกต่างกันใน แบบ มีอินเทอร์เฟซการทำงานอัตโนมัติเต็มรูปแบบที่ผู้คนสามารถใช้ประโยชน์ได้เช่นกัน และการใช้การจับคู่แบบสากลกับสิ่งเหล่านั้นจะเป็นวิธีที่ทรงพลังมากในการทำเช่นนั้น

Rebecca Jozwiak: โอเคขอบคุณรอนและขอบคุณเอริค นั่นเป็นคำถามที่ยอดเยี่ยม ฉันรู้ว่าเรากำลังวิ่งผ่านจุดสูงสุดของชั่วโมงเล็กน้อย แต่ฉันต้องการให้โอกาสกับ Malcolm เพื่อโยนคำถามบางอย่างในแบบของรอน มัลคอล์?

Malcolm Chisholm: ขอบคุณรีเบคก้า ดังนั้นรอนมันน่าสนใจมากฉันเห็นว่ามีความสามารถมากมายที่นี่ หนึ่งในพื้นที่ที่ฉันสนใจมากคือถ้าเรามีโครงการพัฒนาคุณจะเห็นตัวสร้างข้อมูลโดยใช้ความสามารถเหล่านี้และทำงานร่วมกับนักวิเคราะห์ธุรกิจกับนักวิเคราะห์ข้อมูลกับนักวิเคราะห์คุณภาพข้อมูลได้อย่างไร และกับผู้สนับสนุนทางธุรกิจที่ในที่สุดจะต้องรับผิดชอบต่อความต้องการข้อมูลที่แท้จริงในโครงการ คุณรู้หรือไม่ว่าตัวสร้างข้อมูลจริง ๆ ทำให้โครงการมีประสิทธิภาพและประสิทธิผลมากขึ้นด้วยความสามารถที่เรากำลังมองหา

Ron Huizenga: ฉันคิดว่าสิ่งแรกที่คุณต้องทำคือเป็น data modeler - และฉันไม่ได้ตั้งใจเลือก modeler แต่ฉันจะทำต่อไป - คนบางคนยังมีความรู้สึกว่า ตัวสร้างข้อมูลเป็นประเภทของผู้รักษาประตูจริงๆเรากำลังกำหนดวิธีการทำงานเราเป็นผู้พิทักษ์ที่ทำให้แน่ใจว่าทุกอย่างถูกต้อง

ขณะนี้มีแง่มุมหนึ่งที่คุณต้องตรวจสอบให้แน่ใจว่าคุณได้กำหนดสถาปัตยกรรมข้อมูลเสียงและทุกอย่างอื่น แต่สิ่งที่สำคัญกว่านั้นก็คือในฐานะผู้สร้างแบบจำลองข้อมูล - และฉันพบว่ามันค่อนข้างชัดเจนเมื่อฉันให้คำปรึกษา - คุณต้องเป็นผู้อำนวยความสะดวกดังนั้นคุณต้องดึงคนเหล่านี้มารวมกัน

มันจะไม่เป็นการออกแบบสร้างและสร้างฐานข้อมูลอีกต่อไป - สิ่งที่คุณต้องทำคือคุณต้องสามารถทำงานกับกลุ่มผู้มีส่วนได้เสียต่าง ๆ เหล่านี้ทำสิ่งต่าง ๆ เช่นวิศวกรรมย้อนกลับการนำเข้าข้อมูลมี คนอื่น ๆ ทำงานร่วมกันไม่ว่าจะเป็นในอภิธานศัพท์หรือเอกสารทุกอย่างเช่นนั้น - และเป็นผู้อำนวยความสะดวกในการดึงสิ่งนี้ลงในที่เก็บและเชื่อมโยงแนวคิดเข้าด้วยกันในที่เก็บและทำงานกับคนเหล่านั้น

มันเป็นสภาพแวดล้อมการทำงานร่วมกันที่หลากหลายซึ่งแม้ผ่านการกำหนดภารกิจหรือแม้แต่หัวข้อการสนทนาหรือประเภทของสิ่งที่เรามีในเซิร์ฟเวอร์ทีมที่ผู้คนสามารถทำงานร่วมกันจริง ๆ ถามคำถามและมาถึงผลิตภัณฑ์สุดท้ายที่พวกเขา ต้องการสถาปัตยกรรมข้อมูลและองค์กรของพวกเขา คำตอบนั้นใช่ไหม

Malcolm Chisholm: ใช่ฉันเห็นด้วย คุณรู้ไหมฉันคิดว่าทักษะการอำนวยความสะดวกเป็นสิ่งที่ต้องการอย่างมากในตัวสร้างข้อมูล ฉันเห็นด้วยว่าเราไม่เห็นเสมอไป แต่ฉันคิดว่ามันจำเป็นและฉันขอแนะนำว่าบางครั้งความโน้มเอียงที่จะอยู่ในมุมของคุณในการสร้างแบบจำลองข้อมูลของคุณ แต่คุณต้องทำงานกับกลุ่มผู้มีส่วนได้เสียอื่น ๆ หรือคุณเพียงแค่ไม่เข้าใจสภาพแวดล้อมของข้อมูลที่คุณกำลังเผชิญอยู่และฉันคิดว่ารูปแบบนั้นได้รับผลกระทบ แต่นั่นเป็นเพียงความคิดเห็นของฉัน

Ron Huizenga: และมันน่าสนใจเพราะคุณพูดถึงบางสิ่งก่อนหน้านี้ในสไลด์ของคุณเกี่ยวกับประวัติศาสตร์ว่าธุรกิจหันเหความสนใจไปจากไอทีอย่างไรเพราะพวกเขาไม่ได้นำเสนอโซลูชั่นในเวลาที่เหมาะสมและสิ่งต่าง ๆ เหล่านั้น

มันน่าสนใจมากที่ในการให้คำปรึกษาในภายหลังของฉันก่อนที่จะเป็นผู้จัดการผลิตภัณฑ์โครงการส่วนใหญ่ที่ฉันทำในช่วงสองปีที่ผ่านมาได้รับการสนับสนุนทางธุรกิจซึ่งเป็นธุรกิจที่ขับเคลื่อนและสถาปนิกด้านข้อมูล และผู้สร้างแบบจำลองไม่ได้เป็นส่วนหนึ่งของไอที เราเป็นส่วนหนึ่งของกลุ่มที่สนับสนุนธุรกิจและเราอยู่ที่นั่นในฐานะผู้อำนวยความสะดวกในการทำงานกับทีมส่วนที่เหลือของโครงการ

Malcolm Chisholm: ฉันคิดว่านั่นเป็นจุดที่น่าสนใจมาก ฉันคิดว่าเราเริ่มเห็นการเปลี่ยนแปลงในโลกธุรกิจที่ธุรกิจกำลังขอหรือคิดว่าอาจจะไม่มากเท่าที่ฉันจะทำกระบวนการในการดำเนินการ แต่พวกเขาก็เริ่มคิดว่าข้อมูลคืออะไร ที่ฉันทำงานด้วยคืออะไรต้องการข้อมูลของฉันคืออะไรข้อมูลที่ฉันจัดการกับเป็นข้อมูลและเท่าไหร่เราจะได้รับผลิตภัณฑ์และความสามารถของ IDERA เพื่อสนับสนุนมุมมองนั้นและฉันคิดว่าความต้องการของธุรกิจแม้ แม้ว่ามันจะยังค่อนข้างตั้งไข่นิดหน่อย

Ron Huizenga: ฉันเห็นด้วยกับคุณและฉันคิดว่าเราเห็นมันเป็นอย่างนั้นมากขึ้นเรื่อย ๆ เราเคยเห็นการตื่นขึ้นมาแล้วและคุณสัมผัสมันมาก่อนหน้านี้ในแง่ของความสำคัญของข้อมูล เราเห็นความสำคัญของข้อมูลในช่วงต้นของไอทีหรือในวิวัฒนาการของฐานข้อมูลเมื่อคุณบอกว่าเราเข้าสู่วงจรการจัดการกระบวนการทั้งหมด - และกระบวนการมีความสำคัญอย่างยิ่งอย่าเข้าใจฉันผิด - แต่ตอนนี้เกิดอะไรขึ้น คือเมื่อสิ่งนั้นเกิดขึ้นข้อมูลที่โฟกัสหายไป

และตอนนี้องค์กรต่างๆกำลังตระหนักว่าข้อมูลเป็นจุดสำคัญ ข้อมูลหมายถึงทุกสิ่งที่เราทำในธุรกิจของเราดังนั้นเราจึงจำเป็นต้องตรวจสอบให้แน่ใจว่าเรามีข้อมูลที่ถูกต้องเพื่อให้เราสามารถค้นหาข้อมูลที่ถูกต้องที่เราต้องการในการตัดสินใจของเรา เพราะไม่ใช่ทุกอย่างมาจากกระบวนการที่กำหนดไว้ ข้อมูลบางอย่างเป็นผลพลอยได้จากสิ่งอื่นและเรายังต้องสามารถค้นหาได้รู้ว่ามันหมายถึงอะไรและสามารถแปลข้อมูลที่เราเห็นว่าเป็นความรู้ที่เราสามารถนำมาใช้เพื่อขับเคลื่อนธุรกิจของเราได้ดีขึ้น

Malcolm Chisholm: ถูกต้องและตอนนี้อีกพื้นที่ที่ฉันต้องดิ้นรนคือสิ่งที่ฉันจะเรียกว่าวงจรชีวิตของข้อมูลซึ่งก็คือถ้าคุณดูที่ห่วงโซ่อุปทานของข้อมูลที่จะผ่านองค์กรเราจะเริ่มด้วย การได้มาซึ่งข้อมูลหรือการเก็บข้อมูลซึ่งอาจเป็นการป้อนข้อมูล แต่อาจเท่ากันฉันกำลังรับข้อมูลจากภายนอกองค์กรจากผู้จำหน่ายข้อมูลบางราย

จากการจับข้อมูลเราไปที่การบำรุงรักษาข้อมูลที่ฉันคิดเกี่ยวกับการทำให้ข้อมูลนี้เป็นมาตรฐานและส่งไปยังสถานที่ที่ต้องการ จากนั้นใช้ข้อมูลจุดที่แท้จริงของข้อมูลคุณจะได้ค่าจากข้อมูล

และในสมัยก่อนสิ่งเหล่านี้เกิดขึ้นในรูปแบบเดียว แต่ในวันนี้คุณอาจจะรู้ว่ามีสภาพแวดล้อมการวิเคราะห์เช่นจากนั้นเป็นที่เก็บถาวรร้านค้าที่เราใส่ข้อมูลเมื่อเราไม่ได้อยู่อีกต่อไป ต้องการมันและในที่สุดก็เป็นกระบวนการล้างข้อมูล คุณเห็นการสร้างแบบจำลองข้อมูลที่เหมาะสมในการจัดการวงจรข้อมูลทั้งหมดนี้อย่างไร

Ron Huizenga: นั่นเป็นคำถามที่ดีมากและสิ่งหนึ่งที่ฉันไม่ได้มีเวลาที่จะเจาะลึกลงไปในรายละเอียดใด ๆ ที่นี่ในวันนี้คือสิ่งที่เราเริ่มพูดถึงคือสายข้อมูล ดังนั้นสิ่งที่เราสามารถทำได้จริง ๆ ก็คือเรามีความสามารถของสายดาต้าในเครื่องมือของเราและอย่างที่ฉันบอกว่าเราสามารถดึงบางส่วนจากเครื่องมือ ETL แต่คุณสามารถแมปมันได้ด้วยการวาดสายเลือดเช่นกัน โมเดลข้อมูลหรือฐานข้อมูลใด ๆ ที่เราจับภาพและนำมาเป็นโมเดลเราสามารถอ้างอิงโครงสร้างจากนั้นในไดอะแกรมสายเลือดข้อมูลของเรา

สิ่งที่เราสามารถทำได้คือวาดการไหลของข้อมูลอย่างที่คุณพูดตั้งแต่ต้นทางถึงเป้าหมายและตลอดวงจรชีวิตโดยรวมของวิธีการที่ข้อมูลส่งผ่านระบบต่าง ๆ และสิ่งที่คุณกำลังหาคือเอาพนักงานกัน data - เป็นหนึ่งในรายการโปรดของฉันตามโครงการที่ฉันทำเมื่อหลายปีก่อน ฉันทำงานกับองค์กรที่มีข้อมูลพนักงานใน 30 ระบบที่แตกต่างกัน สิ่งที่เราทำลงไปที่นั่น - และรีเบคก้าก็โผล่ขึ้นมาสไลด์ข้อมูลดาต้าไลน์ - นี่คือสไลด์ข้อมูลดาต้าไลน์ที่ค่อนข้างง่าย แต่สิ่งที่เราสามารถทำได้คือนำโครงสร้างข้อมูลทั้งหมดมาอ้างอิงในแผนภาพแล้วเรา จริง ๆ แล้วสามารถเริ่มดูว่ากระแสระหว่างอะไรและหน่วยงานข้อมูลที่แตกต่างกันเหล่านั้นเชื่อมโยงกันในกระแสอย่างไร และเราสามารถไปได้ไกลกว่านั้นเช่นกัน นี่เป็นส่วนหนึ่งของ data flow หรือแผนภาพ lineage ที่เราเห็นที่นี่ หากคุณต้องการที่จะไปให้ไกลกว่านั้นเรายังมีส่วนธุรกิจสถาปนิกของชุดนี้และสิ่งเดียวกันใช้ที่นั่น

โครงสร้างข้อมูลใด ๆ ที่เราบันทึกไว้ในสภาพแวดล้อมการสร้างแบบจำลองข้อมูลนั้นสามารถอ้างอิงได้ในเครื่องมือสร้างแบบจำลองทางธุรกิจดังนั้นแม้ในแผนภาพรูปแบบธุรกิจของคุณหรือแผนภาพกระบวนการทางธุรกิจของคุณคุณสามารถอ้างอิงที่เก็บข้อมูลแต่ละรายการได้หากคุณต้องการ สภาพแวดล้อมการสร้างแบบจำลองข้อมูลและในขณะที่คุณกำลังใช้งานในโฟลเดอร์ในรูปแบบกระบวนการทางธุรกิจของคุณคุณสามารถระบุ CRUD ในสภาพแวดล้อมเหล่านั้นได้เช่นกันรวมถึงวิธีที่ข้อมูลนั้นถูกบริโภคหรือผลิตออกมาและจากนั้นเราสามารถเริ่มสร้าง สิ่งต่างๆเช่นรายงานผลกระทบและการวิเคราะห์และไดอะแกรมจากนั้น

สิ่งที่เราตั้งเป้าหมายไว้และเรามีความสามารถมากมาย แต่หนึ่งในสิ่งที่เรามีเหมือนเสาประตูที่เรากำลังดูอยู่ขณะที่เราพัฒนาเครื่องมือของเราต่อไป สามารถที่จะแมปออกมาจากต้นจนจบสายดาต้าขององค์กรและวงจรชีวิตของข้อมูลทั้งหมด

Malcolm Chisholm: โอเค รีเบคก้าฉันได้รับอนุญาตอีกแล้วหรือยัง

Rebecca Jozwiak: ฉันจะยอมให้คุณอีกมัลคอล์มไปข้างหน้า

Malcolm Chisholm: ขอบคุณมาก การคิดเกี่ยวกับการกำกับดูแลข้อมูลและการคิดเกี่ยวกับการสร้างแบบจำลองข้อมูลเราจะให้ทั้งสองกลุ่มทำงานร่วมกันอย่างมีประสิทธิภาพและเข้าใจซึ่งกันและกันได้อย่างไร

Eric Little: มันน่าสนใจฉันคิดว่ามันขึ้นอยู่กับองค์กรจริงๆและมันกลับไปที่แนวคิดก่อนหน้าของฉันคือในองค์กรเหล่านั้นที่ความคิดริเริ่มเป็นแรงผลักดันทางธุรกิจที่เราเชื่อมโยงเข้าด้วยกันตัวอย่างเช่นฉันเป็นผู้นำสถาปัตยกรรมข้อมูล ทีมงาน แต่เราเชื่อมโยงกับผู้ใช้ทางธุรกิจและเราได้ช่วยพวกเขาในการจัดการข้อมูล อีกครั้งวิธีการให้คำปรึกษามากขึ้น แต่มันเป็นเรื่องของฟังก์ชั่นทางธุรกิจมากขึ้น

สิ่งที่คุณต้องทำก็คือคุณต้องการตัวสร้างข้อมูลและสถาปนิกที่เข้าใจธุรกิจจริง ๆ สามารถเชื่อมโยงกับผู้ใช้ทางธุรกิจและช่วยให้พวกเขายืนหยัดในกระบวนการกำกับดูแล ธุรกิจต้องการทำ แต่โดยทั่วไปแล้วเรามีความรู้ด้านเทคโนโลยีที่สามารถช่วยให้พวกเขาโดดเด่นในประเภทของโปรแกรมเหล่านั้น มันจะต้องมีการทำงานร่วมกัน แต่ไม่จำเป็นต้องเป็นเจ้าของธุรกิจ

Malcolm Chisholm: โอเคเยี่ยมมาก ขอขอบคุณ.

Dr. Eric Little: โอเค

Rebecca Jozwiak: โอเคขอบคุณมาก สมาชิกผู้ชมฉันเกรงว่าเราไม่ได้รับคำถามของคุณ แต่ฉันจะทำให้แน่ใจว่าพวกเขาจะได้รับการส่งต่อไปยังแขกที่เหมาะสมที่เรามีในบรรทัดในวันนี้ ฉันต้องการขอบคุณมากสำหรับ Eric, Malcolm และ Ron ที่เป็นแขกของเราในวันนี้ นี่คือสิ่งที่ดีมากคน และถ้าคุณสนุกกับการออกอากาศทางเว็บของ IDERA ในวันนี้ IDERA ก็จะเป็น Hot Technologies ในวันพุธหน้าหากคุณต้องการเข้าร่วมพูดคุยเกี่ยวกับความท้าทายของการจัดทำดัชนีและ Oracles ดังนั้นหัวข้อที่น่าสนใจอีกเรื่องหนึ่ง

ขอบคุณมากคนดูแลและเราจะพบคุณในครั้งต่อไป ลาก่อน.

การสร้างสถาปัตยกรรมข้อมูลที่ขับเคลื่อนด้วยธุรกิจ