Q:
ความแตกต่างระหว่างคำพูดเป็นข้อความและ chatbots คืออะไร?
A:ความแตกต่างที่สำคัญมากมายระหว่างเทคโนโลยีเสียงพูดเป็นข้อความและแชทบอทเป็นส่วนหนึ่งของสิ่งที่กำลังถูกตรวจสอบในวิวัฒนาการอย่างรวดเร็วของโครงการแชทบ็อตและ Voicebot
เทคโนโลยีเสียงพูดเป็นข้อความเป็นเพียงเทคโนโลยีที่แปลงเสียงพูดเป็นข้อความในหน้าดิจิตอล นั่นเป็นฟังก์ชั่นเต็มรูปแบบ แต่ไม่ใช่เรื่องง่ายที่จะออกแบบ เพื่อที่จะแปลงเสียงพูดเป็นข้อความเทคโนโลยีจะต้องแบ่งคำและประโยคออกเป็นหน่วยเสียงแต่ละส่วนและทำงานร่วมกับพวกเขาตามอัลกอริทึมที่ซับซ้อนเพื่อสร้างข้อความที่ถูกต้องและแสดงถึงสิ่งที่ผู้พูดพูด
ในทางตรงกันข้าม Chatbots เป็นเทคโนโลยีที่บรรลุเป้าหมายในการสื่อสารกับมนุษย์ chatbots มีสองประเภทคือ: ข้อความ chatbots และ voicebots ข้อความแชทได้นานขึ้นมากเพราะพวกเขาไม่ต้องการองค์ประกอบเสียงพูดเป็นข้อความที่ VoiceBots ใช้
ความแตกต่างที่สำคัญระหว่างเทคโนโลยีเสียงพูดเป็นข้อความและแชทบอทคือขอบเขต ดังที่กล่าวไว้เทคโนโลยีการพูดเป็นข้อความทั้งหมดที่ต้องทำคือการถอดเสียงการพูดด้วยวาจา ในอีกด้านหนึ่ง chatbot จำเป็นต้องพูดในรูปแบบใดก็ตามที่ทำเพื่อทำความเข้าใจและให้การตอบสนองที่พยายามที่จะผ่านการทดสอบทัวริง - การทดสอบว่าเทคโนโลยีสามารถหลอกมนุษย์ในการคิดว่าเขาหรือเธอเป็น พูดกับบุคคลอื่น
เมื่อพิจารณาแล้วแชทบ็อตก็ง่ายกว่าการสร้างวอยซ์บอท chatbot ใช้ข้อความของมนุษย์และให้การตอบสนองข้อความ แม้กระทั่งแชทบ็อตที่ค่อนข้างเรียบง่ายก็สามารถให้ผลลัพธ์ที่น่าสนใจและสนุกสนานสำหรับมนุษย์มาตั้งแต่ช่วงปลายทศวรรษ 1980 และต้นปี 1990
ในขณะที่ Voicebot ต้องพูดด้วยวาจาแปลงเป็นข้อความตรวจสอบความถูกต้องสร้างการตอบสนองและสร้างการตอบสนองจากภาษาเครื่องเป็นเสียงพูด งานที่มีความสำคัญพอสมควรจำนวนมากนี้ทำให้ Voicebot ใช้พลังงานในการคำนวณจำนวนมากและมีการออกแบบมากมาย
โครงการอย่าง Siri, Cortana และ Alexa แสดงให้เห็นถึงส่วนหนึ่งของแนวหน้าของเทคโนโลยี Voicebot พวกเขายังแสดงให้เห็นว่าเทคโนโลยีนี้ยังอยู่ในวัยเด็ก แม้ว่า Alexa และเทคโนโลยีอื่น ๆ สามารถตอบสนองด้วยวาจาต่อคำพูดของมนุษย์ แต่พวกเขาก็ไม่สามารถที่จะเชื่อมโยงกับวาจาของมนุษย์โดยทั่วไปได้ กล่าวอีกนัยหนึ่งมีข้อ จำกัด เล็กน้อยต่อการตอบสนองที่เทคโนโลยีเหล่านี้สามารถให้ได้ มีแม้กระทั่งความสามารถที่ จำกัด ของผู้ช่วยส่วนตัวรุ่นปัจจุบันในการสร้างคำพูดเป็นข้อความตัวอย่างเช่นเพื่อวัตถุประสงค์ในการถอดความอีเมลหรือช่วยให้คนเขียนเรียงความโดยไม่ต้องใช้มือ โปรแกรมคำพูดเป็นข้อความที่เฉพาะเจาะจงบางอย่างในตลาดทำได้ดีกว่า Siri หรือ Cortana อาจเป็นเพราะการจัดสรรทรัพยากร อย่างไรก็ตามมีสัญญาณว่าความคืบหน้าของ Voicebot กำลังจะเกิดขึ้นในไม่ช้าเช่นแพลตฟอร์ม Lex ของ Amazon ที่ช่วยให้สภาพแวดล้อมของสตูดิโอสำหรับการสร้างเทคโนโลยีประเภทนี้
ในบทความที่ฉลาดและให้ความรู้เกี่ยวกับเรื่องนี้โทเบียสโกเบลพูดถึงความแตกต่างระหว่างเทคโนโลยีเหล่านี้ซึ่งแตกต่างจากกระบวนการของการ "ถอดความ" ซึ่งการพูดกับข้อความทำเพื่องานแห่งความเข้าใจซึ่งแชทบอทควรทำอะไร
“ แม้ว่าการขจัดความจำเป็นในการรู้จำเสียงจะช่วยให้แชทบ็อตเป็นเรื่องง่ายขึ้น แต่ความท้าทายหลักในการสร้างบอทสำหรับการทำงานนั้นขึ้นอยู่กับการทำความเข้าใจภาษาธรรมชาติ” โกเบลเขียน
Goebel ยังระบุผู้เล่นปัจจุบันจำนวนมากในอุตสาหกรรม:
ผู้นำตลาดสำหรับการรู้จำเสียงคือ Nuance ซึ่งอยู่เบื้องหลังระบบที่รู้จักกันดีเช่น Dragon NaturallySpeaking สำหรับการเขียนตามคำบอกบนพีซีซึ่งมีมาตั้งแต่ยุคเก้าสิบ แต่ยัง Siri: การรู้จำเสียง / งานถอดความที่ดำเนินการในระบบคลาวด์ของ Apple เทคโนโลยีแตกต่างกันเล็กน้อยเบื้องหลัง คนอื่น ๆ คือ LumenVox, Verbio หรือ Interactions แต่ตอนนี้การรู้จำเสียงได้ถูกนำเสนอเป็นบริการคลาวด์ผ่าน APIs โดยชอบของ Amazon, Google, Microsoft และ IBM
ในขณะที่ chatbots พัฒนาขึ้นมันก็สันนิษฐานว่าความเข้าใจของพวกเขาจะเพิ่มขึ้นอย่างต่อเนื่องในเส้นทางการเคลื่อนที่ - และมันก็ยังสันนิษฐานว่าเทคโนโลยีบ็อตอื่น ๆ จะผ่านจากอินเตอร์เฟสข้อความไปยังอินเตอร์เฟสด้วยวาจา
