บ้าน ซอฟต์แวร์ การสังเคราะห์เสียงพูดคืออะไร? - คำจำกัดความจาก techopedia

การสังเคราะห์เสียงพูดคืออะไร? - คำจำกัดความจาก techopedia

สารบัญ:

Anonim

คำจำกัดความ - การสังเคราะห์เสียงพูดหมายถึงอะไร

การสังเคราะห์เสียงพูดคือการจำลองการพูดของมนุษย์ด้วยคอมพิวเตอร์หรืออุปกรณ์อื่น การจดจำเสียงการสังเคราะห์เสียงพูดส่วนใหญ่จะใช้สำหรับการแปลข้อมูลข้อความเป็นข้อมูลเสียงและในแอปพลิเคชันเช่นบริการที่เปิดใช้งานเสียงและแอปพลิเคชั่นมือถือ นอกจากนี้ยังใช้ในเทคโนโลยีช่วยเหลือสำหรับการช่วยเหลือบุคคลที่มีความบกพร่องทางการมองเห็นในการอ่านเนื้อหาข้อความ

Techopedia อธิบายการสังเคราะห์เสียงพูด

VODER ของโฮเมอร์ดัดลีย์ซึ่งมีพื้นฐานมาจากเสียงร้องจาก Bell Laboratories ถือเป็นซินธิไซเซอร์เสียงที่ทำงานได้อย่างสมบูรณ์เครื่องแรก คอมพิวเตอร์ที่ใช้ในการสังเคราะห์เสียงพูดเรียกว่าเครื่องสังเคราะห์เสียงพูดหรือคอมพิวเตอร์พูด คุณภาพของคอมพิวเตอร์คำพูดมักถูกตัดสินโดยความคล้ายคลึงกับเสียงของมนุษย์ ระบบปฏิบัติการคอมพิวเตอร์ส่วนใหญ่มีการสังเคราะห์เสียงพูดมาตั้งแต่ต้นทศวรรษ 1990 คำพูดที่สังเคราะห์มักจะสร้างขึ้นด้วยความช่วยเหลือในการเชื่อมชิ้นส่วนของคำพูดที่บันทึกไว้ซึ่งมีอยู่ในฐานข้อมูล

ขั้นตอนแรกในการสังเคราะห์เสียงพูดคือการประมวลผลล่วงหน้าซึ่งจะกำจัดความคลุมเครือที่อยู่รอบ ๆ ลักษณะที่จำเป็นต้องอ่านคำเฉพาะและซึ่งรวมถึงการจัดการคำพ้องเสียงด้วย ในขั้นตอนต่อไปของการสังเคราะห์เสียงพูดคอมพิวเตอร์ใช้ความช่วยเหลือของหน่วยเสียงในการแปลงข้อความเป็นลำดับของเสียง ขั้นตอนสุดท้ายเกี่ยวข้องกับการใช้การบันทึกเสียงของมนุษย์หรือเทคนิคการสร้างเสียงขั้นพื้นฐานเพื่อเลียนแบบกลไกเสียงของมนุษย์และอ่านข้อความทั้งหมด หนึ่งในสาขาที่ได้รับความนิยมในการสังเคราะห์เสียงพูดคือการสังเคราะห์เสียงพูดด้วยภาพหรือการสังเคราะห์เสียงพูดแบบหลายคำซึ่งใช้การเคลื่อนไหวของใบหน้าที่มีการซิงโครไนซ์อย่างแน่นหนาเพื่อเติมเต็มการพูดสังเคราะห์ การสังเคราะห์เสียงพูดแบบ Multimodal ยังรวมคุณสมบัติเพิ่มเติมเช่นตัวชี้นำที่ไม่ใช่คำพูดเข้ากับคำพูดเพื่อช่วยในการสื่อสารคำของผู้ใช้ด้วยความแม่นยำมากขึ้น ระบบสังเคราะห์เสียงพูดหลายแบบให้ผู้ใช้สามารถเลือกประเภทของเสียงเช่นเสียงชายหรือหญิง

ระบบสังเคราะห์เสียงพูดส่วนใหญ่มีความสามารถในการอ่านข้อความและส่งออกในลักษณะที่ชาญฉลาดมากแม้ว่าบางครั้งเสียงอาจจะน่าเบื่อ อย่างไรก็ตามการสังเคราะห์เสียงพูดนั้นยังไม่ได้พัฒนาความสามารถในการเลียนแบบกระแสความกว้างและจังหวะของมนุษย์อย่างเต็มที่

การสังเคราะห์เสียงพูดคืออะไร? - คำจำกัดความจาก techopedia