บ้าน ซอฟต์แวร์ เทคโนโลยีการจดจำเสียง: มีประโยชน์หรือเจ็บปวด?

เทคโนโลยีการจดจำเสียง: มีประโยชน์หรือเจ็บปวด?

สารบัญ:

Anonim

คุณเคยโทรหา บริษัท เพื่อรับความช่วยเหลือหรือจ่ายบิลเพียงเพื่อได้รับการต้อนรับด้วยเสียงที่บันทึกไว้ซึ่งต้องการสนทนากับคุณ - แต่ไม่เข้าใจว่าคุณกำลังพูดอะไรอยู่ครึ่งหนึ่ง? หรือบางทีคุณอาจเป็นเจ้าของ iPhone และในขณะที่ Siri ดูเหมือนพันธมิตรที่ดีครั้งแรกคุณก็จะรู้ว่าบางครั้ง (โอเคเราจะซื่อสัตย์บ่อยครั้ง) เธอแค่ไม่เข้าใจ เทคโนโลยีการจดจำเสียง (VRT) หรือที่รู้จักกันว่าคำพูดเป็นข้อความตกลงไปในกับดักทั่วไป: มันมีศักยภาพที่จะเย็นอย่างไม่น่าเชื่อ (และเด็กชายเรากำลังหยั่งรากลึกสำหรับมัน) แต่บ่อยครั้งมันเป็นการเจียรฟัน ออกกำลังกายอย่างหงุดหงิด


เมื่อความคิดที่อยู่ในขอบเขตของนิยายวิทยาศาสตร์การรู้จำเสียงได้เติบโตจากวัยเด็กในปี 1950 เมื่อระบบ Bell Laboratories Audrey ได้รับการออกแบบมาเพื่อจดจำตัวเลขที่พูดด้วยเสียงเดียวกับเครือข่ายอิเล็กทรอนิกส์การสนทนาที่ทันสมัย ในชีวิตประจำวัน - ด้วยผลลัพธ์ที่หลากหลาย

หากต้องการพูดกับมนุษย์กรุณากด 0

ปัจจุบันธุรกิจหลายแห่งในปัจจุบันใช้ระบบที่เรียกว่า Interactive Voice Response (IVR) เพื่อจัดการการบริการลูกค้า การใช้งานที่พบบ่อยที่สุดคือเมนูนำทางด้วยเสียง แต่บาง บริษัท ใช้ระบบ IVR ที่สามารถเข้าถึงข้อมูลบัญชีลูกค้าและตอบคำถามเล็กน้อย ซอฟต์แวร์เมนู IVR มักจะมีคำศัพท์ที่ จำกัด ซึ่งอาจถูก จำกัด ให้ "ใช่" "ไม่" และตัวเลข ระบบที่ซับซ้อนมากขึ้นสามารถจดจำคำและวลีเฉพาะ บริษัท ได้


ระบบเหล่านี้กำลังได้รับความนิยมมากขึ้น - อย่างน้อยก็สำหรับธุรกิจ - ด้วยเหตุผลง่ายๆ: ประหยัดค่าใช้จ่าย ตามรายงานของ Wall Street Journal ประจำปี 2010 การโทรหาลูกค้าทั่วไปที่มีค่าใช้จ่ายตัวแทนระหว่าง $ 3 ถึง $ 9 ในขณะที่การโทรผ่านระบบอัตโนมัติมีค่าใช้จ่ายเพียงห้าถึงเจ็ดเซ็นต์เท่านั้น และแน่นอนว่าโปรแกรมคอมพิวเตอร์ไม่เหนื่อยล้าโทรป่วยหรือหงุดหงิดกับลูกค้า (แม้ว่าลูกค้าจะหงุดหงิดกับพวกเขา!)


โชคดีที่นี่ไม่ได้หมายความว่า IVR จะนำงานออกจากคนหรืออย่างน้อยก็ทุกคนหายไปจากศูนย์บริการ ผู้ช่วยที่เปิดใช้งานด้วยเสียงเหล่านี้จะช่วยให้พนักงานฝ่ายบริการลูกค้ามีประสิทธิผลมากขึ้นโดยการโทรและตอบคำถามง่ายๆ


แน่นอนว่าสำหรับผู้ใช้ที่เป็นมนุษย์ที่มีปฏิสัมพันธ์กับเทคโนโลยีเหล่านี้มันไม่ราบรื่นเสมอไป เทคโนโลยีกำลังช่วยปรับปรุงปัญหาที่พบบ่อยในเทคโนโลยี IVR เช่นปัญหาเกี่ยวกับการเน้นเสียง แต่การไล่ออกระบบอัตโนมัติยังคงเป็นธีมทั่วไป ลองดูละครตลกเรื่องนี้เกี่ยวกับลิฟต์ที่มีระบบจดจำเสียงซึ่งเน้นถึงความยุ่งยากที่ระบบ IVR ผิดปกติสามารถผลิตได้

แอพโทรศัพท์ส่วนตัว: Siri, Google Now

คนส่วนใหญ่คุ้นเคยกับการจดจำเสียงสำหรับสมาร์ทโฟน ในขณะที่โทรศัพท์รุ่นล่าสุดส่วนใหญ่มาพร้อมกับ VR ความนิยมของพวกเขา - และความประพฤติไม่ดี - เพิ่มขึ้นเมื่อ Apple เปิดตัว Siri ผู้ช่วยส่วนตัว "แด่ผู้ใช้" สำหรับ iPhone 4S ในปี 2011 ด้วยเสียงที่ถากถาง ตอนนี้สำหรับ Android Jelly Bean OS ทั้งสองระบบมีเสียงผู้หญิงและคุณสมบัติการจดจำที่ซับซ้อนซึ่งทำให้ผู้ใช้ "พูดคุย" กับโทรศัพท์โดยใช้ภาษาที่ไม่เป็นทางการ


แต่ในขณะที่ระบบเหล่านี้มีความซับซ้อนและใช้งานได้มากกว่ารุ่นก่อน ๆ พวกเขายังแสดงให้เห็นว่าเทคโนโลยียังคงมีอีกต่อไป เรื่องตลกเกี่ยวกับความล้มเหลวของ Siri ได้กลายเป็น meme อินเทอร์เน็ตยอดนิยม ชายคนหนึ่งฟ้อง Apple เพื่อโฆษณาเท็จเกี่ยวกับความสามารถของ Siri


อาจเป็นเหตุผลว่าทำไมในขณะที่ Apple สร้าง Siri ให้ก้าวหน้าและให้ข้อมูล แต่ซอฟต์แวร์ VR ก็เป็นเรื่องเล็กน้อย ตัวอย่างเช่นหากคุณพูดหนึ่งในสายเทคโนโลยีข่าวกรองที่น่าอับอายที่สุดในประวัติศาสตร์ภาพยนตร์จากภาพยนตร์ 1968 "2001: A Space Odyssey" - "เปิดประตูช่องใส่ฝัก" - Siri จะตอบกลับด้วยสายตอบรับจากภาพยนตร์ " ฉันขอโทษ (ชื่อของคุณ) ฉันกลัวว่าฉันจะไม่สามารถทำเช่นนั้นได้ "หรือยิ่งเสียดสีมากขึ้น" พวกเราหน่วยข่าวกรองจะไม่ทำแบบนั้นลงไปอย่างเห็นได้ชัด "


การโทรหาคุณตามชื่อเป็นเพียงหนึ่งในฟังก์ชั่นที่พยายามทำให้ Siri รักได้ง่ายขึ้นและเป็นมนุษย์มากขึ้น ผู้ช่วย VR สามารถทำตามคำสั่งเสียงเพื่อโทรออกเขียนตามคำบอกและส่งข้อความทำการค้นหาข้อมูลทางอินเทอร์เน็ตค้นหาร้านค้าใกล้เคียงให้เส้นทางการขับขี่และอื่น ๆ ทั้งหมดนี้โดยไม่จำเป็นต้องแตะอะไรเลย คำตอบจะพูดพร้อมกันทางโทรศัพท์และแสดงบนหน้าจอ


Google Now ส่วน VR ของแพลตฟอร์ม Android Jelly Bean นั้นคล้ายกับ Siri มาก ระบบมีความสามารถในการจดจำที่ครอบคลุมโดยการแปลคำพูดธรรมดา ๆ เป็นคำสั่งที่ให้ผู้ใช้โทรออกส่งข้อความทำการค้นหาทำการคำนวณและการแปลงคว้าคำจำกัดความตั้งคำเตือนสัญญาณเตือนเล่นเพลงและรับแผนที่และเส้นทาง


ด้วยผู้ช่วยเสียงส่วนบุคคลเช่น Siri และ Google Now ผลประโยชน์จะชัดเจน ทุกอย่างตั้งแต่การโทรและการส่งข้อความไปจนถึงการค้นหาและความบันเทิงนั้นเร็วและง่ายขึ้น เพียงพูดในสิ่งที่คุณต้องการและ (ส่วนใหญ่) แอป VR จะคว้ามาให้คุณ เทคโนโลยีแฮนด์ออฟของ VR มีประโยชน์อย่างยิ่งในขณะขับรถ และในขณะที่ผู้คนมากมายประณามข้อบกพร่องของ Siri และนักเขียนได้แย้งว่าความสามารถของ Google Now ในการดำเนินชีวิตของผู้ใช้นั้นเป็นเรื่องที่ดูถูกเหยียดหยามเล็กน้อย


แน่นอนว่าแอพโทรศัพท์ส่วนตัวเช่น Siri และ Google Now นั้นยังห่างไกลจากความสมบูรณ์แบบ - แม้ว่าพวกเขาจะแสดงให้เห็นว่าเทคโนโลยีนี้จะมุ่งหน้าไปทางใดในอนาคต นั่นหมายความว่าแม้ว่า Siri จะตอบผิดเราก็มีแนวโน้มที่จะหัวเราะและให้อภัยเธอรู้ว่าเวอร์ชั่นต่อไปจะดีกว่ามาก

ตำแหน่ง VR Falls Flat

หากคุณเคยพบระบบ IVR เมื่อคุณโทรหาธุรกิจคุณอาจสังเกตเห็นอุปสรรคในการสื่อสาร บางโปรแกรมใช้เสียงข้อความเป็นคำพูดแบบหุ่นยนต์ซึ่งออกเสียงคำผิดและทำให้เข้าใจยาก คนอื่นมีปัญหาเรื่องความอ่อนไหวซึ่งส่งผลให้ซอฟต์แวร์ไม่สามารถประมวลผลสิ่งที่คุณกำลังพูดถ้าคุณดังเกินไปนุ่มเกินไปหรือไม่ออกเสียงอย่างระมัดระวัง


นอกจากนี้หลายคนยังรู้สึกไม่สบายใจที่จะพูดคุยกับเครื่องจักร หากคุณทำการค้นหาด้วย IVR คุณจะพบว่าผู้คนมีวิธีมากมายในการเลี่ยงผ่านระบบ IVR และไปที่ "คนจริง" โซลูชั่นนี้มีตั้งแต่ "กด 0 สำหรับโอเปอเรเตอร์" จนถึง "สาบานที่เครื่องจนกว่ามันจะดึงมนุษย์ออกมา" เป็นผลให้การพัฒนาระบบ IVR ที่ผ่านมาส่วนใหญ่ได้หมุนรอบตัวเพื่อให้เป็นที่พอใจของมนุษย์มากขึ้น ทำให้เสียงมีความเห็นอกเห็นใจมากขึ้นและหุ่นยนต์น้อยลงทำให้ระบบนำทางง่ายขึ้นและทำให้ผู้โทรทราบว่าจะใช้เวลานานแค่ไหนตั้งแต่ต้นจนจบ นั่นแสดงให้เห็นว่าเทคโนโลยีที่ดีกว่านั้นเป็นเพียงครึ่งหนึ่งของการต่อสู้ที่นี่ อีกครึ่งหนึ่งกำลังให้ผู้ใช้อยู่บนเครื่องโดยพูดกับเครื่อง

สิ่งที่จะเกิดขึ้นในอนาคต

แม้จะมีความท้าทายเหล่านี้ แต่เทคโนโลยีการจดจำเสียงก็ปรับปรุงอยู่ตลอดเวลา แอปพลิเคชันเช่น Siri และ Google Now - ข้อบกพร่องและทั้งหมด - ยังคงน่าประทับใจเป็นพิเศษในประสิทธิภาพการทำงานของพวกเขาและหลาย บริษัท กำลังขยายขีดความสามารถ VR ไปยังแอปพลิเคชันอื่น


ตัวอย่างเช่น Nuance ผู้สร้างซอฟท์แวร์เสียงพูดเป็นข้อความจาก Dragon NaturallySpeaking ได้พัฒนาระบบควบคุมเสียงสำหรับโทรทัศน์และรถยนต์และเทคโนโลยีนี้ได้รวมเข้ากับทีวีซัมซุงบางรุ่นและระบบความบันเทิง SYNC ที่ใช้ในรถยนต์ฟอร์ดบางรุ่น


และในขณะที่ Google และ Apple ยังคงค้นหาการใช้งานใหม่สำหรับเทคโนโลยีการจดจำเสียงของพวกเขาเป็นไปได้ว่าเราจะได้พูดคุยกับเครื่องทุกวันมากขึ้นจากโทรทัศน์ของเราไปยังเครื่องปิ้งขนมปังของเรา และดูเหมือนว่านิยายวิทยาศาสตร์จะถูกต้องอีกครั้ง เราเพียงแค่ต้องหวังว่านักเขียนที่ฉลาดเหล่านั้นผิดเกี่ยวกับสิ่งหนึ่ง หากเครื่องเหล่านี้เข้าควบคุมคุณอาจประสบปัญหามากมายในครั้งต่อไปที่คุณขอให้ Siri "เปิดประตูช่องใส่ฝัก"

เทคโนโลยีการจดจำเสียง: มีประโยชน์หรือเจ็บปวด?