"นักพูด" ที่ฉลาด
เสียงเป็นเครื่องมือสื่อสารตามธรรมชาติ หลายคนต้องการแก้ปัญหาด้วยวาจามากกว่า
เทคโนโลยีเสียงถูกนำมาใช้ในหลายพื้นที่และเหมาะสำหรับผู้ชมทุกวัย: เด็ก ๆ จะถูกดึงดูดโดย "นักพูด" แบบโต้ตอบ คนหนุ่มสาวชื่นชมการควบคุมด้วยเสียงของอุปกรณ์อัจฉริยะ และผู้ช่วยอ่านข่าวให้ผู้สูงอายุฟัง แต่ผู้ช่วยเสียงเป็นที่ต้องการมากที่สุดในอุตสาหกรรมที่มีการสื่อสารกับลูกค้าในหลายจุด ทั้งในด้านการเงิน การค้าปลีก และโทรคมนาคม
“เทคโนโลยีเสียงถูกนำมาใช้ในหลายพื้นที่”
บริษัทใหญ่ๆ ใช้เสียงเทคโนโลยีไม่ใช่ปีแรก ตั้งแต่ปี 2017 Bank of America ได้ดำเนินการ Erica ซึ่งเป็นผู้ช่วยเสมือน ตั้งแต่ปี 2018 เมอร์เซเดส-เบนซ์ได้เปิดตัวระบบ Digital User Experience (MBUX) ที่เข้าใจคำสั่งเสียง ผู้ค้าปลีก Walmart ได้เปิดตัวแอปพลิเคชันที่มีผู้ช่วยเสียง Ask Sam ซึ่งช่วยให้ลูกค้าสามารถค้นหาผลิตภัณฑ์ได้ จากข้อมูลของ Adobe Analytics 91% ของแบรนด์ต่างลงทุนอย่างหนักในโซลูชันด้านเสียงและวางแผนที่จะเพิ่มการลงทุน ตลาด AI พูดภาษารัสเซียจะเติบโตจาก 38% เป็น 81% ในอีกห้าปีข้างหน้าและไปถึง 561 ล้านดอลลาร์ในปี 2568 Just AI คาดการณ์
ฉันเชื่อ - ฉันไม่เชื่อ
ธุรกิจประเมินประสิทธิผลของการนำไปปฏิบัติเทคโนโลยีด้านเสียงที่เน้นความพึงพอใจของลูกค้าและความภักดีต่อแบรนด์ แต่ลูกค้าจำนวนมากมองนวัตกรรมด้วยความกระตือรือร้นที่จำกัด ตาม Voicebot.ai ผู้ใช้เพียง 45% ต้องการเห็นผู้ช่วยเสียงในแอปพลิเคชันมือถือ สาเหตุหลักของการไม่ชอบตามข้อมูลของ Neuro.net คือคำตอบที่มีคุณภาพต่ำและคำพูดสังเคราะห์ของผู้ช่วยเสียง ปัญหาเหล่านี้เป็นเรื่องปกติสำหรับอินเทอร์เฟซที่สร้างขึ้นจากเทคโนโลยีของรุ่นก่อน ๆ อัลกอริธึมการเรียนรู้ของเครื่องสมัยใหม่ทำให้สามารถสังเคราะห์เสียงที่ปราศจากจิตวิญญาณได้
ปัจจัยจำกัดอีกประการหนึ่งคือเทคโนโลยีเสียงแพร่หลายทั้งในสถานการณ์ที่ "ดี" จากมุมมองของลูกค้าและในสถานการณ์ที่ "แย่" ยังไม่มีบริษัทจำนวนมากที่เชี่ยวชาญด้านการพัฒนาอินเทอร์เฟซเสียงในตลาด และจำนวนเสียงที่พวกเขาสามารถนำเสนอได้มีจำกัด ปรากฎว่าถ้าวันนี้มีคนถูกรบกวนโดยการโฆษณาหรือการโทรหลอกลวง และพรุ่งนี้การโทรที่มีประโยชน์จะดังขึ้น การสื่อสารจะไม่ประสบความสำเร็จเพราะ "หุ่นยนต์ทุกตัวมีเสียงเดียว" หากชื่อเสียงของผู้ช่วยเสียงเสียหาย ประสิทธิภาพของการโทรที่เป็นประโยชน์ต่อลูกค้าจะลดลงเหลือศูนย์ ดังนั้น Brand Voice จึงถูกสร้างขึ้น - เสียงของแบรนด์ที่มีเอกลักษณ์
“เสียงที่เป็นเอกลักษณ์เป็นส่วนสำคัญของแบรนด์ดังที่โลโก้หรือแบบอักษรองค์กร ลูกค้าของเราใช้คุณสมบัตินี้มากขึ้นเรื่อยๆ และมีส่วนร่วมกับลูกค้าด้วยเสียงที่เป็นเอกลักษณ์ เราบันทึกชุดของวลีที่มีน้ำเสียงสูงต่ำในเสียงของพนักงานบริษัทหรือผู้ประกาศ และข้อมูลไดนามิกมากมาย - หมายเลขโทรศัพท์หรือที่อยู่ - ระบบการเรียนรู้ด้วยตนเองจะสร้างเสียงพูดของพนักงานและคงโทนเสียงที่สมจริงโดยอัตโนมัติ นี่คือวิธีที่บริษัทต่างๆ ทำการสื่อสารโดยอัตโนมัติ แต่ยังคงรักษาความภักดีของลูกค้าและเพิ่มการแปลง: ผู้คนยินดีที่พวกเขาจะพูดด้วยเสียงที่มีชีวิตชีวา และพวกเขายินดีที่จะดำเนินการสนทนา”
Ivan Artemiev ผู้อำนวยการผลิตภัณฑ์ MTT
พูดแบบ
ค่าใช้จ่ายของ Brand Voice ที่เสร็จสิ้นแล้วเริ่มต้นที่ 150พันรูเบิลและขึ้นอยู่กับขอบเขตและความซับซ้อนของรูปแบบการสังเคราะห์เสียง กระบวนการสร้างโซลูชันประกอบด้วยสองส่วน - ด้านเทคนิคและตรรกะ แต่ละส่วนเป็นความรับผิดชอบของทีมผลิตภัณฑ์แยกต่างหาก
ขั้นตอนสำคัญในส่วนนี้คือการเลือกเสียง onซึ่งจะมีการสังเคราะห์คำพูด เสียงควรสะท้อนถึงคุณลักษณะของแบรนด์ที่มีความสำคัญสำหรับบริษัทในการโปรโมต ผู้ประกาศหรือผู้พากย์เสียงมืออาชีพจะต้องพูดโครงสร้างภาษาได้นานถึง 40 ชั่วโมงภายใต้การบันทึก การบันทึกเสียงควรมีคุณภาพสูง ปราศจากเสียงรบกวนที่ไม่จำเป็น และการออกเสียงควรถูกต้อง เนื่องจากหุ่นยนต์เสียงจะได้รับการฝึกในเนื้อหานี้
เพื่อฝึกโมเดลและใช้งานอย่างเต็มประสิทธิภาพการสังเคราะห์ใช้เวลาตั้งแต่หนึ่งเดือนถึงหกเดือน ขึ้นอยู่กับความซับซ้อน แต่เทคโนโลยีกำลังก้าวหน้า และเวลาบันทึกในสตูดิโอก็ค่อยๆ ลดลง เป็นไปได้ว่าในอนาคตจะได้หุ่นยนต์เสียงดีโดยใช้เสียงต้นฉบับเพียง 2-3 ชั่วโมง
“ ค่าใช้จ่ายของ Brand Voice ที่เสร็จสิ้นแล้วเริ่มต้นที่ 150,000 rubles”
การเรียนรู้ปัญญาประดิษฐ์
เมื่อการบันทึกพร้อม การฝึกก็เริ่มขึ้นโมเดลเสียง เธอประมวลผลเนื้อหาที่บันทึกไว้ เรียนรู้ที่จะทำซ้ำเสียงของเธอ และด้วยเหตุนี้ เธอจึงสามารถสังเคราะห์คำพูดจากข้อความใดก็ได้ตามอำเภอใจ
เพื่อแก้ปัญหากลุ่มนี้Transformers เป็นสถาปัตยกรรมโครงข่ายประสาทเทียมเชิงลึกที่เปิดตัวในปี 2560 โดยนักวิจัยของ Google Brain หม้อแปลงที่มีชื่อเสียงที่สุดคือเครือข่ายประสาทเทียม GPT (Generative Pre-trained Transformer) ขององค์กร OpenAI ที่ไม่แสวงหาผลกำไร ตัวอย่างเช่น เทคโนโลยีนี้ช่วยให้คุณเติมช่องว่างหรือคาดเดาคำถัดไปในวลีตามคำก่อนหน้าได้แม่นยำที่สุด
ตามหลักการนี้ การสร้างแบรนด์เสียงโซลูชั่นเสียง โมเดลที่ผ่านการฝึกอบรมนั้นใช้ข้อมูลจำนวนมาก - มีหลายรุ่นเปิดตัวพร้อมพารามิเตอร์ที่แตกต่างกันและเลือกรุ่นที่ดีที่สุดที่เอาต์พุต สิ่งสำคัญคือหุ่นยนต์ต้อง "แปล" ข้อความเป็นเสียงอย่างถูกต้อง ไม่ทำผิดพลาดในการออกเสียงและน้ำเสียง เพื่อปรับปรุงคุณภาพการสังเคราะห์ โมเดลนี้ได้รับการฝึกอบรมเพิ่มเติมสำหรับกรณีการใช้งานเฉพาะ ซึ่งช่วยให้คุณได้รับเสียงที่เป็นธรรมชาติที่สุด
ตรรกะอยู่ที่ไหน?
เนื้อหาเชิงความหมายของหุ่นยนต์ ตรรกะทางธุรกิจ และสถานการณ์ของการมีปฏิสัมพันธ์กับผู้คนถูกสร้างขึ้นร่วมกับลูกค้าอย่างใกล้ชิด เพื่อให้ผู้ช่วยเสียงสร้างประโยชน์สูงสุดให้กับธุรกิจ คุณต้องมีความเข้าใจที่ดีว่าธุรกิจนี้มีการจัดระเบียบอย่างไร โดยมีคำถามอะไรบ้าง และลูกค้าจะติดต่อผู้ช่วยในสถานการณ์ใดบ้าง
การประดิษฐ์เคสตั้งแต่เริ่มต้นเป็นความคิดที่ไม่ดี ตรรกะการโต้ตอบกับลูกค้าต้องเป็นเรื่องจริง หากผู้ช่วยพบบุคคลในสายโทรศัพท์ สคริปต์จะขึ้นอยู่กับการให้คำปรึกษา การขาย หรือสคริปต์อื่นๆ - ลำดับการดำเนินการของพนักงานคอลเซ็นเตอร์ในการสนทนากับลูกค้า เมื่อเตรียมสคริปต์สำหรับผู้ช่วยเสียง จะช่วยวิเคราะห์คำขอของผู้ใช้จริง สัมภาษณ์พนักงานที่สื่อสารกับพวกเขาเป็นประจำ หรือการทดลอง UX เพื่อค้นหาความต้องการที่แท้จริงของผู้คน
“หากผู้ช่วยพบบุคคลทางโทรศัพท์ บทนั้นก็มาจากการให้คำปรึกษา การขาย หรือบทอื่นๆ”
ลูกค้าหลายคนพยายามพูดผู้ช่วยช่วยลูกค้าแก้ปัญหาที่ยากสำหรับพวกเขาที่จะจัดการด้วยตัวเอง ตัวอย่างเช่น ด้วยความเมตตาของหุ่นยนต์ เป็นการดีกว่าที่จะถ่ายโอนฟังก์ชันที่ซ่อน "ลึก" หรือไม่ชัดเจนเมื่อทำงานในแอปพลิเคชันมือถือ
Irina Stepanova ผู้ออกแบบและนักวิเคราะห์อินเทอร์เฟซการสนทนาที่ Just AI:“คุณต้องเข้าใจว่าในช่องทางต่าง ๆ มีการแชทแอปพลิเคชัน, โทรศัพท์ - ลูกค้ามีพฤติกรรมแตกต่างไปจากนี้ ดังนั้น ก่อนอื่น คุณต้องศึกษาแผนที่การเดินทางของลูกค้าอย่างละเอียดในช่องทางที่คุณวางแผนจะใช้ผู้ช่วยเสียง ในอินเทอร์เฟซแบบเห็นภาพ ลูกค้ามีวิธีที่จะทำผิดพลาดน้อยลง - เกือบทุกอย่างที่บริการมีให้นั้นอยู่ต่อหน้าต่อตาเขา ในส่วนต่อประสานเสียงผู้ใช้ไม่ได้รู้สึกถึงข้อ จำกัด ของบริการที่ดีและจำเป็นต้องให้บุคคลสามารถส่งคำขอไปยังผู้ช่วยด้วยวลียาว ๆ ซึ่งจำเป็นต้องเน้นวลีที่สำคัญโดย ซึ่งโปรแกรมจะกำหนดสาระสำคัญของคำร้อง งานแยกต่างหากคือการออกแบบสคริปต์นอกหัวข้อที่ไม่มีสคริปต์สำเร็จรูป ลูกค้าถามอะไรก็ได้ สิ่งที่ทำให้หุ่นยนต์เป็นมนุษย์คือความผันแปรของคำตอบ เมื่อมันตอบคำถามเดียวกันในวิธีที่ต่างกัน”
หนึ่งในปัญหาในการพัฒนาเสียงอินเทอร์เฟซ - การค้นพบได้: จะบอกได้อย่างไรว่าผู้ช่วยสามารถทำอะไรได้บ้างและเขาสามารถช่วยอะไรได้บ้าง? นี่มันจำเป็น ดำเนินการเชิงรุก - ทักษะและความสามารถด้านเสียง และแนะนำผู้ใช้ตลอดสถานการณ์ แนะนำขั้นตอนเพิ่มเติม ช่วยเขาในสาขาทางตันเมื่อเขาเข้าสู่ "การประมวลผลคำขอที่ไม่รู้จัก" คุณยังสามารถพูดคุยเกี่ยวกับความสามารถของผู้ช่วยภายนอกตัวผู้ช่วยได้ เช่น ในการโฆษณา การส่งจดหมาย และการใช้เครื่องมือทางการตลาดอื่นๆ
ผู้ช่วยเสียงไม่ควรนำมาเพียงได้ประโยชน์ แต่ยังเป็นนักสนทนาที่น่าสนใจด้วย นักพัฒนามักจะพยายามใส่ "สมอง" ของ Brand Voice ให้มากที่สุดเท่าที่จะเป็นไปได้ เพื่อสร้างบุคลิกและบุคลิกภาพ
การเรียนรู้เป็นกระบวนการต่อเนื่อง
การพัฒนารูปแบบเสียงไม่หยุดแม้หลังจากการว่าจ้าง หลังจากทำงานหกเดือน คุณภาพของโมเดลก็ดีขึ้น และหลังจากผ่านไปหนึ่งปี โมเดลก็พัฒนาจนจำไม่ได้ หากไคลเอนต์อนุญาตให้มีการบันทึก นั่นคือ การบันทึกข้อมูลเกี่ยวกับเหตุการณ์ระหว่างการทำงานของผู้ช่วยเสียง ข้อมูลข้อผิดพลาดทั้งหมดจะถูกรวบรวมและใช้เพื่อฝึกโมเดลใหม่ อาจจำเป็นต้องมีการบันทึกเมื่อผู้ช่วยจำคำและวลีเฉพาะไม่ได้ หรือทำผิดพลาดในการออกเสียง เช่น ในชื่อยาหรือในการแบ่งประเภทของบริการจัดส่ง
การสร้างเสียงของแบรนด์มักเกิดขึ้นในระบบคลาวด์และต้องใช้ข้อมูลส่วนบุคคลซึ่งมักก่อให้เกิดปัญหาด้านความปลอดภัยในหมู่ลูกค้า และถึงแม้ความไม่ไว้วางใจในระบบคลาวด์จะเป็นแบบแผนเก่า แต่หากเป็นสิ่งสำคัญสำหรับลูกค้าที่ข้อมูลต้องไม่เกินขอบเขตของบริษัท พวกเขาสามารถประมวลผลได้อย่างเคร่งครัดภายในวงจรไอทีขององค์กร ข้อมูลส่วนบุคคลยังใช้ในระหว่างการบันทึกเพื่อให้แน่ใจว่าข้อมูลจะเป็นความลับ ข้อมูลจะไม่ระบุชื่อ
การสร้างสถานการณ์การทำงานใหม่และการฝึกอบรมเพิ่มเติมโมเดลสำหรับ Brand Voice เป็นกระบวนการที่ต่อเนื่อง อันที่จริง โดยการสั่งซื้อโซลูชันเสียงสำเร็จรูป ลูกค้าจะได้รับบริการที่มีการปรับปรุงอย่างต่อเนื่อง ผู้ช่วยเสียงคุณภาพสูงอย่างแท้จริงไม่เพียงแต่สามารถสังเกตเห็นพนักงานของศูนย์บริการทางโทรศัพท์ทั้งหมดเท่านั้น แต่ยังกลายเป็นสำเนียงที่สดใสที่เพิ่มบุคลิกลักษณะเฉพาะให้กับภาพลักษณ์ของบริษัทอีกด้วย
อ่านเพิ่มเติม
เรือโนอาห์ของ Elon Musk จะพาผู้คนหนึ่งล้านคนไปดาวอังคาร
นักดาราศาสตร์จากประเทศญี่ปุ่นพบโครงสร้างที่ไม่รู้จักในกาแลคซี
พบกระบี่ไม่ทราบที่มาในกรีซ นักวิทยาศาสตร์งงกับสิ่งประดิษฐ์ประหลาด