בואו נשמע: איך בינה מלאכותית החליפה בשקט מפעילים במוקדים טלפוניים

"מדברים" חכמים

הקול הוא כלי תקשורת טבעי. אנשים רבים רוצים לפתור בעיות באופן מילולי ולא

בכתב, פשוט כי זה מהיר יותר.בתקשורת עסקית עם לקוחות, זוהי דרך נוחה ומקורית לאינטראקציה. אבל לא כל חברה יכולה להרחיב את צוות המוקדים שלה ביחס לקצב הצמיחה של בסיס הלקוחות שלה. אוטומציה הופכת להיות דרך יעילה להרחיב תקשורת חיה עם לקוחות. היא מאפשרת לשמור על שיטות תקשורת מוכרות ולהגיע למספר גדול יותר של אנשי קשר מבלי לוותר על האיכות.

טכנולוגיות קול משמשות בתחומים רבים,והם מתאימים לכל קהל: ילדים נמשכים על ידי "מדבר" אינטראקטיבי, צעירים מעריכים את השליטה הקולית של מכשירים חכמים, ועוזר קורא את החדשות לקשישים. אבל העוזרות הקוליות מבוקשות ביותר באותן תעשיות שבהן יש הרבה תקשורת נקודתית עם לקוחות - בתחום הפיננסים, הקמעונאות והטלקום.

"טכנולוגיות קול משמשות בתחומים רבים"

חברות גדולות משתמשות בקולהטכנולוגיה היא לא השנה הראשונה. מאז 2017, בנק אוף אמריקה מנהל את אריקה, עוזרת וירטואלית. מאז 2018, מרצדס בנץ מציגה מתחם חווית משתמש דיגיטלית (MBUX) שמבין פקודות קוליות. הקמעונאית Walmart השיקה אפליקציה עם העוזרת הקולית Ask Sam, המסייעת ללקוחות בחיפוש מוצרים. לפי Adobe Analytics, 91% מהמותגים כבר משקיעים רבות בפתרונות קול ומתכננים להגדיל את ההשקעה. שוק הבינה המלאכותית בדיבור הרוסי יגדל מ-38% ל-81% בחמש השנים הקרובות ויגיע ל-561 מיליון דולר ב-2025, כך צופה Just AI.

אני מאמין - אני לא מאמין

עסקים מעריכים את יעילות היישוםטכנולוגיות קול, תוך התמקדות בשביעות רצון לקוחות ונאמנות למותג. אבל לקוחות רבים רואים חדשנות בהתלהבות מאופקת. לפי Voicebot.ai, רק 45% מהמשתמשים רוצים לראות עוזרים קוליים ביישומים ניידים. הסיבות העיקריות לאי-אהבתי, לפי Neuro.net, הן האיכות הירודה של התשובות והדיבור הסינטטי של העוזרות הקוליות. בעיות אלו אופייניות לממשקים הבנויים על טכנולוגיות מהדור הקודם. אלגוריתמים מודרניים של למידת מכונה מאפשרים לסנתז קולות נטולי חוסר נשמה.

גורם מגביל נוסף הוא זהטכנולוגיות קול הפכו נפוצות הן בתרחישים "טובים" מנקודת מבטו של הלקוח, והן בתרחישים "רעים". אין עדיין כל כך הרבה חברות המתמחות בפיתוח ממשקים קוליים בשוק, ומספר הקולות שהם יכולים להציע מוגבל. מסתבר שאם היום אדם מוטרד מפרסומות או שיחות הונאה, ומחר תצלצל שיחה מועילה, התקשורת לא תצליח, כי "לכל הרובוטים יש קול אחד". אם המוניטין של העוזרת הקולית נפגע, האפקטיביות של שיחות שימושיות ללקוח יורדת לאפס. לכן נוצר Brand Voice - קול מותג ייחודי.

"קול ייחודי הוא חלק חשוב ממותג, כמולוגו או גופן תאגידי. יותר ויותר מלקוחותינו משתמשים בתכונה זו ומתקשרים עם לקוחות בקולות ייחודיים. אנו מקליטים קבוצה של ביטויים עם אינטונציה מסוימת בקולו של עובד חברה או קריין. ונתונים דינמיים רבים - מספרי טלפון או כתובות - מערכת הלמידה העצמית מייצרת אוטומטית, משחזרת את קולו של העובד ושומרת על אינטונציות מציאותיות. כך החברות הופכות את התקשורת לאוטומטיות, אך שומרות על נאמנות הלקוחות ומגדילות את ההמרה: אנשים שמחים שמדברים אליהם בקול חי, ומוכנים לנהל דיאלוג".

איבן ארטמייב, מנהל מוצר MTT

דבר דגם

העלות של קול המותג המוגמר מתחילה מ-150אלף רובל ותלוי בהיקף ובמורכבות של מודל סינתזת הקול. תהליך יצירת הפתרון מורכב משני חלקים – טכני והגיוני, כל אחד באחריות צוות מוצר נפרד.

שלב חשוב בחלק זה הוא בחירת הקול, עלשעליו יסונתז הדיבור. הקול צריך לשקף באופן לאומי את תכונות המותג שחשוב לחברה לקדם. קריין מקצועי או שחקן דיבוב יצטרך לדבר עד 40 שעות של בניית שפה תחת ההקלטה. ההקלטה צריכה להיות באיכות גבוהה, ללא רעש מיותר, וההגייה צריכה להיות נכונה, כי דגם הרובוט הקולי יוכשר על החומר הזה.

להכשיר את המודל וליישם מודל מן המנייןסינתזה נמשכת בין חודש לשישה חודשים, תלוי במורכבות. אבל הטכנולוגיה מתקדמת, וזמן ההקלטה באולפן פוחת בהדרגה. ייתכן שבעתיד ניתן יהיה להשיג רובוט קולי טוב תוך שימוש רק ב-2-3 שעות מהשמע המקורי.

"העלות של קול מותג מוגמר מתחילה מ-150,000 רובל"

לימוד בינה מלאכותית

כשההקלטה מוכנה, האימון מתחילדגם קול. היא מעבדת את החומר המוקלט, לומדת לשחזר את קולה, וכתוצאה מכך היא מסוגלת לסנתז דיבור מכל טקסט שרירותי.

כדי לפתור סוג זה של בעיות,רובוטריקים היא ארכיטקטורת רשת עצבית עמוקה שהוצגה ב-2017 על ידי חוקרי המוח של גוגל. השנאים המפורסמים ביותר הם רשתות העצבים GPT (Generative Pre-trained Transformer) של ארגון ללא מטרות רווח OpenAI. טכנולוגיה זו, למשל, מאפשרת לך להשלים פער בצורה המדויקת ביותר או לחזות את המילה הבאה בביטוי על סמך מילים קודמות.

על פי עיקרון זה נוצרים מותגי קול.פתרונות קוליים. המודל המאומן מתנהל על כמות עצומה של נתונים - מספר דגמים מושקים עם פרמטרים שונים והטוב ביותר נבחר בפלט. חשוב שהרובוט "יתרגם" נכון את הטקסט לקול, לא יעשה טעויות בהגייה ובאינטונציה. כדי לשפר את איכות הסינתזה, המודל עובר הכשרה נוספת למקרי שימוש ספציפיים, מה שמאפשר לך לקבל את הקולות הנשמעים הטבעיים ביותר.

איפה ההיגיון?

התוכן הסמנטי של הרובוט, ההיגיון העסקי שלו ותרחישים של אינטראקציה עם אנשים נוצרים בשיתוף פעולה הדוק עם הלקוח. על מנת שעוזרת קולית תביא תועלת מרבית לעסק, אתה צריך להבין טוב איך העסק הזה מאורגן, עם אילו שאלות ובאילו מצבים הלקוח יפנה לעוזר.

להמציא מקרים מאפס זה רעיון גרוע, היגיוןהאינטראקציה עם הלקוח חייבת להיות אמיתית. אם עוזר פוגש אדם על קו הטלפון, אז התסריט מבוסס על תסריט ייעוץ, מכירה או אחר - רצף פעולות של עובד מוקד בדיאלוג עם לקוח. כאשר מכינים תסריט לעוזרת קולית, זה עוזר לנתח את הבקשות של משתמשים אמיתיים, ראיונות עם עובדים שמתקשרים איתם באופן קבוע, או ניסויי UX שמטרתם לגלות את הצרכים האמיתיים של אנשים.

"אם עוזר פוגש אדם על קו הטלפון, אז התסריט מבוסס על ייעוץ, מכירות או תסריט אחר"

לקוחות רבים מנסים להשמיע קולהעוזר עזר ללקוחות לפתור בעיות שקשה להם לטפל בעצמם. לדוגמה, בחסדי הרובוט עדיף להעביר פונקציות שנסתרות "עמוק" או לא ברורות בעבודה באפליקציה סלולרית.

אירינה סטפנובה, מעצבת-אנליסטית של ממשקי שיחה ב-Just AI:"צריך להבין שבערוצים שונים יש צ'אט,אפליקציה, טלפון - הלקוח מתנהג אחרת. לכן, קודם כל, עליך ללמוד היטב את מפת מסע הלקוח באותם ערוצים שבהם אתה מתכנן ליישם עוזר קולי. בממשק הוויזואלי יש ללקוח פחות דרכים לטעות – כמעט כל מה שיש לשירות להציע נמצא לנגד עיניו. בממשק הקולי המשתמש לא מרגיש כל כך טוב את מגבלות השירות ויש לדאוג שאדם יוכל להשמיע פנייה לעוזרת בביטוי ארוך, בו יהיה צורך להדגיש ביטויים משמעותיים על ידי אשר התוכנית תקבע את מהות הבקשה. משימה נפרדת היא לעצב סקריפט אוף-טופיק שאין עבורו סקריפט מוכן. הלקוח יכול לשאול כל דבר. מה שהופך רובוט לאנושי הוא השונות של התשובות, כאשר הוא עונה על אותה שאלה בדרכים שונות".

אחת הבעיות בפיתוח קולממשק - יכולת גילוי: איך לדעת מה העוזר יכול לעשות ובמה הוא יכול לעזור? כאן יש צורך  לפעול באופן יזום - מיומנויות ויכולות קול ולהדריך את המשתמש בתרחיש, להציע צעדים נוספים, לעזור לו בסניפים ללא מוצא כשהוא נכנס ל"עיבוד של בקשות לא מזוהות". ניתן לדבר גם על היכולות של העוזר מחוץ לעוזר עצמו: בפרסום, דיוור ושימוש בכלים שיווקיים נוספים.

העוזרת הקולית לא צריכה רק להביאלהועיל, אבל גם להיות איש שיחה מעניין. המפתחים תמיד מנסים להכניס כמה שיותר ל"מוח" של Brand Voice, להעניק לו אופי ואישיות.

למידה היא תהליך מתמשך

הפיתוח של מודל הקול לא עוצר גם לאחר מכןהזמנתו. לאחר שישה חודשי עבודה, איכות הדגם משתפרת, ולאחר שנה הוא מתפתח לבלי הכר. אם הלקוח איפשר רישום, כלומר, הקלטת מידע על אירועים במהלך פעולת העוזרת הקולית, אז כל נתוני השגיאה נאספים ומשמשים לאימון מחדש של המודל. רישום עשוי להידרש כאשר העוזר אינו יכול לזהות מילים וביטויים ספציפיים או עושה טעויות בהגייתם, למשל, בשמות של תרופות או במבחר של שירות משלוחים.

יצירת קול מותג מתרחשת בדרך כלל בענןסביבה ודורשת שימוש בנתונים אישיים, מה שמעלה לעתים קרובות חששות אבטחה בקרב לקוחות. ולמרות שחוסר אמון בעננים הוא סטריאוטיפ מיושן, אם חשוב ללקוח שהנתונים לא יחרגו מעבר להיקף החברה, ניתן לעבד אותם אך ורק בתוך מעגל ה-IT של הארגון. נתונים אישיים משמשים גם במהלך רישום, כדי להבטיח את סודיותם, הנתונים אנונימיים.

יצירת תרחישי עבודה חדשים והכשרה נוספתמודלים עבור Brand Voice הוא תהליך מתמשך. למעשה, בהזמנת פתרון קולי מוכן הלקוח מקבל שירות המשתפר כל הזמן. עוזר קולי איכותי באמת יכול לא רק להבחין בצוות של מוקד טלפוני שלם, אלא גם להפוך למבטא בהיר שמוסיף אינדיבידואליות לתדמית החברה.

קרא עוד

תיבת נח של אילון מאסק תיקח מיליון איש למאדים

אסטרונומים מיפן מצאו מבנה לא ידוע בגלקסיה

חרב ממקור לא ידוע נמצא ביוון. מדענים תמהו על חפץ מוזר