Pojďme nahlas: jak umělá inteligence tiše nahradila operátory v call centrech

Chytří "mluvci"

Hlas je přirozeným nástrojem komunikace.řešte problémy spíše slovně než

V komunikaci mezi obchodem a zákazníky je to pohodlný a nativní způsob interakce.Ne každá společnost však dokáže rozšířit počet zaměstnanců call centra úměrně tempu růstu zákaznické základny.Automatizace je efektivní způsob, jak škálovat živou komunikaci se zákazníky.Zachovejte své obvyklé způsoby komunikace a oslovte více kontaktů, aniž byste obětovali kvalitu.

Hlasové technologie se používají v mnoha oblastech,a hodí se pro každé publikum: děti zaujme interaktivní „mluvička“, mladí ocení hlasové ovládání chytrých zařízení, starším čte novinky asistent. Po hlasových asistentech je ale největší poptávka v odvětvích, kde existuje mnoho bodové komunikace se zákazníky – ve financích, maloobchodě a telekomunikacích.

„Hlasové technologie se používají v mnoha oblastech“

Velké společnosti používají hlastechnologie není prvním rokem. Od roku 2017 Bank of America provozuje virtuální asistentku Erica. Od roku 2018 Mercedes-Benz zavádí digitální uživatelský komplex (MBUX), který rozumí hlasovým příkazům. Prodejce Walmart spustil aplikaci s hlasovým asistentem Ask Sam, která zákazníkům pomáhá s hledáním produktů. Podle Adobe Analytics již 91 % značek intenzivně investuje do hlasových řešení a plánují investice navýšit. Ruský trh řečové umělé inteligence poroste v příštích pěti letech z 38 % na 81 % a v roce 2025 dosáhne 561 milionů dolarů, předpovídá Just AI.

Věřím – nevěřím

Podnik vyhodnotí efektivitu implementacehlasové technologie se zaměřením na spokojenost zákazníků a věrnost značce. Mnoho zákazníků však pohlíží na inovace se zdrženlivým nadšením. Podle Voicebot.ai chce pouze 45 % uživatelů vidět hlasové asistenty v mobilních aplikacích. Hlavními důvody nechuti je podle Neuro.net špatná kvalita odpovědí a syntetická řeč hlasových asistentů. Tyto problémy jsou typické pro rozhraní postavená na technologiích minulé generace. Moderní algoritmy strojového učení umožňují syntetizovat hlasy zbavené bezduchosti.

Dalším limitujícím faktorem je tohlasové technologie se rozšířily jak v „dobrých“ scénářích z pohledu klienta, tak ve „špatných“. Společností specializujících se na vývoj hlasových rozhraní zatím na trhu není tolik a počet hlasů, které mohou nabídnout, je omezený. Ukazuje se, že pokud dnes člověka obtěžují reklamy nebo podvodné hovory a zítra zazvoní užitečný hovor, komunikace nebude úspěšná, protože „všichni roboti mají jeden hlas“. Pokud dojde k poškození reputace hlasového asistenta, efektivita hovorů užitečných pro klienta klesá na nulu. Proto vzniká Brand Voice – jedinečný hlas značky.

„Jedinečný hlas je důležitou součástí značky, aslogo nebo firemní písmo. Stále více našich zákazníků využívá tuto funkci a oslovuje zákazníky jedinečnými hlasy. Zaznamenáváme soubor frází s určitou intonací v hlase zaměstnance společnosti nebo hlasatele. A četná dynamická data – telefonní čísla nebo adresy – samoučící se systém automaticky generuje, reprodukuje hlas zaměstnance a zachovává realistickou intonaci. Takto společnosti automatizují komunikaci, ale zachovávají si loajalitu zákazníků a zvyšují konverzi: lidé jsou rádi, že se s nimi mluví živým hlasem, a jsou ochotni vést dialog.“

Ivan Artěmiev, produktový ředitel MTT

Mluvit model

Cena hotového hlasu značky začíná od 150tisíc rublů a závisí na rozsahu a složitosti modelu hlasové syntézy. Proces tvorby řešení se skládá ze dvou částí – technické a logické, za každou zodpovídá samostatný produktový tým.

Důležitým krokem v této části je volba hlasu, nana kterém bude řeč syntetizována. Hlas by měl intonačně odrážet ty atributy značky, které je pro společnost důležité propagovat. Profesionální hlasatel nebo dabingový herec bude muset pod nahrávkou namluvit až 40 hodin jazykových konstrukcí. Nahrávka by měla být kvalitní, bez zbytečného šumu a výslovnost by měla být správná, protože na tomto materiálu bude trénován model hlasového robota.

Pro natrénování modelu a plnohodnotné provedenísyntéza trvá od měsíce do šesti měsíců v závislosti na složitosti. Technologie ale jdou kupředu a nahrávací doba ve studiu se postupně zkracuje. Je možné, že v budoucnu bude možné získat dobrého hlasového robota využívajícího pouze 2-3 hodiny původního zvuku.

„Náklady na hotový hlas značky začínají od 150 000 rublů“

Učení umělé inteligence

Když je záznam připraven, začíná tréninkhlasový model. Zpracovává nahraný materiál, učí se reprodukovat svůj hlas a díky tomu je schopna syntetizovat řeč z libovolného textu.

Chcete-li vyřešit tuto třídu problémů,Transformers je architektura hluboké neuronové sítě představená v roce 2017 výzkumníky Google Brain. Nejznámějšími transformátory jsou neuronové sítě GPT (Generative Pre-trained Transformer) neziskové organizace OpenAI. Tato technologie vám například umožňuje nejpřesněji vyplnit mezeru nebo předpovědět další slovo ve frázi na základě předchozích slov.

Podle tohoto principu vznikají hlasové značky.Hlasová řešení. Natrénovaný model běží na obrovském množství dat – spustí se několik modelů s různými parametry a na výstupu se vybere ten nejlepší. Je důležité, aby robot správně „přeložil“ text do hlasu, nedělal chyby ve výslovnosti a intonaci. Pro zlepšení kvality syntézy je model dále trénován pro konkrétní případy použití, což umožňuje získat co nejpřirozeněji znějící hlasy.

kde je logika?

Sémantický obsah robota, jeho obchodní logika ascénáře interakce s lidmi jsou vytvářeny v úzkém spojení se zákazníkem. Aby hlasový asistent přinesl podniku maximální užitek, musíte dobře rozumět tomu, jak je tento obchod organizován, s jakými dotazy a v jakých situacích bude klient asistenta kontaktovat.

Vymýšlet případy od začátku je špatný nápad, logikaInterakce s klientem musí být reálná. Setká-li se asistent s osobou na telefonní lince, je scénář založen na konzultačním, prodejním nebo jiném scénáři - sledu akcí pracovníka call centra v dialogu s klientem. Při přípravě skriptu pro hlasového asistenta pomáhá analyzovat požadavky skutečných uživatelů, rozhovory se zaměstnanci, kteří s nimi pravidelně komunikují, nebo UX experimenty zaměřené na zjištění skutečných potřeb lidí.

"Pokud se asistent setká s osobou na telefonní lince, pak je scénář založen na konzultačním, prodejním nebo jiném scénáři."

Mnoho zákazníků se snaží vyjádřitasistentka pomáhala klientům řešit problémy, které sami obtížně zvládají. Například na milost a nemilost robota je lepší přenášet funkce, které jsou „hluboce“ skryté nebo nejsou zřejmé při práci v mobilní aplikaci.

Irina Stepanova, návrhářka konverzačního rozhraní a analytička ve společnosti Just AI:"Musíte pochopit, že na různých kanálech existuje chat,aplikace, telefon - klient se chová jinak. Nejprve si proto musíte pečlivě prostudovat mapu cesty zákazníka v těch kanálech, kde plánujete implementovat hlasového asistenta. Ve vizuálním rozhraní má klient méně možností, jak udělat chybu – téměř vše, co služba nabízí, má před očima. V hlasovém rozhraní uživatel tak dobře nepociťuje omezení služby a je nutné zajistit, aby osoba mohla asistentovi nahlasovat požadavek dlouhou frází, ve které bude nutné zvýraznit významné fráze, kterými program určí podstatu požadavku. Samostatným úkolem je navrhnout offtopic skript, pro který neexistuje žádný hotový skript. Klient se může zeptat na cokoliv. To, co dělá robota člověkem, je variabilita odpovědí, když na stejnou otázku odpovídá různými způsoby.“

Jednou z výzev při navrhování hlasového rozhraní je zjistitelnost: jak vyprávět příběh, který asistentMůžete s tím pomoci?Zde musíte  jednat proaktivně – hlasovat dovednosti a schopnosti a vést uživatele scénářem, navrhovat další kroky, pomáhat mu ve slepých uličkách, když se dostaneO schopnostech asistenta můžete mluvit i mimo něj samotného: v reklamě, mailingu a s pomocí dalších marketingových nástrojů.

Hlasový asistent by měl nejen přinéstužitek, ale také být zajímavým konverzátorem. Vývojáři se vždy snaží vložit co nejvíce do „mozku“ Brand Voice a vybavit ho charakterem a osobností.

Učení je nepřetržitý proces

Vývoj hlasového modelu se nezastavuje ani potéjeho uvedení do provozu. Po šesti měsících práce se kvalita modelu zlepšuje a po roce se vyvíjí k nepoznání. Pokud klient povolil logování, tedy zaznamenávání informací o událostech během provozu hlasového asistenta, pak se všechna chybová data shromažďují a používají k přetrénování modelu. Protokolování může být vyžadováno, když asistent nedokáže rozpoznat konkrétní slova a fráze nebo dělá chyby v jejich výslovnosti, například v názvech léků nebo v sortimentu zásilkové služby.

Vytváření hlasu značky obvykle probíhá v clouduprostředí a vyžaduje používání osobních údajů, což u zákazníků často vyvolává obavy o bezpečnost. A přestože je nedůvěra ke cloudům zastaralý stereotyp, pokud je pro klienta důležité, aby data nepřesahovala perimetr společnosti, lze je zpracovávat striktně v rámci IT okruhu organizace. Osobní údaje jsou využívány i při přihlašování, pro zajištění jejich důvěrnosti jsou údaje anonymizovány.

Tvorba nových pracovních scénářů a další školenímodely pro Brand Voice je neustálý proces. Klient totiž objednávkou hotového hlasového řešení získává službu, která je neustále vylepšována. Skutečně kvalitní hlasový asistent si dokáže všimnout nejen personálu celého call centra, ale také se stát jasným akcentem, který dodává image společnosti individualitu.

Přečtěte si více

Noemova archa Elona Muska vezme na Mars milion lidí

Astronomové z Japonska našli v galaxii neznámou strukturu

Šavle neznámého původu nalezená v Řecku. Vědci zmatení podivným artefaktem