Lad os sige: hvordan AI stille og roligt erstattede operatører i callcentre

Smarte "talere"

Stemmen er et naturligt kommunikationsredskab. Mange mennesker ønsker at løse problemer verbalt i stedet for

skriftligt, simpelthen fordi det er hurtigere.I forretningskommunikation med kunder er dette en bekvem og naturlig måde at interagere på. Men ikke alle virksomheder kan udvide deres call center-personale i forhold til vækstraten for deres kundebase. Automatisering er ved at blive en effektiv måde at skalere livekommunikation med kunder på. Det giver dig mulighed for at opretholde velkendte kommunikationsmetoder og nå et større antal kontakter uden at ofre kvaliteten.

Stemmeteknologier bruges på mange områder,og de er velegnede til ethvert publikum: børn tiltrækkes af en interaktiv "taler", unge mennesker sætter pris på stemmestyringen af ​​smarte enheder, og en assistent læser nyhederne for de ældre. Men stemmeassistenter er mest efterspurgte i de brancher, hvor der er mange punktkommunikation med kunder - inden for finans, detail og telekommunikation.

"Stemmeteknologier bruges på mange områder"

Større virksomheder bruger stemmeteknologi er ikke det første år. Siden 2017 har Bank of America drevet Erica, en virtuel assistent. Siden 2018 har Mercedes-Benz introduceret et digitalt brugeroplevelseskompleks (MBUX), der forstår stemmekommandoer. Forhandler Walmart har lanceret en applikation med Ask Sam stemmeassistenten, som hjælper kunder med produktsøgning. Ifølge Adobe Analytics investerer 91 % af brands allerede kraftigt i taleløsninger og planlægger at øge investeringerne. Det russiske marked for tale-AI vil i de næste fem år vokse fra 38 til 81% og vil i 2025 nå niveauet på $561 millioner, forudsiger Just AI.

Jeg tror - jeg tror ikke

Virksomheden evaluerer effektiviteten af ​​implementeringenstemmeteknologier, med fokus på kundetilfredshed og brandloyalitet. Men mange kunder ser på innovation med behersket entusiasme. Ifølge Voicebot.ai ønsker kun 45% af brugerne at se stemmeassistenter i mobilapplikationer. Hovedårsagerne til antipati er ifølge Neuro.net den dårlige kvalitet af svarene og stemmeassistenternes syntetiske tale. Disse problemer er typiske for grænseflader bygget på teknologier fra den seneste generation. Moderne maskinlæringsalgoritmer gør det muligt at syntetisere stemmer blottet for sjæleløshed.

En anden begrænsende faktor er detstemmeteknologier er blevet udbredt både i "gode" scenarier fra klientens synspunkt og i "dårlige" scenarier. Der er ikke så mange virksomheder, der har specialiseret sig i udvikling af talegrænseflader på markedet endnu, og antallet af stemmer, de kan tilbyde, er begrænset. Det viser sig, at hvis en person i dag er generet af reklamer eller svigagtige opkald, og i morgen ringer et nyttigt opkald, vil kommunikationen ikke lykkes, fordi "alle robotter har én stemme." Hvis stemmeassistentens omdømme er beskadiget, falder effektiviteten af ​​opkald, der er nyttige for klienten, til nul. Derfor skabes Brand Voice – en unik brand-stemme.

“En unik stemme er en vigtig del af et brand, somlogo eller virksomhedsskrifttype. Flere og flere af vores kunder bruger denne funktion og engagerer sig med kunder med unikke stemmer. Vi optager et sæt sætninger med en bestemt intonation i stemmen til en virksomhedsmedarbejder eller en medarbejder. Og talrige dynamiske data - telefonnumre eller adresser - genererer det selvlærende system automatisk, reproducerer medarbejderens stemme og bevarer realistiske intonationer. Sådan automatiserer virksomheder kommunikation, men bevarer kundeloyalitet og øger konvertering: Folk er glade for, at de bliver talt til med en livlig stemme, og de er villige til at føre en dialog.”

Ivan Artemiev, MTT produktdirektør

Tal model

Prisen for den færdige Brand Voice starter fra 150,-tusind rubler og afhænger af omfanget og kompleksiteten af ​​stemmesyntesemodellen. Processen med at skabe en løsning består af to dele - teknisk og logisk, hver er et separat produktteams ansvar.

Et vigtigt skridt i denne del er valget af stemme, påhvorpå tale vil blive syntetiseret. Stemmen bør innationalt afspejle de brandegenskaber, som det er vigtigt for virksomheden at promovere. En professionel announcer eller dubbing-skuespiller skal tale op til 40 timers sprogkonstruktioner under optagelsen. Optagelsen skal være af høj kvalitet, uden unødig støj, og udtalen skal være korrekt, fordi stemmerobotmodellen vil blive trænet på dette materiale.

At træne modellen og implementere en fuldgyldigsyntese tager fra en måned til seks måneder, afhængigt af kompleksiteten. Men teknologien skrider frem, og optagetiden i studiet falder gradvist. Det er muligt, at det i fremtiden vil være muligt at få en god stemmerobot ved kun at bruge 2-3 timer af den originale lyd.

"Omkostningerne ved en færdig Brand Voice starter fra 150.000 rubler"

At lære kunstig intelligens

Når optagelsen er klar, starter træningenstemme model. Hun behandler det optagede materiale, lærer at gengive sin stemme, og som et resultat er hun i stand til at syntetisere tale fra enhver vilkårlig tekst.

For at løse denne klasse af problemer,Transformers er en dyb neural netværksarkitektur introduceret i 2017 af Google Brain-forskere. De mest berømte transformatorer er GPT (Generative Pre-trained Transformer) neurale netværk af non-profit organisationen OpenAI. Denne teknologi giver dig for eksempel mulighed for mest præcist at udfylde et hul eller forudsige det næste ord i en sætning baseret på tidligere ord.

Ifølge dette princip skabes stemmemærker.Stemmeløsninger. Den trænede model køres på en enorm mængde data - flere modeller lanceres med forskellige parametre og den bedste vælges ved outputtet. Det er vigtigt, at robotten korrekt "oversætter" teksten til stemme, ikke laver fejl i udtale og intonation. For at forbedre kvaliteten af ​​syntesen er modellen videreuddannet til specifikke use cases, hvilket giver dig mulighed for at få de mest naturligt klingende stemmer.

Hvor er logikken?

Robottens semantiske indhold, dens forretningslogik ogscenarier for interaktion med mennesker skabes i tæt samarbejde med kunden. For at en stemmeassistent kan bringe maksimalt udbytte til en virksomhed, skal du have en god forståelse for, hvordan denne virksomhed er organiseret, med hvilke spørgsmål og i hvilke situationer kunden vil kontakte assistenten.

At opfinde sager fra bunden er en dårlig idé, logikInteraktionen med klienten skal være reel. Hvis en assistent møder en person på telefonlinjen, er scriptet baseret på et konsulent-, salgs- eller et andet script - en handlingssekvens fra en callcentermedarbejder i dialog med en klient. Når man forbereder et manuskript til en stemmeassistent, hjælper det med at analysere anmodninger fra rigtige brugere, interviews med medarbejdere, der kommunikerer med dem regelmæssigt, eller UX-eksperimenter, der har til formål at finde ud af folks reelle behov.

"Hvis en assistent møder en person på telefonlinjen, så er manuskriptet baseret på et konsulent-, salgs- eller andet manuskript"

Mange kunder forsøger at stemmeassistenten hjalp klienter med at løse problemer, som er svære for dem at håndtere på egen hånd. For eksempel er det bedre at overføre funktioner, der er "dybt" skjulte eller ikke indlysende, når du arbejder i en mobilapplikation, hvis robotten er nået.

Irina Stepanova, designer-analytiker af samtalegrænseflader hos Just AI:"Du skal forstå, at der er en chat i forskellige kanaler,applikation, telefon - klienten opfører sig anderledes. Derfor skal du først og fremmest nøje studere kunderejsekortet i de kanaler, hvor du planlægger at implementere en stemmeassistent. I den visuelle grænseflade har klienten færre måder at lave fejl på - næsten alt, hvad tjenesten har at tilbyde, er for øjnene af ham. I stemmegrænsefladen mærker brugeren ikke tjenestens begrænsninger så godt, og det er nødvendigt at sørge for, at en person kan fremsætte en anmodning til en assistent med en lang sætning, hvori det vil være nødvendigt at fremhæve væsentlige sætninger, som programmet vil afgøre essensen af ​​anmodningen. En separat opgave er at designe et offtopic script, som der ikke er noget færdigt script til. Kunden kan spørge om hvad som helst. Det, der gør en robot til menneske, er variationen af ​​svar, når den besvarer det samme spørgsmål på forskellige måder."

Et af problemerne med at udvikle stemmegrænseflade - synlighed: hvordan fortæller man, hvad assistenten kan, og hvad han kan hjælpe med? Her er det nødvendigt  handle proaktivt - stemme færdigheder og evner og guide brugeren gennem scenariet, foreslå yderligere trin, hjælpe ham i blindgyde grene, når han kommer ind i "behandling af ikke-genkendte anmodninger". Du kan også tale om assistentens evner uden for assistenten selv: i annoncering, forsendelser og brug af andre marketingværktøjer.

Stemmeassistenten skal ikke kun medbringegavne, men også være en interessant samtalepartner. Udviklerne forsøger altid at lægge så meget som muligt ind i "hjernen" af Brand Voice og forsyne den med karakter og personlighed.

Læring er en kontinuerlig proces

Udviklingen af ​​stemmemodellen stopper ikke selv efterdens idriftsættelse. Efter seks måneders arbejde forbedres modellens kvalitet, og efter et år udvikler den sig til ukendelighed. Hvis klienten har tilladt logning, det vil sige optagelse af information om hændelser under betjeningen af ​​stemmeassistenten, så indsamles alle fejldata og bruges til at genoptræne modellen. Logning kan være påkrævet, når assistenten ikke kan genkende bestemte ord og sætninger eller laver fejl i deres udtale, for eksempel i navne på lægemidler eller i sortimentet af en leveringstjeneste.

Oprettelse af en Brand Voice foregår normalt i skyenmiljø og kræver brug af personlige data, hvilket ofte rejser sikkerhedsproblemer blandt kunder. Og selvom mistillid til skyerne er en forældet stereotyp, kan de, hvis det er vigtigt for kunden, at data ikke går ud over virksomhedens perimeter, behandles strengt inden for organisationens IT-kredsløb. Personlige data bruges også under logning, for at sikre deres fortrolighed anonymiseres dataene.

Oprettelse af nye arbejdsscenarier og supplerende træningmodeller for Brand Voice er en løbende proces. Faktisk får klienten ved at bestille en færdiglavet taleløsning en service, som hele tiden bliver forbedret. En stemmeassistent af virkelig høj kvalitet kan ikke kun bemærke personalet i et helt callcenter, men også blive en lys accent, der tilføjer individualitet til virksomhedens image.

Læs mere

Elon Musks Noahs Ark vil tage en million mennesker til Mars

Astronomer fra Japan har fundet en ukendt struktur i galaksen

Sabel af ukendt oprindelse fundet i Grækenland. Forskere undrede sig over en mærkelig artefakt