Älykkäät "puhujat"
Ääni on luonnollinen viestintäväline. Monet ihmiset haluavat ratkaista ongelmat suullisesti
Puheteknologiaa käytetään monilla aloilla,ja ne sopivat kaikille yleisöille: lapsia houkuttelee interaktiivinen "puhuja", nuoret arvostavat älylaitteiden puheohjausta ja avustaja lukee uutisia vanhuksille. Mutta ääniavustajat ovat kysytyimpiä niillä aloilla, joilla on paljon pisteviestintää asiakkaiden kanssa - rahoituksessa, vähittäiskaupassa ja televiestinnässä.
"Puheteknologiaa käytetään monilla alueilla"
Suuret yritykset käyttävät ääntätekniikka ei ole ensimmäinen vuosi. Vuodesta 2017 lähtien Bank of America on pyörittänyt Ericaa, virtuaaliassistenttia. Vuodesta 2018 lähtien Mercedes-Benz on tuonut markkinoille digitaalisen User Experience (MBUX) -kompleksin, joka ymmärtää äänikomentoja. Jälleenmyyjä Walmart on julkaissut Ask Sam -ääniavustajan sovelluksen, joka auttaa asiakkaita tuotehaussa. Adobe Analyticsin mukaan 91 % brändeistä investoi jo voimakkaasti puheratkaisuihin ja suunnittelee lisäävänsä investointeja. Venäjän puhe-AI-markkinat kasvavat 38 prosentista 81 prosenttiin seuraavan viiden vuoden aikana ja saavuttavat 561 miljoonaa dollaria vuonna 2025, Just AI ennustaa.
Uskon - en usko
Yritykset arvioivat toteutuksen tehokkuuttapuheteknologiat, jotka keskittyvät asiakastyytyväisyyteen ja brändiuskoisuuteen. Mutta monet asiakkaat suhtautuvat innovaatioihin hillittynä innostuneena. Voicebot.ai:n mukaan vain 45 % käyttäjistä haluaa nähdä puheavustajat mobiilisovelluksissa. Tärkeimmät syyt inhoamiseen ovat Neuro.netin mukaan vastausten huono laatu ja puheavustajien synteettinen puhe. Nämä ongelmat ovat tyypillisiä edellisen sukupolven teknologioihin rakennetuille rajapinnoille. Nykyaikaiset koneoppimisalgoritmit mahdollistavat sieluttomien äänien syntetisoinnin.
Toinen rajoittava tekijä on sepuheteknologiat ovat yleistyneet sekä asiakkaan kannalta "hyvissä" että "huonoissa" skenaarioissa. Markkinoilla ei ole vielä niin paljon äänirajapintojen kehittämiseen erikoistuneita yrityksiä, ja niiden tarjoamien äänten määrä on rajallinen. Osoittautuu, että jos tänään henkilöä vaivaa mainonta tai petolliset puhelut ja huomenna soi hyödyllinen puhelu, viestintä ei onnistu, koska "kaikilla roboteilla on yksi ääni". Jos puheavustajan maine vaurioituu, asiakkaalle hyödyllisten puheluiden tehokkuus putoaa nollaan. Siksi Brand Voice luodaan - ainutlaatuinen brändiääni.
”Ainutlaatuinen ääni on tärkeä osa brändiä, mmlogo tai yrityksen fontti. Yhä useammat asiakkaamme käyttävät tätä ominaisuutta ja ovat tekemisissä asiakkaiden kanssa ainutlaatuisilla äänillä. Tallennamme joukon lauseita tietyllä intonaatiolla yrityksen työntekijän tai kuuluttajan ääneen. Ja lukuisia dynaamisia tietoja - puhelinnumeroita tai osoitteita - itseoppiva järjestelmä luo automaattisesti, toistaen työntekijän äänen ja ylläpitäen realistisia intonaatioita. Näin yritykset automatisoivat viestintää, mutta säilyttävät asiakasuskollisuuden ja lisäävät konversioita: ihmiset ovat tyytyväisiä, että heille puhutaan vilkkaalla äänellä ja he ovat halukkaita käymään dialogia.
Ivan Artemiev, MTT:n tuotejohtaja
Puhu malli
Valmiin Brand Voicen hinta alkaa 150 eurostatuhat ruplaa ja riippuu puhesynteesimallin laajuudesta ja monimutkaisuudesta. Ratkaisun luomisprosessi koostuu kahdesta osasta - teknisestä ja loogisesta, joista kummastakin vastaa oma tuotetiimi.
Tärkeä askel tässä osassa on äänen valinta päällejolla puhe syntetisoidaan. Äänen intonaation tulee heijastaa niitä brändin ominaisuuksia, joita yrityksen on tärkeää edistää. Ammattimainen juontaja tai jälkiäänitysnäyttelijä joutuu puhumaan jopa 40 tuntia kielirakenteita tallenteen alla. Nauhoituksen tulee olla laadukasta, ilman turhaa kohinaa ja ääntämisen tulee olla oikea, sillä äänirobottimalli opetetaan tällä materiaalilla.
Kouluttaa malli ja toteuttaa täysimittainensynteesi kestää kuukaudesta kuuteen kuukauteen monimutkaisuudesta riippuen. Mutta tekniikka kehittyy, ja tallennusaika studiossa vähenee vähitellen. On mahdollista, että tulevaisuudessa on mahdollista saada hyvä äänirobotti käyttämällä vain 2-3 tuntia alkuperäistä ääntä.
"Valmistun Brand Voicen hinta alkaa 150 000 ruplasta"
Tekoälyn oppiminen
Kun tallennus on valmis, harjoitus alkaaäänimalli. Hän käsittelee nauhoitettua materiaalia, oppii toistamaan ääntään ja sen seurauksena hän pystyy syntetisoimaan puhetta mistä tahansa mielivaltaisesta tekstistä.
Tämän luokan ongelmien ratkaisemiseksiTransformers on syvä hermoverkkoarkkitehtuuri, jonka Google Brain -tutkijat esittelivät vuonna 2017. Tunnetuimmat muuntajat ovat voittoa tavoittelemattoman OpenAI:n GPT (Generative Pre-trained Transformer) -hermoverkot. Tämän tekniikan avulla voit esimerkiksi täyttää aukon tai ennustaa seuraavan sanan lauseessa aikaisempien sanojen perusteella.
Tämän periaatteen mukaisesti luodaan äänibrändejä.Ääniratkaisut. Koulutettua mallia ajetaan valtavalla datamäärällä - useita malleja käynnistetään eri parametreillä ja paras valitaan lähdössä. On tärkeää, että robotti "kääntää" tekstin oikein ääneksi, ei tee virheitä ääntämisessä ja intonaatiossa. Synteesin laadun parantamiseksi mallia on edelleen koulutettu tiettyihin käyttötapauksiin, jolloin saadaan mahdollisimman luonnolliselta kuulostavat äänet.
Missä on logiikka?
Robotin semanttinen sisältö, sen liiketoimintalogiikka jaskenaariot vuorovaikutuksesta ihmisten kanssa luodaan läheisessä yhteistyössä asiakkaan kanssa. Jotta ääniassistentti tuo yritykselle mahdollisimman paljon hyötyä, sinulla on oltava hyvä käsitys siitä, miten tämä liiketoiminta on organisoitu, millä kysymyksillä ja millaisissa tilanteissa asiakas ottaa yhteyttä avustajaan.
Tapausten keksiminen tyhjästä on huono idea, logiikkaVuorovaikutuksen asiakkaan kanssa tulee olla todellista. Jos avustaja tapaa henkilön puhelinlinjalla, käsikirjoitus perustuu konsultointi-, myynti- tai johonkin muuhun käsikirjoitukseen - puhelinkeskuksen työntekijän toimintosarjaan dialogissa asiakkaan kanssa. Kun valmistellaan käsikirjoitusta puheavustajalle, se auttaa analysoimaan oikeiden käyttäjien pyyntöjä, haastatteluja heidän kanssaan säännöllisesti kommunikoivien työntekijöiden kanssa tai UX-kokeiluja, joiden tarkoituksena on selvittää ihmisten todelliset tarpeet.
"Jos assistentti tapaa henkilön puhelinlinjalla, niin käsikirjoitus perustuu konsultointiin, myyntiin tai johonkin muuhun käsikirjoitukseen"
Monet asiakkaat yrittävät puhuaAssistentti auttoi asiakkaita ratkaisemaan asioita, joita heidän on vaikea ratkaista yksin. Esimerkiksi robotin armoilla on parempi siirtää toimintoja, jotka ovat "syvästi" piilossa tai eivät ilmene mobiilisovelluksessa työskennellessä.
Irina Stepanova, Just AI:n keskustelurajapintojen suunnittelija-analyytikko:"Sinun on ymmärrettävä, että eri kanavilla on chattia,sovellus, puhelin - asiakas käyttäytyy eri tavalla. Siksi sinun on ensin tutkittava huolellisesti asiakkaan matkakartta niissä kanavissa, joissa aiot ottaa puheavustajan käyttöön. Visuaalisessa käyttöliittymässä asiakkaalla on vähemmän tapoja tehdä virheitä - hänen silmiensä edessä on lähes kaikki palvelun tarjoama. Äänirajapinnassa käyttäjä ei tunne palvelun rajoituksia niin hyvin, ja on tarpeen varmistaa, että henkilö voi ilmaista pyynnön avustajalle pitkällä lauseella, jossa on tarpeen korostaa tärkeitä lauseita, joilla ohjelma määrittää pyynnön olemuksen. Erillinen tehtävä on suunnitella offtopic-skripti, jolle ei ole valmiita skriptejä. Asiakas voi kysyä mitä tahansa. Se mikä tekee robotista ihmisen, on vastausten vaihtelevuus, kun se vastaa samaan kysymykseen eri tavoin."
Yksi äänen kehittämisen ongelmistakäyttöliittymä - löydettävyys: kuinka kertoa, mitä avustaja voi tehdä ja missä hän voi auttaa? Täällä se on välttämätöntä toimi ennakoivasti – puhu taidot ja kyvyt ja ohjaa käyttäjää skenaarion läpi ehdottamalla lisätoimenpiteitä, auta häntä umpikujassa, kun hän joutuu "tunnistamattomien pyyntöjen käsittelyyn". Assistentin kyvyistä voi puhua myös itse assistentin ulkopuolella: mainonnassa, postituksissa ja muiden markkinointityökalujen käytössä.
Ääniavustajan ei pitäisi vain tuodahyötyä, mutta olla myös mielenkiintoinen keskustelija. Kehittäjät yrittävät aina laittaa mahdollisimman paljon Brand Voicen "aivoihin" ja antaa sille luonnetta ja persoonallisuutta.
Oppiminen on jatkuva prosessi
Äänimallin kehitys ei pysähdy sen jälkeenkäänsen käyttöönotto. Kuuden kuukauden työn jälkeen mallin laatu paranee, ja vuoden kuluttua se kehittyy tuntemattomaksi. Jos asiakas on sallinut kirjaamisen eli tietojen tallentamisen tapahtumista puheavustajan toiminnan aikana, niin kaikki virhetiedot kerätään ja niitä käytetään mallin uudelleenopettamiseen. Kirjaaminen voi olla tarpeen, kun avustaja ei tunnista tiettyjä sanoja ja lauseita tai tekee niiden ääntämisessä virheitä, esimerkiksi lääkkeiden nimissä tai jakelupalvelun valikoimassa.
Brändiäänen luominen tapahtuu yleensä pilvessäja edellyttää henkilötietojen käyttöä, mikä usein herättää turvallisuuteen liittyviä huolenaiheita asiakkaiden keskuudessa. Ja vaikka epäluottamus pilviä kohtaan on vanhentunut stereotypia, jos asiakkaalle on tärkeää, että tiedot eivät mene yrityksen rajojen ulkopuolelle, niitä voidaan käsitellä tiukasti organisaation IT-piirin sisällä. Henkilötietoja käytetään myös kirjautumisen yhteydessä, niiden luottamuksellisuuden varmistamiseksi tiedot anonymisoidaan.
Uusien työskenaarioiden luominen ja lisäkoulutusBrand Voicen mallien kehittäminen on jatkuva prosessi. Itse asiassa tilaamalla valmiin puheratkaisun asiakas saa palvelun, jota kehitetään jatkuvasti. Todella laadukas ääniassistentti ei vain huomaa koko puhelinkeskuksen henkilökuntaa, vaan hänestä tulee myös kirkas aksentti, joka lisää yksilöllisyyttä yrityksen imagoon.
Lue lisää
Elon Muskin Nooan arkki vie miljoona ihmistä Marsiin
Japanilaiset tähtitieteilijät ovat löytäneet galaksista tuntemattoman rakenteen
Tuntematonta alkuperää oleva sapeli löydetty Kreikasta. Tutkijat ihmettelevät outoa esinettä