Паметни "говорници"
Глас је природно средство комуникације. Многи људи желе да решавају проблеме усмено, а не
Гласовне технологије се користе у многим областима,и погодни су за сваку публику: децу привлачи интерактивни „говорник“, млади цене гласовну контролу паметних уређаја, а помоћник чита вести старијима. Али гласовни асистенти су најтраженији у оним индустријама у којима постоји много тачака комуникације са купцима - у финансијама, малопродаји и телекомуникацијама.
„Гласовне технологије се користе у многим областима“
Велике компаније користе гластехнологија није прва година. Од 2017. Банка Америке води Ерику, виртуелног асистента. Од 2018. Мерцедес-Бенз уводи комплекс дигиталног корисничког искуства (МБУКС) који разуме гласовне команде. Продавац Валмарт је покренуо апликацију са гласовним асистентом Аск Сам, која помаже купцима у тражењу производа. Према Адобе Аналитицс-у, 91% брендова већ улаже велика средства у гласовна решења и планирају да повећају улагања. Руско тржиште говорне вештачке интелигенције у наредних пет година ће порасти са 38 на 81 одсто и 2025. достићи ниво од 561 милион долара, предвиђа Јуст АИ.
Верујем - не верујем
Пословање процењује ефикасност имплементацијегласовне технологије, фокусирајући се на задовољство купаца и лојалност бренду. Али многи купци гледају на иновације са уздржаним ентузијазмом. Према Воицебот.аи, само 45% корисника жели да види гласовне асистенте у мобилним апликацијама. Главни разлози несвиђања, према Неуро.нет-у, су лош квалитет одговора и синтетички говор гласовних асистената. Ови проблеми су типични за интерфејсе изграђене на технологијама претходне генерације. Савремени алгоритми машинског учења омогућавају да се синтетизују гласови лишени бездушности.
Други ограничавајући фактор је тогласовне технологије су постале распрострањене како у „добрим” сценаријима са становишта клијента, тако и у „лошим”. На тржишту још нема толико компанија специјализованих за развој говорних интерфејса, а број гласова које могу да понуде је ограничен. Испоставља се да ако данас човеку смета реклама или лажни позиви, а сутра се огласи користан позив, комуникација неће бити успешна, јер „сви роботи имају један глас“. Ако је репутација гласовног асистента нарушена, ефикасност позива корисних за клијента пада на нулу. Стога је креиран Бранд Воице - јединствени глас бренда.
„Јединствени глас је важан део бренда, каологотип или корпоративни фонт. Све више и више наших клијената користи ову функцију и комуницира са клијентима јединственим гласовима. Снимамо скуп фраза са одређеном интонацијом у гласу запосленог у компанији или спикера. И бројне динамичке податке – телефонске бројеве или адресе – систем за самоучење аутоматски генерише, репродукујући глас запосленог и одржавајући реалистичне интонације. На овај начин компаније аутоматизују комуникацију, али задржавају лојалност купаца и повећавају конверзију: људи су задовољни што се са њима разговара живахним гласом и спремни су да воде дијалог.”
Иван Артемиев, директор производа МТТ
Говори модел
Цена готовог Бранд Воицеа почиње од 150хиљада рубаља и зависи од обима и сложености модела синтезе гласа. Процес креирања решења састоји се из два дела – техничког и логичког, за сваки је одговоран посебан производни тим.
Важан корак у овом делу је избор гласа, нана којој ће се синтетизовати говор. Глас треба интонацијски да одражава оне атрибуте бренда које је важно да компанија промовише. Професионални спикер или глумац синхронизације ће морати да говори до 40 сати језичких конструкција испод снимка. Снимак треба да буде квалитетан, без непотребне буке, а изговор тачан, јер ће се на овом материјалу обучавати модел гласовног робота.
За обуку модела и имплементацију пуноправногсинтеза траје од месец до шест месеци, у зависности од сложености. Али технологија напредује, а време снимања у студију постепено се смањује. Могуће је да ће у будућности бити могуће добити добар гласовни робот користећи само 2-3 сата оригиналног звука.
„Цена готовог Бранд Воице-а почиње од 150.000 рубаља”
Учење вештачке интелигенције
Када је снимак спреман, почиње обукагласовни модел. Она обрађује снимљени материјал, учи да репродукује свој глас и као резултат тога може да синтетише говор из било ког произвољног текста.
Да бисте решили ову класу проблема,Трансформерс је архитектура дубоке неуронске мреже коју су 2017. представили истраживачи Гоогле Браин. Најпознатији трансформатори су ГПТ (Генеративе Пре-траинед Трансформер) неуронске мреже непрофитне организације ОпенАИ. Ова технологија, на пример, омогућава вам да најтачније попуните празнину или предвидите следећу реч у фрази на основу претходних речи.
По овом принципу креирају се гласовни брендови.Гласовна решења. Обучени модел се покреће на огромној количини података - покреће се неколико модела са различитим параметрима и на излазу се бира најбољи. Важно је да робот правилно „преводи“ текст у глас, да не прави грешке у изговору и интонацији. Да би се побољшао квалитет синтезе, модел је додатно обучен за специфичне случајеве употребе, што вам омогућава да добијете најприродније гласове.
Где је ту логика?
Семантички садржај робота, његова пословна логика исценарији интеракције са људима креирају се у блиској сарадњи са купцем. Да би гласовни асистент донео максималну корист послу, потребно је да добро разумете како је овај посао организован, са којим питањима и у којим ситуацијама ће се клијент обратити асистенту.
Измишљање случајева од нуле је лоша идеја, логикаИнтеракција са клијентом мора бити стварна. Ако помоћник сретне особу на телефонској линији, онда се скрипта заснива на консултантском, продајном или неком другом сценарију - низу радњи запосленог у кол центру у дијалогу са клијентом. Приликом припреме скрипте за гласовног асистента, помаже у анализи захтева стварних корисника, интервјуима са запосленима који редовно комуницирају са њима или УКС експериментима који имају за циљ да сазнају стварне потребе људи.
„Ако асистент сретне особу на телефонској линији, онда је сценарио заснован на консултантској, продајној или некој другој скрипти“
Многи купци покушавају да се изјаснеасистент је помагао клијентима да реше проблеме са којима сами тешко могу да се изборе. На пример, на милост и немилост робота, боље је пренети функције које су „дубоко“ скривене или нису очигледне када радите у мобилној апликацији.
Ирина Степанова, дизајнер-аналитичар конверзацијских интерфејса у Јуст АИ:„Морате схватити да на различитим каналима постоји ћаскање,апликација, телефон - клијент се понаша другачије. Стога, пре свега, морате пажљиво проучити мапу пута купца на оним каналима на којима планирате да имплементирате гласовног помоћника. У визуелном интерфејсу, клијент има мање начина да погреши – пред очима му је скоро све што сервис има. У гласовном интерфејсу, корисник не осећа тако добро ограничења сервиса, те је неопходно обезбедити да особа може да упути захтев помоћнику дугачком фразом у којој ће бити потребно истаћи значајне фразе којима програм ће утврдити суштину захтева. Посебан задатак је дизајнирање оффтопиц скрипте за коју не постоји готова скрипта. Клијент може да пита било шта. Оно што робота чини човеком је варијабилност одговора, када на исто питање одговара на различите начине.”
Један од проблема у развоју гласаинтерфејс – могућност откривања: како рећи шта асистент може да уради и у чему може да помогне? Овде је неопходно&нбсп; делујте проактивно – гласовним вештинама и способностима и водите корисника кроз сценарио, предлажући даље кораке, помажу му у ћорсокацима када уђе у „обраду непрепознатих захтева“. О способностима асистента можете разговарати и ван самог асистента: у оглашавању, слању поште и коришћењу других маркетиншких алата.
Гласовни асистент не треба само да донесеимати користи, али и бити занимљив саговорник. Програмери увек покушавају да унесу што је више могуће у „мозак“ Бранд Воице-а, дајући му карактер и личност.
Учење је континуиран процес
Развој гласовног модела не престаје ни послењегово пуштање у рад. Након шест месеци рада, квалитет модела се побољшава, а након годину дана развија се до непрепознатљивости. Ако је клијент дозволио логовање, односно снимање информација о догађајима током рада гласовног асистента, тада се прикупљају сви подаци о грешкама и користе се за поновну обуку модела. Евидентирање може бити потребно када асистент не може да препозна одређене речи и фразе или прави грешке у њиховом изговору, на пример, у називима лекова или у асортиману услуге доставе.
Креирање Гласа бренда се обично одвија у облакуокружење и захтева коришћење личних података, што често изазива забринутост за безбедност код купаца. И иако је неповерење у облаке застарели стереотип, ако је за клијента важно да подаци не излазе изван периметра компаније, они се могу обрадити стриктно унутар ИТ кола организације. Лични подаци се такође користе приликом логовања, како би се обезбедила њихова поверљивост, подаци су анонимизовани.
Креирање нових сценарија рада и додатна обукамодели за Бранд Воице је процес који је у току. У ствари, наручивањем готовог говорног решења, клијент добија услугу која се стално унапређује. Заиста квалитетан гласовни асистент не само да може приметити особље целог цалл центра, већ и постати светао акценат који додаје индивидуалност имиџу компаније.
Опширније
Нојева арка Елона Маска одвешће милион људи на Марс
Астрономи из Јапана пронашли су непознату структуру у галаксији
Сабља непознатог порекла пронађена у Грчкој. Научници су збуњени чудним артефактом