Akıllı "konuşanlar"
Ses doğal bir iletişim aracıdır. Birçok kişi sorunları sözlü olarak çözmek istiyor
Ses teknolojileri birçok alanda kullanılmaktadır,ve herhangi bir izleyici kitlesi için uygundurlar: çocuklar etkileşimli bir "konuşmacı" tarafından cezbedilir, gençler akıllı cihazların sesle kontrolünü takdir eder ve bir asistan haberi yaşlılara okur. Ancak sesli asistanlar, müşterilerle çok sayıda nokta iletişiminin olduğu finans, perakende ve telekom sektörlerinde en çok talep görüyor.
“Ses teknolojileri birçok alanda kullanılıyor”
Büyük şirketler ses kullanırteknoloji ilk yıl değil. Bank of America, 2017'den beri sanal asistan olan Erica'yı yönetiyor. Mercedes-Benz, 2018'den beri sesli komutları anlayan bir dijital Kullanıcı Deneyimi (MBUX) kompleksi sunuyor. Perakendeci Walmart, müşterilere ürün aramada yardımcı olan Ask Sam sesli asistanıyla bir uygulama başlattı. Adobe Analytics'e göre, markaların %91'i halihazırda ses çözümlerine yoğun yatırım yapıyor ve yatırımı artırmayı planlıyor. Just AI, Rus konuşma AI pazarının önümüzdeki beş yıl içinde %38'den %81'e büyüyeceğini ve 2025'te 561 milyon dolara ulaşacağını tahmin ediyor.
inanıyorum - inanmıyorum
İşletme, uygulamanın etkinliğini değerlendirirses teknolojileri, müşteri memnuniyeti ve marka sadakatine odaklanıyor. Ancak birçok müşteri yeniliğe sınırlı bir coşkuyla bakıyor. Voicebot.ai'ye göre kullanıcıların sadece %45'i mobil uygulamalarda sesli asistan görmek istiyor. Neuro.net'e göre hoşlanmamanın ana nedenleri, cevapların kalitesizliği ve sesli asistanların sentetik konuşmasıdır. Bu sorunlar, geçmiş neslin teknolojileri üzerine kurulu arayüzler için tipiktir. Modern makine öğrenimi algoritmaları, ruhsuzluktan yoksun sesleri sentezlemeyi mümkün kılar.
Bir diğer sınırlayıcı faktör ise,ses teknolojileri hem müşteri açısından "iyi" senaryolarda hem de "kötü" senaryolarda yaygınlaştı. Piyasada henüz ses arabirimlerinin geliştirilmesi konusunda uzmanlaşmış çok fazla şirket yok ve sunabilecekleri ses sayısı sınırlı. Bugün bir kişi reklamlardan veya sahte aramalardan rahatsız olursa ve yarın yararlı bir arama çalarsa, iletişimin başarılı olmayacağı ortaya çıkıyor, çünkü "tüm robotların bir sesi var". Sesli asistanın itibarı zedelenirse, müşteri için faydalı olan çağrıların etkinliği sıfıra düşer. Bu nedenle, Brand Voice oluşturulur - benzersiz bir marka sesi.
“Benzersiz bir ses, bir markanın önemli bir parçasıdır, çünkülogo veya kurumsal yazı tipi. Gittikçe daha fazla müşterimiz bu özelliği kullanıyor ve müşterilerle benzersiz seslerden etkileşim kuruyor. Bir şirket çalışanının veya bir spikerin sesinde belirli bir tonlama ile bir dizi cümle kaydederiz. Ve sayısız dinamik veri - telefon numaraları veya adresler - kendi kendine öğrenen sistem otomatik olarak oluşturur, çalışanın sesini yeniden üretir ve gerçekçi tonlamaları korur. Şirketler bu şekilde iletişimi otomatikleştirir, ancak müşteri sadakatini korur ve dönüşümü artırır: İnsanlar kendileriyle canlı bir sesle konuşulmasından memnundur ve diyalog kurmaya isteklidir.”
Ivan Artemiev, MTT Ürün Direktörü
Modeli söyle
Bitmiş Brand Voice maliyeti 150'den başlarbin ruble ve ses sentezi modelinin kapsamına ve karmaşıklığına bağlıdır. Çözüm oluşturma süreci iki bölümden oluşur - teknik ve mantıksal, her biri ayrı bir ürün ekibinin sorumluluğundadır.
Bu bölümdeki önemli bir adım, ses seçimidir.hangi konuşmanın sentezleneceği. Ses, şirketin tanıtması için önemli olan bu marka özelliklerini tonlamalı olarak yansıtmalıdır. Profesyonel bir spiker veya dublaj sanatçısı, kayıt altında 40 saate kadar dil yapılarını konuşmalıdır. Ses robotu modeli bu materyal üzerinde eğitileceği için kayıt, gereksiz gürültü olmadan yüksek kalitede olmalı ve telaffuz doğru olmalıdır.
Modeli eğitmek ve tam teşekküllü bir uygulama yapmaksentez, karmaşıklığa bağlı olarak bir aydan altı aya kadar sürer. Ancak teknoloji ilerliyor ve stüdyoda kayıt süresi giderek azalıyor. Gelecekte, orijinal sesin yalnızca 2-3 saatini kullanarak iyi bir ses robotu elde etmek mümkün olabilir.
“Bitmiş bir Marka Sesi maliyeti 150.000 ruble'den başlıyor”
Yapay zeka öğrenmek
Kayıt hazır olduğunda eğitim başlarses modeli. Kaydedilen materyali işler, sesini yeniden üretmeyi öğrenir ve sonuç olarak herhangi bir rastgele metinden konuşma sentezleyebilir.
Bu sınıftaki problemleri çözmek için,Transformers, Google Brain araştırmacıları tarafından 2017 yılında tanıtılan derin bir sinir ağı mimarisidir. En ünlü transformatörler, kar amacı gütmeyen OpenAI organizasyonunun GPT (Generative Pre-trained Transformer) sinir ağlarıdır. Bu teknoloji, örneğin, bir boşluğu en doğru şekilde doldurmanıza veya önceki kelimelere dayalı olarak bir cümledeki bir sonraki kelimeyi tahmin etmenize olanak tanır.
Bu prensibe göre ses markaları oluşturulur.Ses çözümleri. Eğitilen model büyük miktarda veri üzerinde çalıştırılır - farklı parametrelerle birkaç model başlatılır ve çıktıda en iyisi seçilir. Robotun metni doğru bir şekilde sese “çevirmesi”, telaffuz ve tonlamada hata yapmaması önemlidir. Sentez kalitesini artırmak için model, en doğal sesleri elde etmenize olanak tanıyan belirli kullanım durumları için daha fazla eğitilmiştir.
mantık nerede?
Robotun anlamsal içeriği, iş mantığı veinsanlarla etkileşim senaryoları müşteri ile yakın işbirliği içinde oluşturulur. Bir sesli asistanın bir işletmeye maksimum fayda sağlaması için bu işin nasıl organize edildiğini, hangi sorularla ve müşterinin asistanla hangi durumlarda iletişime geçeceğini iyi anlamanız gerekir.
Vakaları sıfırdan icat etmek kötü bir fikirdir, mantıkMüşteri ile etkileşim gerçek olmalıdır. Bir asistan telefon hattında bir kişiyle tanışırsa, senaryo bir danışmanlık, satış veya başka bir senaryoya dayanır - bir çağrı merkezi çalışanının bir müşteriyle diyalog halindeki bir dizi eylemi. Sesli asistan için senaryo hazırlanırken gerçek kullanıcıların isteklerinin analiz edilmesi, kendileriyle düzenli olarak iletişim kuran çalışanlarla yapılan görüşmeler veya insanların gerçek ihtiyaçlarını ortaya çıkarmaya yönelik UX deneyleri yapılmasına yardımcı olur.
“Bir asistan telefon hattında biriyle tanışırsa, senaryo bir danışmanlık, satış veya başka bir senaryoya dayanır”
Birçok müşteri ses çıkarmaya çalışıyorasistan, müşterilerin kendi başlarına halletmeleri zor olan sorunları çözmelerine yardımcı oldu. Örneğin, robotun insafına kalmış bir şekilde, bir mobil uygulamada çalışırken "derinden" gizli olan veya açık olmayan işlevleri aktarmak daha iyidir.
Just AI'da konuşma arayüzleri tasarımcı-analisti Irina Stepanova:“Farklı kanallarda bir sohbet olduğunu anlamalısınız,uygulama, telefon - istemci farklı davranır. Bu nedenle öncelikle sesli asistan uygulamayı planladığınız kanallarda müşteri yolculuk haritasını dikkatlice incelemelisiniz. Görsel arayüzde, müşterinin hata yapmak için daha az yolu vardır - hizmetin sunduğu neredeyse her şey gözlerinin önündedir. Sesli arayüzde, kullanıcı hizmetin sınırlamalarını o kadar iyi hissetmiyor ve bir kişinin bir asistana bir talebi uzun bir cümle ile seslendirebilmesini sağlamak gerekiyor, burada önemli cümleleri vurgulamanın gerekli olacağı uzun bir cümle. program, talebin özünü belirleyecektir. Ayrı bir görev, hazır komut dosyası olmayan bir konu dışı komut dosyası tasarlamaktır. Müşteri her şeyi sorabilir. Bir robotu insan yapan şey, aynı soruya farklı şekillerde cevap verdiğinde cevapların değişkenliğidir.”
Ses geliştirmedeki sorunlardan biriarayüz - keşfedilebilirlik: asistanın ne yapabileceğini ve neye yardımcı olabileceğini nasıl anlayabiliriz? Burada gerekli proaktif hareket edin - becerileri ve yetenekleri seslendirin ve kullanıcıya senaryo boyunca rehberlik edin, daha ileri adımlar önerin, "tanınmayan isteklerin işlenmesine" girdiğinde çıkmaz dallarda ona yardımcı olun. Asistanın, asistanın kendisi dışındaki yeteneklerinden de bahsedebilirsiniz: reklamcılık, postalama ve diğer pazarlama araçlarını kullanma.
Sesli asistan sadeceyararlanın, aynı zamanda ilginç bir konuşmacı olun. Geliştiriciler her zaman Brand Voice'un “beynine” mümkün olduğunca çok şey koymaya, ona karakter ve kişilik kazandırmaya çalışıyorlar.
Öğrenme sürekli bir süreçtir
Ses modelinin gelişimi sonra bile durmuyoronun devreye alınması. Altı aylık bir çalışmadan sonra modelin kalitesi artar ve bir yıl sonra tanınmayacak kadar gelişir. İstemci günlüğe kaydetmeye, yani sesli asistanın çalışması sırasında olaylarla ilgili bilgileri kaydetmeye izin verdiyse, tüm hata verileri toplanır ve modeli yeniden eğitmek için kullanılır. Asistan belirli kelimeleri ve cümleleri tanıyamadığında veya örneğin ilaç adlarında veya bir teslimat hizmetinin çeşitlerinde telaffuzlarında hata yaptığında günlük kaydı gerekebilir.
Bir Marka Sesi oluşturmak genellikle bulutta gerçekleşirortamında ve genellikle müşteriler arasında güvenlik endişelerine yol açan kişisel verilerin kullanılmasını gerektirir. Bulutlara duyulan güvensizlik modası geçmiş bir klişe olsa da, müşteri için verilerin şirketin sınırlarının ötesine geçmemesi önemliyse, bunlar kesinlikle kuruluşun BT devresi içinde işlenebilir. Kişisel veriler ayrıca günlük kaydı sırasında kullanılır, gizliliklerini sağlamak için veriler anonimleştirilir.
Yeni çalışma senaryolarının oluşturulması ve ek eğitimBrand Voice modelleri devam eden bir süreçtir. Aslında, müşteri hazır bir ses çözümü sipariş ederek sürekli gelişen bir hizmet alır. Gerçekten yüksek kaliteli bir sesli asistan, yalnızca tüm bir çağrı merkezinin personelini fark etmekle kalmaz, aynı zamanda şirketin imajına bireysellik katan parlak bir aksan haline gelir.
Daha fazla oku
Elon Musk'ın Nuh'un Gemisi Bir Milyon İnsanı Mars'a Götürecek
Japonya'dan gökbilimciler galakside bilinmeyen bir yapı buldular
Yunanistan'da bulunan bilinmeyen bir kılıç. Bilim adamları garip bir eser tarafından şaşkına döndü