Pievienojiet balsi un seju savai runas vadītai sistēmai bez nepieciešamā mākoņa

Kent Hovind - Seminar 2 - The Garden of Eden [MULTISUBS] (Jūnijs 2019).

$config[ads_text] not found
Anonim

Sensorā tiek piedāvāta chatbot un iemiesojumu tehnoloģija, kas paredzēta patērētāju ierīcēm un lietotnēm

Izstrādātājiem ir jauna veida balss saskarnes opcija saviem patēriņa produktiem un lietotnēm, un tā var būt arī seja. Runas un redzes tehnoloģiju kompānija, Sensory, tikko paziņoja par chatbot funkciju savai runas atpazīšanas platformai TrulyNatural. Vienkārši sakot, sistēma atbalsta sejas animāciju AI palīgam, kustība tiek sinhronizēta ar runu, un tā darbojas pilnībā ierīcē, un nav nepieciešams tiešs interneta savienojums.

Saskaņā ar paziņojumu, ko izlaidusi Sensory, TrulyNatural var ļaut patēriņa precēm un lietojumprogrammām izmantot balss vadītu interfeisu, kas piedāvā vairāk sarunvalodas stilu. Tās jaunais chatbot atbalsts nodrošina dialoga vadību un skriptu izstrādi, un tas ir paredzēts, lai dinamiski veidotu digitālās iemiesojuma mutes kustības, lai atspoguļotu runāto vārdu. Saskaņā ar "Sensory", Todd Mozer izpilddirektors, jaunās funkcijas ļauj izstrādātājiem izveidot jaunu vizuālo balss interfeisu par patēriņa precēm un lietotnēm.

Ikona interfeiss izmanto nelineāro morfēšanas tehnoloģiju, kas ļauj sejas un mutes kustības starp visemām (vizuālās fonēmu attēlojums) izskatīties reāli, pat ja tās ir pilnīgi automatizētas. Sensorā tiek izmantotas diezgan ierastās pieejas runas atpazīšanai aiz chatbot sejas, bet tiem nav nepieciešams mākoņa savienojums. Mozer teica, ka viņa komandai ir patentētas pieejas, lai sabruktu modeļa izmēru un padarītu stabilu runas atpazīšanas tehnoloģiju piemērotu mazāku izmēru, ļaujot to iekļaut atsevišķā sistēmā. "Tradicionālās pieejas, kuras mēs izmantojam, ir mašīnmācīšanās metodes, statistiskās valodas modelēšana, dažādas dabiskās valodas pieejas (veidlapu aizpildīšana, valodas parsēšana, vārdu maisiņš, atkritumu modelēšana), slēpta Markova modelēšana, mācīšanās akustiskie modeļi ", teica Mozers.

Lai gan mākonis balstīta runas atpazīšana ir viss hype tieši tagad, Mozer Intervijā teicis Electronic Products, ka mākonis nav vairākas priekšrocības. Reakcijas ātrums, pieejamības konsekvence, zemākas sistēmas izmaksas un zemākas joslas platuma izmaksas ir dažas no tehniskajām priekšrocībām. "Un lietošanas dati tiek glabāti privāti, " teica Mozers. Viņš piebilda, ka pašpietiekama sistēma nespēj atpazīt tik daudz vārdus kā mākoņsistēma, bet "Sensorā nemēģina izveidot vispārēju palīgu. Šī ir īpaša domēna pieeja, ko var izmantot mājsaimniecības produktiem vai kioskai. "

Viens no chatbot mērķiem, kas vērsts uz patērētāju ierīcēm un mobilajām lietotnēm, ir uzlabot darījumus. Piemēram, ātrās ēdināšanas ķēdē var būt iemiesojums, kas pieņem un apstiprina pasūtījumus. Saskaņā ar Mozer, šī pieeja varētu būt mazāk pakļauta kļūdām un, atšķirībā no cilvēka darbinieka, iemiesojums nebūtu nogurusi. Patērētājam šāda pieeja varētu mazināt gaidīšanas pieredzi.

Tomēr sauss ar balsi ir tikai sākums. AI nākotne, Mozer teica, notiks daudzos veidos. Daži AI būs aprīkoti tikai ar runas palīgu, savukārt citiem digitālajiem asistentiem būs sejas un personības. Pieredze varētu būt iegulta, un citos laikos tas notiks mākoņos. Kopumā nav nevienas pareizas pieejas, jo dažādās situācijās pastāv atšķirīgas vajadzības, un tehnoloģija turpinās attīstīties.

"Ironiski, Sensory redzēja ideju vārdu kā niša pirms 10 gadiem, " teica Mozer. "Ikviens bija hit pogas, lai izsauktu atpazīšanas ierīces, un mēs nāca klajā ar pieeju, kurā jūs varētu vienkārši piezvanīt uz ierīci. Es domāju, ka Sensory patiešām ir izstrādājusi pirmo Siri un Google aktivizētāju. "Tagad vārdu lietošana ir izplatīta, un varbūt kādu dienu, tā būs pokera avatar.

Tomēr tas attīstās, AI nākotne izskatās daudzsološa.