Kāpēc Silicon Valley Giants derības balss tehnoloģiju?

- Nov 29, 2018-

Amazon bija tikai tiešsaistes mazumtirgotājs un galvenais tiešsaistes tīmekļa mitināšanas pakalpojumu sniedzējs uzņēmumam tikai pirms četriem gadiem. Tā arī pārdod savu plaša patēriņa elektronikas produktu līniju, ieskaitot iekurt e-lasītāju, kas tajā laikā bija drosmīgs mēģinājums. .

Amazon ir iedvesmojis lielāko pārmaiņu personālajos datoros un komunikācijās, pateicoties visaptverošajam Amazon Echo viedajam skaļrunim un tā Alexa runas atpazīšanas dzinējam, jo Steve Jobs sāka savu Apple tālruni.

Sākumā viss tas, šķiet, ir ļoti jauns. 2014. gada novembrī Amazon vispirms uzsāka Echo Smart Speaker - augsto tehnoloģiju vedni, kas izmanto mākslīgo intelektu, lai saņemtu informāciju par cilvēkiem. Tas var skenēt miljoniem vārdu interneta datubāzē un sniegt dažādas atbildes.

Pašlaik, kad Amazon pārdeva aptuveni 47 miljonus Echo ierīču kopumā, Echo arī apkalpo patērētājus 80 valstīs, apstrādājot vidēji 130 miljonus problēmu dienā. Alexa ir nosaukta pēc senās Ēģiptes bibliotēkas Alexandria, kas var pieņemt mūzikas pieprasījumus, sniegt laika prognozi un sporta rezultātu informāciju, kā arī attālināti pielāgot lietotāja termostatu. Tā var arī stāstīt jokiem: atbildēt uz trivāliem jautājumiem, pat daži naivi maz triku.

Runas atpazīšanas tehnoloģija netika izgudrota Amazon, kas jau gadu desmitiem ilga. Amazon nav pirmais tehnoloģiju gigants, kas piedāvā galvenās balss programmas. Tiklīdz Alexa jau ir parādījies, Apple Siri Smart Voice Assistant un Google palīgs Google Voice palīgs jau ir parādījušies.

Tajā pašā laikā, kad Amazon uzsāka Alexa, Microsoft arī uzsāka mākslīgā intelekta asistentu Cortana (Microsoft Xiaona). Taču, pateicoties Echo viedo skaļruņu plašajam panākumam, "Amazon" ir veicinājis spēcīgu konkurenci "gudrā" mājas ierīču tirgū, un konkurence, kas var padarīt runas atpazīšanas produktus, piemēram, datorus vai viedtālruņus, cilvēkiem ir ļoti svarīga loma.

Tieši tāpat kā Google meklēšanas algoritms revolutionized informācijas patēriņu un sagraut reklāmas nozarē, mākslīgā intelekta balstītas runas skaitļošanas padarīja līdzīgu transformācijas iespējams. Ahaasas galvenais pētnieks Rohits Prasads teica: "Vispiemērotākais veids, kā mēs gribam izvairīties no neskaidrības ar mūsu klientiem, ir skaņa. Tas nav tikai meklētājprogramma, kas nodrošina virkni rezultātu, bet arī pateiks jums atbildi."

Spēcīga mākslīgā intelekta kombinācija un jauna balss lietotāja pieredze ir padarījusi šo karu par vairāk nekā tikai satriecošu karsto rotaļlietu konkurenci Ziemassvētku laikā. Google, Apple, Facebook, Microsoft un citi uzņēmumi visi iegulda konkurējošos produktos.

Faktiski investīciju firmas "Loup Ventures" Gins Munsteris novērtē, ka tehnoloģiju giganti 10% no saviem ikgadējiem pētniecībai un izstrādei piešķirs budžetu runas atpazīšanai, sasniedzot vairāk nekā 5 miljardus ASV dolāru. Viņš teica, ka balss tehnoloģiju rašanās ir "lielas pārmaiņas" datoru operācijās, un prognozē, ka balss komandas ātri kļūst par "visbiežāk sastopamo veidu, kā mēs mijiedarbojamies ar internetu, nevis ar tastatūru vai mobilo ekrānu".

Nav pārsteidzoši, ka likmes ir tik augstas un konkurence ir sīva. Saskaņā ar pētījumu firmas Canalys datiem, Amazon pirmo reizi nonāca tirgū un ieņēma vadību, kas veido 42% no pasaules saistītā skaļruņu tirgus.

Google arī nekādā ziņā nav zemāka. Ģimenes ierīču sērija, kas pēc izskata ir līdzīga un atbalsta Google palīgs, ir 34%, un uzņēmums Google nesen pārsniedza Amazon. Apple HomePod viedais runātājs ir trešais, jo tas ir dārgs un beidzot nonāk tirgū.

Oktobrī oktobrī tika uzsākta portāla audio un video ierīču sērija, lai pabeigtu dažu galveno konkurentu, īpaši Alexa, balss atpazīšanas uzdevumus.

Savienoto skaļruņu un līdzīgu ierīču tirgus šobrīd ir liels un augošs, taču tehnoloģiju gigantu gadījumā tas ne vienmēr ir visdramatiskāka izaugsmes iespēja. Pētniecības firma Global Market Insights ir noteikusi, ka pasaules viedo speaker pārdošanas apjoms līdz 4,5 miljardiem ASV dolāru 2017.gadā un sagaidāms, ka tas pieaugs līdz 30 miljardiem dolāru līdz 2024.

Tomēr aparatūras ieņēmumi netiek skaitīti. Piemēram, Amazon Echo viedo skaļruņu cenu standarts ir bezatlīdzības vai pat zemākas cenas. Amazon vienkāršā viedtālruņa Echo Dot versija tika pārdota par 29 ASV dolāriem pēdējās brīvdienās, un ABI Research uzskata, ka šī cena ir mazāka nekā aprīkojuma sastāvdaļu izmaksas.

Tā vietā katrs lielākais spēlētājs ir pieņēmis stratēģiju, kā mērķtiecīgi klienti vairāk pievērsīsies citām precēm un pakalpojumiem.

Piemēram, Amazon izmanto Echo sēriju, lai palielinātu Prime membership abonēšanas pakalpojuma vērtību. Google cer, ka balss meklēšana bagātinās jau lielo datubāzi un galu galā atbalstīs tā reklāmas biznesu. Apple izmanto Siri, lai savienotu mobilos tālruņus, datorus un TV kontrolierus, un pat apvieno automašīnu ražotājus ar transportlīdzekļa sistēmas programmatūru.

Tāpat kā ar visām investīcijām un strauji augošajām inovācijām, ir pārāk agri prognozēt, kas uzvarēs. Taču ir droši teikt, ka nozare ir sadarbojusies ar domu, ka balss tehnoloģija, kas balstīta uz mākslīgo intelektu, būs nākamā lietotāja saskarne.

Tas, protams, būs tehnoloģija, kas būtiski ietekmēs vienkāršo cilvēku dzīvi. Google intelektuālo palīgu izstrādājumu dizaina viceprezidents Nick Fox teica: "Jūs varat darīt visu veidu ar balsi, un cilvēki ar sliktu lasītprasmi var darboties sistēmā.

Braukšanas persona var arī vadīt sistēmu. Cepšanas laikā cilvēki var atrast receptes, izmantojot sistēmu. Ik pēc brīža tehnoloģijā ir strukturālas pārmaiņas, un mēs ticam, ka runas tehnoloģija ir viena no pārmaiņām. "

Still, runas atpazīšana joprojām ir sākumstadijā. Salīdzinot ar pētnieku vēlmēm, runas tehnoloģijas lietošana vēl joprojām ir pamatprasību apmierināšanas stadijā, un ir daudz iespēju to uzlabot.

Bažas par tehnoloģiskajām firmām paliek konfidenciāla informācija par klientu informāciju un par to, kā savāktos lietotāja datus izmantot likumīgi. "Izmantojot mākslīgo intelektu, lai atpazītu runu, mēs esam iegājuši reaktīvo lidmašīnu laikmetā no divplūsmas laikmeta," sacīja Vašingtonas universitātes elektrotehnikas profesors Mari Ostendorfs un viens no pasaules izcilākajiem valodu tehnoloģiju zinātniekiem. Dators jau labi atbild uz vienkāršiem jautājumiem, bet faktiskajā sarunā. Šajā aspektā joprojām ir nepilnības.

"Mākslīgā intelekta tehnoloģija jau ir iespaidīga runas atpazīšanas vārdu un izpratnes komandu ziņā. Bet mēs vēl neesam ienācuši raķetes laikmetā. "

Gadu desmitiem runas atpazīšana ir kļuvusi par nākamo killer app. 1950. gados Bell Labs izveidoja mākslīgās intelekta sistēmu, ko sauc par Audrey, kas runā var atpazīt numurus no 1 līdz 9.

Deviņdesmitajos gados datora lietotāji instalēja Dragon NaturallySpeaking runas atpazīšanas programmatūru, kas jau izmantoja vienkāršu runas atpazīšanu bez nepieciešamības pēc runātāja pauzēt pēc katra vārda. Bet, kamēr Apple neizlaida Siri Apple telefonos 2010.gadā, patērētāji saprata, ko varētu sasniegt runas atpazīšanas dzinējs, kas saistīts ar liela mēroga skaitļošanas jaudu. Aptuveni tajā pašā laikā Amazon, vadītāja Jeff Bezos, patiess Star Trek fanatics, sāka sapņot par Starboard Enterprising numuru kopēšanu datorā, kas var runāt ar cilvēkiem.

Viņš ir publicējis vairāk nekā 100 AI dialoga rakstus, un Amazon pašreizējais darbinieks Prasad teica: "Nākotne, kuru mēs domājam, ir tā, ka jūs varat mijiedarboties ar jebkuru pakalpojumu, izmantojot balsi." Alexa to panāca, un patērētāji sazinājās ar Amazon vairāk. Vienkāršības labad.

Runas atpazīšanas tehnoloģijas attīstība, kā arī skaitļošanas jaudas attīstība, proti, skaitļošanas jauda ir ātrāka, lētāka, biežāk sastopama, un tādēļ vairāk mainstream - Amazon, Google, Apple un citi uzņēmumi var vieglāk izveidot vienotu tīklu, izmantojot balsi Smart mājas ierīces ir savienotas ar citām sistēmām.

Piemēram, Apple CarPlay automašīnu lietotāji var izmantot Siri, lai atskaņotu jaunāko "Power Game" epizodi Apple TV kā "nākamo" un pēc tam, kad lietotājs ierodas mājās, atskaņo HomePod viedo skaļruni.

Pirms diviem gadiem Google izlaida balss atbalstītu mājas gudru mājas ierīci, kas saistīja mūzikas produktus ar YouTube ar jaunākajiem Pixel tālruņiem un planšetdatoriem. Citiem vārdiem sakot, katrs tehnoloģiju gigants uzskata, ka balss tehnoloģija ir solis pret digitālo produktu radīšanu.

Tehnologi ir izdevīgi, tāpēc viņi var nodrošināt pietiekamus līdzekļus pētniecībai un mārketingam, lai iegūtu vairāk jaunu produktu. Piemēram, Apple un Google ir attiecīgi divas lielākās mobilās operētājsistēmas, iOS un Android. Tas nozīmē, ka Siri un Google Assistant var būt iepriekš instalēti gandrīz visos jaunajos tālruņos. Savukārt Amazon pieprasa, lai patērētāji savā telefonā instalē Alexa lietojumprogrammu, pirms to var atvērt savā Apple vai Android ierīcē.

"Šis papildu solis padara Amazon izteiktu nelabvēlīgu situāciju," teica Minsteris, bijušais Wall Street datoru analītiķis un pašreizējā Loup kompānija. Savukārt Siri un Google asistentu aktivizēšana vienkārši nozīmē to nosaukšanu. "

Citiem vārdiem sakot, iOS un Android ir pieejami visiem trešo pušu izstrādātājiem, un Amazon ir viens no trešās puses izstrādātājiem, kas nozīmē, ka visi izstrādātāji var rakstīt Alexa programmas abās platformās. Iepriekšējā gada izlaidumā, kas tika izdots, Bezos teica, ka "desmitiem tūkstošu izstrādātāju vairāk nekā 150 valstīs" izveido Alexa lietojumprogrammas un integrē tos ne Amazones ierīcēs. Faktiski sadarbība ir balss programmu atslēga.

Amazon ir izveidojis Alexa Sonos "Echo Wall", Jabra austiņās un BMW, Ford un Toyota. Google ir nostiprinājusi sadarbību ar audio aprīkojuma ražotājiem Sony un Bang & Olufsen, un ir apvienojies ar viedo sistēmu August Smart Lock un Philips LED apgaismojuma sistēmu.

Apple ļauj HomePod viedajiem skaļruni strādāt ar First Alert drošības sistēmām un Honeywell viedajiem termostatus. Google Fox teica: "Šo sadarbības priekšrocība ir tā, ka mēs varam savienot balsi ar visu viedo ierīču ekosistēmu. Man nav nepieciešams atvērt tālruni, lai atrastu lietotni un sakārtotu to tieši ierīcei: "Pastāsti man, kas ir manā priekšā", parādīsies kameras attēls. Tā kā tā ir vienota, tā ir vienkārša. "

Ilgu laiku mākslīgais intelekts vienmēr ir bijis populārās kultūrpolitikas galvenais saturs, it īpaši filmām, ko pārstāv "Terminators" un "Matrix". Ļaunuma un viedo robošu cēlonis rada draudus cilvēkiem. Par laimi tas nav mūsu realitāte. Bet ar mākslīgā intelekta attīstību un skaitļošanas izmaksu samazināšanu, tik iespaidīgs un futūristisks pielietojums ir kļuvis par realitāti.

Runas atpazīšanas programmas var savienot ar datu centru, izmantojot internetu. Šie sarežģītie matemātiskie modeļi ir lieli datu apjomi, kurus uzņēmums ir gadiem ilgi apkopojis un identificējis, nosakot dažādus runas modeļus. Runas atpazīšanas programmas var identificēt vārdnīcu, reģionālo akcentu, runu valodu un kontekstu, analizējot zvanu centru personāla ierakstus, kuri runā ar klientiem, vai sazinoties ar digitālajiem palīgiem.

Runas atpazīšanas sistēmas balstās arī uz fiziku un datorzinātnēm. Balss vibrē gaisā, un runas dzinējs to apstrādā kā analogo skaņas viļņu un pēc tam pārveido to digitālā formātā. Pēc tam dators var analizēt digitālo datu nozīmi. Mākslīgais intelekts vispirms uzlabo procesu, nosakot klienta izvēlētos "nomāktos vārdus" (piemēram, "Alexa"), lai noteiktu, vai skaņa norāda uz tās sistēmu.

Pēc tam viņi ļoti precīzi uzminēja problēmas, ko viņi saņēma no miljoniem citu klientu uzkrātajiem modeļiem. "Runas atpazīšanas sistēma vispirms atzīst skaņu un pēc tam interpretē to kontekstā," skaidro Johans Schalkwick, Google asistentu programmu viceprezidents.

"Piemēram, es teicu:" Kā ir laika apstākļi? ", Mākslīgais intelekts uzzina, ka nākamais vārds būs valsts vai pilsēta. Mūsu datu bāzē ir 5 miljoni angļu vārdu bez konteksta. Ir ļoti grūti noteikt vienu no 5 miljoniem vārdu, bet, ja mākslīgais intelekts zina, ka jūs prasāt pilsētu un pēc tam kļūst par uzdevumu, kas tiek iegūts 30 000 angļu valodas vārdos, precizitāte ir augstāka. "

Aprēķina jauda dod sistēmai dažādas mācību iespējas. Lai Alexa ieslēgtu mikroviļņu krāsni - tas ir īsts piemērs - vispirms runas dzinējam ir jāsaprot komanda, kas nozīmē, ka tai ir iespēja iemācīties izlauzties dažādus akcentus, piemēram, spēcīgu dienvidu akcentu, bērnu treble, svešvalodu runātāji. Izruna utt. var arī filtrēt fona troksni, piemēram, radio raidījumus.

Tad runas dzinējam ir arī jāsaprot dažādi veidi, kā cilvēki varētu lūgt izmantot mikroviļņu krāsni: "sildīt manu pārtiku", "atveriet manu mikroviļņu krāsni" un "divas minūtes sildiet pārtiku". Alexa un citi balss palīgi būs līdzīgas komandas datu bāzē. Matching, "mācīšanās", "apkure manu pārtiku" ir tāds veids, kāds konkrētam lietotājam varētu lūgt nākotnē.

Daļa no iemesla, ka runas atpazīšanas tehnoloģija var strauji attīstīties, ir tā, ka tā ļoti labi pārzina, kā cilvēka komandas pārvērst darbībā. Google Schalkwyk teica, ka šobrīd viņu uzņēmuma runas dziņai ir 95% atbildes rādītājs, kas ir gandrīz tāds pats kā dzirdes precizitāte, un 2013. gadā šī atbildes reakcija bija tikai 80%.

Viens no lielākajiem jaunākajiem sasniegumiem šajā jomā ir filtrēt fona troksni, kas arī ir problēma visjutīgākajām cilvēku ausīm. Tomēr sistēma var sasniegt tikai šo līmeni, atbildot uz vienkāršiem jautājumiem, piemēram, "Kad ir disks spiegot?" Un, ja jūs lūgsit Google Assistant vai Alexa par atzinumu vai mēģināsit runāt, ierīce, iespējams, sniegs iepriekš rakstītu smieklīgu atbildi vai vienkārši teiktu: "Nu, es nezinu atbildi."

Balss vadītas ierīces patērētājiem ir ļoti noderīgas. Tie ir mazi, bet ļoti efektīvi datu vākotāji, kad tie ir savienoti ar datoru datu centrā.

Saskaņā ar patērētāju izpētes partneru datiem, aptuveni 60% Amazon Echo un Google Home lietotāju izmanto vismaz vienu mājas ierīci, piemēram, termostatu, drošības sistēmu vai ierīci. Balss māju ierīces var ierakstīt visus lietotāja ikdienas dzīves aspektus. Neatkarīgi no tā, vai citu ierīču, abonēšanas pakalpojumu vai reklāmu vārdā citu uzņēmumu vārdā tiek uzkrāts vairāk datu, ko Amazon, Google un Apple ir uzkrājuši, jo labāk tie var kalpot patērētājiem.

Biznesa iespējas patiesībā ir ļoti vienkāršas. Patērētājiem, kas savieno Echo viedos skaļruņus ar termostatu, ieteicams iegādāties viedo apgaismojuma sistēmu. Kaut gan tas var padarīt privātuma aizstāvjus briesmīgus, tehnoloģiju giganti uzturas virs viņu personīgajiem datiem, lai labāk pārdotu savus produktus patērētājiem.

Tāpat kā to vispārējā stratēģija, tehnoloģiju giganti izmanto dažādas pieejas datu vākšanai. Amazon teica, ka, izmantojot Alexa savāktos datus, varat to izmantot