Hemsida » hur » Alexa, Siri och Google förstår inte ett ord du säger

    Alexa, Siri och Google förstår inte ett ord du säger

    amason

    Röstassistenter som Alexa, Google Assistant och Siri har kommit långt under de senaste åren. Men för alla sina förbättringar håller en sak dem tillbaka: De förstår dig inte. De lita för mycket på specifika röstkommandon.

    Taligenkänning är bara en magisk trick

    amason

    Röstassistenter förstår dig inte. Inte riktigt, ändå. När du pratar med ett Google Home eller Amazon Echo konverterar det i huvudsak dina ord till en textsträng och jämför sedan det med förväntade kommandon. Om det hittar en exakt match, följer den en uppsättning instruktioner. Om det inte gör det letar det efter ett alternativ av vad man ska göra baserat på vilken information den har, och om det inte fungerar får du ett felmeddelande som "Jag är ledsen, men jag vet inte det . "Det är lite mer än en liten handmagik för att lura dig att tro att den förstår.

    Det kan inte använda kontextuella ledtrådar för att göra det bästa gisset, eller till och med använda en förståelse för liknande ämnen för att informera sina beslut. Det är inte svårt att resa upp röstassistenter heller. Medan du kan fråga Alexa "Arbetar du för NSA?" Och får svar, om du frågar "Är du hemligt del av NSA?" Får du ett "Jag vet inte det enda" svaret (åtminstone vid tid för detta skrivande).

    Människor, som verkligen förstår tal, fungerar inte så här. Antag att du frågar en människa, "Vad är det klart i himlen? Den som är välvt och full av randiga färger som röd, orange, gul och blå. "Trots att klarvain är ett färdigt ord kan personen du frågade sannolikt räkna ut ur det sammanhang som du beskriver en regnbåge.

    Medan du kan argumentera för att en människa omvandlar tal till idéer, kan en människa sedan tillämpa kunskap och förståelse för att sluta ett svar. Om du frågar en människa om de hemligt arbetar för NSA, ger de dig ett ja eller inget svar, även om det svaret är en lögn. En människa skulle inte säga "jag känner inte den där" till en fråga som det. Att människor kan ljuga är något som kommer med verklig förståelse.

    Röstassistenter kan inte gå bortom deras programmering

    Röstassistenter är i sista hand begränsade till programmerade förväntade parametrar, och att vandra utanför dem kommer att bryta processen. Det faktum visar när tredjepartsenheter kommer in för att spela. Vanligtvis är kommandot att interagera med dem väldigt obehagliga, vilket innebär att "berätta för tillverkaren att kommandot frivilligt argument". Ett exakt exempel skulle vara: "Berätta Whirlpool för att pausa torken." För att vara ännu svårare att komma ihåg exempel, var Genève Alexa skicklighet kontrollerar några GE ugnar. En användare av färdigheten måste komma ihåg att "berätta för Genève" inte "berätta GE" sedan resten av kommandot. Och medan du kan be om att förvärma ugnen till 350 grader, kan du inte följa upp en begäran att höja temperaturen med ytterligare 50 grader. En människa kunde dock följa dessa förfrågningar.

    Amazon och Google har jobbat mycket hårt för att övervinna dessa hinder, och det visar. När du en gång var tvungen att följa ovanstående sekvens för att styra ett smart lås, kan du nu säga "låsa ytterdörren" istället. Alexa brukade vara förvirrad av "berätta för ett hundskämt", men fråga om en idag, och det kommer att fungera. De har lagt till variationer i de kommandon du använder, men i slutändan måste du fortfarande veta rätt kommando att säga. Du måste använda rätt syntax i rätt ordning.

    Och om du tycker att det låter som en kommandorad, har du inte fel.

    Röstassistenter är en fancy kommandorad

    En kommandorad definieras snävt för att utföra enkla uppgifter, men endast om du vet rätt syntax. Om du släpper ut den korrekta syntaxen och skriver djur istället för dir, kommer kommandotolken att ge dig ett felmeddelande. Du kan använda alias för att lättare komma ihåg kommandon, men du måste förstå vad de ursprungliga kommandona var, hur de fungerar och hur man använder alias effektivt. Om du inte tar dig tid att lära in och ur kommandoraden kommer du aldrig att få mycket ut av det.

    Röstassistenter är inte annorlunda. Du behöver veta rätt sätt att säga ett kommando eller ställa en fråga. Och du behöver veta hur man konfigurerar grupper för Google och Alexa, varför att gruppera dina enheter är viktigt och hur man heter dina smarta enheter. Om du inte följer dessa nödvändiga steg kommer du att känna frustrationen att fråga din röstassistent att stänga av studien bara för att bli frågad, "vilken studie" ska stängas av.

    Även om du använder rätt syntax i rätt ordning kan processen misslyckas. Antingen med fel svar utfärdat eller ett överraskande resultat. Två Google-hem i samma hus kan ge väder för lite olika platser trots att de har tillgång till samma användarkontoinformation och internetanslutning.

    I ovanstående exempel ges kommandot "Ange en timer i en halvtimme". Googles startsida skapade en timer med namnet "Hour" och frågade sedan hur länge timern ska vara. Och ändå upprepade samma kommando tre andra gånger fungerade korrekt och skapade en 30-minuters timer. Använda kommandot "Ställ in en timer i 30 minuter" fungerar korrekt på ett mer konsekvent sätt.

    Medan prata med ett Google-hem eller echo kan vara mer flytande, fungerar det med hjälp av huven, röstassistenter och kommandoreder. Du kanske inte behöver lära sig ett nytt språk, men du behöver lära dig en ny dialekt.

    Det smala förståelsen av röstassistenter kommer att begränsa tillväxten

    Inget av detta hindrar röstassistenter som Google Assistant och Alexa att fungera tillräckligt bra (även om Cortana är en annan historia). Google Assistant och Alexa och söka på nätet för frågor anständigt, men inte överraskande Google är bättre på sökning, och kan svara på grundläggande frågor som mätkonverteringar och enkel matte. Med en korrekt inbyggd smart hem och välutbildad användare kommer de flesta smarta hemkommandon att fungera som avsedda. Men detta kom genom arbete och ansträngning, inte intellektuell förståelse.

    Tidtagare och larm brukade vara förenklade. Över tiden namngivning tillsattes, då förmågan att lägga till tid till en timer. De flyttade från enklare till mer komplicerade. Röstassistenter kan svara på fler frågor, och varje dag ger nya färdigheter och funktioner. Men det är inte en produkt av självtillväxt som kommer från lärande och förståelse.

    Och inget av det ger den inneboende förmågan att använda det som är känt för att nå det okända. För varje kommando och fråga som fungerar, kommer det alltid att finnas tre som inte gör det. Utan ett genombrott i A.I. som ger en mänsklig vilja att förstå, röstassistenter är inte assistenter alls. De är bara röstkommandolinjer - användbara i rätt scenario men begränsade till de scenarier de har programmerats för att förstå.

    Med andra ord: maskiner lär sig saker men kan inte förstå dem.