Hur fungerar Cat Speech Translation Apps?

Hur fungerar Cat Speech Translation Apps?

Du har förmodligen sett appar som gör anspråk på att översätta vad din katt säger. Men kan de verkligen översätta din katt mjau till engelska? Det korta svaret är ja, typ. Det är svårt på grund av hur unikt varje katt är 'språk' är, men de kan komma ganska nära med modern teknik.





Kattöversättningsappar som MeowTalk använder en form av taligenkänning som betonar maskininlärning. Låt oss titta närmare.





Taligenkänning och maskininlärning

Mary Theresa McLean/ Pixabay





Taligenkänning fungerar genom att spela in tal och förvandla ljudet till en digital datafil. Den kodar data som tonhöjd och volym som datapunkter som appen kan analysera och matcha med betydelser. DPA -mikrofoner förklarar att dessa datapunkter kan se väldigt olika ut beroende på bakgrundsljuden och hur ett ord talas.

Vi tar ibland röstigenkänning för givet, men det är en otrolig teknikbedrift. Speciellt med tanke på hur komplext mänskligt tal är. Som Vetenskapsmannen förklarar, innebär varje ord ett brett spektrum av ljud eller 'fonem' som blandas in i varandra. Att få en dator att förstå tal är mycket svårt. Den nya gränsen för kattljud kommer att bli ännu svårare.



Appar som använder taligenkänning är programmerade med ett 'ordförråd' med ord som kallas en datamängd. Appen matchar sedan ditt tal till det närmaste alternativet i sitt datavokabulär.

När det gör ett misstag korrigerar du det och det sparar data till nästa gång. Detta är en del av maskininlärning. Det är hur ett program lär sig känna igen tal även när det inte är identiskt med datauppsättningen som det började med.





Relaterat: Vad är maskininlärningsalgoritmer? Så här fungerar de

Röstigenkänning har fortfarande problem, särskilt med talhinder och accenter. Vissa företag förbättrar dock maskininlärning för att övervinna dessa problem. Med tiden kan maskininlärning göra taligenkänning till ett kraftfullt verktyg.





makro för att skicka e -post från excel

Det är så taligenkänning fungerar för människor. Men fungerar det för katter?

Taligenkänning vs Meow -igenkänning

Ariana Suarez / Unsplash

Först måste vi förstå varför att översätta en viss typ av mjau till 'jag är hungrig' skiljer sig från att analysera mänskligt tal. Problemet är mestadels att kattkommunikation är mer beroende av icke -verbala ledtrådar som hållning. Ett annat problem är frånvaron av ett universellt ”kattspråk”.

Enligt ASPCA , vuxna vildkatter miajar aldrig på varandra, bara på människor. Annan forskning av det humana samhället tillägger att dessa ljud 'inte förekommer i ett vakuum'. Vi måste tolka dem vid sidan av kroppsspråk och andra sammanhang. I många fall är dessa tysta signaler den enda skillnaden mellan en mjau som betyder 'jag är hungrig' och en som betyder 'jag vill spela.'

Utöver detta problem har inga två katter samma språk. Katter utvecklar personliga 'språk' för sina ägare. Dessa bygger dels på imitation av ägarens röst och dels på kattens personlighet. Inga två katter låter lika, även när de förmedlar samma önskemål eller behov. Så hur kan en apps talord översättas för dem alla?

Flexibelt maskininlärning för katter

Gratis att använda ljud/ Unsplash

Även om några virtuella assistenter gillar Bil försöker förstå ton och känslor, taligenkänning är fortfarande hemskt vid icke -verbala signaler. Men det betyder inte att det är omöjligt att tolka dem.

bästa premiär exportinställningar för youtube

MeowTalk använder en mer flexibel typ av maskininlärning för att övervinna dessa problem.

Ladda ner: MeowTalk för Android | ios (Fri)

Meowtalk skapades av Javier Sanchez, som också arbetade i Alexa -teamet. Han föreställde sig appen som ett steg mot smarta halsband. Dessa halsband skulle översätta kattljud till mänskligt tal och använda komplexa maskininlärningsstrategier för att hjälpa människor att bättre förstå och ta hand om sina katter.

MeowTalk -teamet kompenserade för unika problem genom att skapa mer specifika profiler för varje katt. I appen registrerar du varje katt separat. Vetenskap Norge rapporterar att kattungar mjauer annorlunda än vuxna katter, så appen ber också om kattens födelsedag. Varje profil genererar ett unikt datanätverk för katten, som innehåller lite djup inlärning i maskininlärningen.

Relaterat: Deep Learning vs. Machine Learning vs. AI: Hur går de ihop?

För ordförråd börjar MeowTalk med 10 ljudprofiler i sin dataset. Var och en har en annan betydelse, som 'glad' eller 'jakt'. När appen hör ett ljud och får fel kan du antingen korrigera det eller skapa en ny tolkning.

CATSOUNDS -data som samlats in från Akvelon

Korrigering säger att appen ska ersätta basordförrådet med det nya ljudet.

Windows 10 -aktivitetsfältet svarar inte på vänsterklick

Till exempel kan du säga att appen ska matcha 'Hunting' till korta kvittrar istället för en lång yowl. Denna typ av korrigering är mer användbar än att lägga till flera ljud för att matcha med en som betyder hur taligenkänning gör, vilket skulle vara som att berätta för appen att en lång yowl och kort kvittrar både betyder 'Mother Call'.

Maskininlärning i taligenkänningsappar motstår vanligtvis denna typ av överskrivning. Det skulle vara som att försöka lära Siri att när du säger 'teknikblogg' menar du verkligen 'päron'. Men den mer flexibla formen av maskininlärning som MeowTalk använder kan hantera denna korrigering lättare.

Att skapa en ny tolkning lägger till en betydelse som inte tidigare var kodad. Till exempel, om din katt har ett specifikt samtal när hon vill ha sin favoritleksak, kan du lägga till 'Jag vill ha min mus' som ett alternativ. Det liknar att lägga till ett ord i din autokorrigeringsordbok.

Relaterad: Hur du definierar dina egna autokorrigerande ord på Android

Med tiden kan du utveckla en mycket personlig talprofil för din katt. Så småningom kan det till och med vara tillräckligt sofistikerat för att vara användbart för husdjursvakter eller för att lösa beteendemässiga problem. Om inte annat hjälper det kattägare att bli mer uppmärksamma på sina husdjur.

Domen: Fungerar kattöversättningsappar?

I slutändan är 'kattöversättning' fortfarande mycket beroende av att användaren lär appen hur deras katt pratar. Det kommer förmodligen alltid att vara fallet på grund av hur unik varje katts kommunikation är.

Men det faktum att maskininlärning har kommit så långt att utvecklare till och med delvis kan lyckas med detta är otroligt. Maskininlärning och AI går framåt i jävla hastigheter, och vi kan inte vänta med att se vart de går vidare.

Dela med sig Dela med sig Tweet E-post Relaterade ämnen
  • Teknik förklaras
  • Språkinlärning
  • Maskininlärning
Om författaren Natalie Stewart(47 artiklar publicerade)

Natalie Stewart är en författare för MakeUseOf. Hon blev först intresserad av teknik på college och utvecklade en passion för medieskrivning på universitetet. Natalies fokus ligger på teknik som är tillgänglig och lätt att använda, och hon älskar appar och enheter som gör livet enklare för vanliga människor.

Mer från Natalie Stewart

Prenumerera på vårt nyhetsbrev

Gå med i vårt nyhetsbrev för tekniska tips, recensioner, gratis e -böcker och exklusiva erbjudanden!

Klicka här för att prenumerera