Como funcionam os aplicativos de tradução de fala da Cat?

Como funcionam os aplicativos de tradução de fala da Cat?

Você provavelmente já viu aplicativos que afirmam traduzir o que seu gato está dizendo. Mas eles podem realmente traduzir o miado do seu gato para o inglês? A resposta curta é sim, mais ou menos. É difícil por causa de como a 'linguagem' de cada gato é única, mas eles podem chegar muito perto com a tecnologia moderna.





Aplicativos de tradução de gatos como o MeowTalk usam uma forma de reconhecimento de fala que enfatiza o aprendizado de máquina. Vamos olhar mais de perto.





Reconhecimento de fala e aprendizado de máquina

Mary Theresa McLean / Pixabay





O reconhecimento de fala funciona gravando a fala e transformando o áudio em um arquivo de dados digital. Ele codifica dados como tom e volume como pontos de dados que o aplicativo pode analisar e combinar com significados. Microfones DPA explica que esses pontos de dados podem parecer muito diferentes dependendo dos sons de fundo e de como uma palavra é falada.

Às vezes, consideramos o reconhecimento de voz garantido, mas é uma incrível façanha da tecnologia. Especialmente considerando como a fala humana é complexa. Como O cientista explica, cada palavra envolve uma ampla gama de sons ou 'fonemas' misturados uns com os outros. Fazer com que um computador entenda a fala é muito difícil. A nova fronteira de sons de gatos será ainda mais difícil.



Os aplicativos que usam reconhecimento de voz são programados com um 'vocabulário' de palavras chamado conjunto de dados. O aplicativo então combina sua fala com a opção mais próxima em seu vocabulário de dados.

Quando ele comete um erro, você o corrige e ele salva os dados para a próxima vez. Isso faz parte do aprendizado de máquina. É como um programa aprende a reconhecer a fala, mesmo quando não é idêntico ao conjunto de dados com o qual começou.





Relacionado: O que são algoritmos de aprendizado de máquina? Veja como eles funcionam

O reconhecimento de voz ainda apresenta problemas, especialmente com problemas de fala e sotaques. No entanto, algumas empresas estão aprimorando o aprendizado de máquina para superar esses problemas. Com o tempo, o aprendizado de máquina pode transformar o reconhecimento de fala em uma ferramenta poderosa.





o disco está sempre em 100 janelas 10

É assim que o reconhecimento de fala funciona para os humanos. Mas isso funciona para gatos?

Reconhecimento de fala vs. reconhecimento de miau

Ariana Suarez / Unsplash

Primeiro, precisamos entender por que traduzir um certo tipo de miado como 'Estou com fome' é diferente de analisar a fala humana. O problema é principalmente que a comunicação do gato depende mais fortemente de pistas não-verbais, como postura. Outro problema é a ausência de uma 'linguagem do gato' universal.

De acordo com ASPCA , gatos selvagens adultos nunca miam uns para os outros, apenas para as pessoas. Outra pesquisa por a sociedade humana acrescenta que esses sons 'não ocorrem no vácuo'. Devemos interpretá-los juntamente com a linguagem corporal e outros contextos. Em muitos casos, esses sinais silenciosos são a única diferença entre um miado que significa 'estou com fome' e um que significa 'quero jogar'.

Para piorar o problema, não existem dois gatos com a mesma língua. Os gatos desenvolvem 'linguagens' personalizadas para seus donos. Estes são parcialmente baseados na imitação da voz do proprietário e parcialmente na personalidade do gato. Não existem dois gatos com o mesmo som, mesmo quando transmitem o mesmo desejo ou necessidade. Então, como o vocabulário de fala de um aplicativo pode ser traduzido para todos eles?

Aprendizado de máquina flexível para gatos

Livre para usar sons / Unsplash

Embora alguns assistentes virtuais gostem Auto tentativa de entender o tom e a emoção, o reconhecimento de fala ainda é terrível em sinais não-verbais. Mas isso não significa que seja impossível interpretá-los.

o que é uma boa contagem de obturadores

O MeowTalk usa um tipo mais flexível de aprendizado de máquina para ajudar a superar esses problemas.

Download: MeowTalk para Android | ios (Sem custos)

Meowtalk foi criado por Javier Sanchez, que também trabalhou na equipe Alexa. Ele imaginou o aplicativo como um passo em direção aos colares inteligentes. Essas coleiras traduziriam sons de gatos em fala humana, utilizando estratégias complexas de aprendizado de máquina para ajudar os humanos a entender e cuidar melhor de seus gatos.

A equipe do MeowTalk compensou os problemas de exclusividade criando perfis mais específicos para cada gato. No aplicativo, você cadastra cada gato separadamente. Ciência da Noruega relata que os gatinhos miam de maneira diferente dos gatos adultos, então o aplicativo também pede o aniversário do gato. Cada perfil gera uma rede de dados exclusiva para o gato, incorporando um pouco de aprendizado profundo ao aprendizado de máquina.

Relacionado: Deep Learning vs. Machine Learning vs. AI: Como eles funcionam juntos?

Para vocabulário, MeowTalk começa com 10 perfis de som em seu conjunto de dados. Cada um tem um significado diferente associado, como 'feliz' ou 'caça'. Quando o aplicativo ouvir um som e errar, você pode corrigi-lo ou criar uma nova interpretação.

Dados CATSOUNDS coletados de Akvelon

A correção informa ao aplicativo para substituir o vocabulário básico pelo novo som.

como escolher a conta padrão do gmail

Por exemplo, você pode dizer ao aplicativo para combinar 'Hunting' com chilreios curtos em vez de um uivo longo. Esse tipo de correção é mais útil do que adicionar vários sons para corresponder a um que significa a maneira como o reconhecimento de voz faz, o que seria como dizer ao aplicativo que um uivo longo e um chilreio curto Ambas significa 'Mãe Call.'

O aprendizado de máquina em aplicativos de reconhecimento de fala geralmente resiste a esse tipo de substituição. Seria como tentar ensinar ao Siri que quando você diz 'blog de tecnologia', você realmente quer dizer 'pera'. Mas a forma mais flexível de aprendizado de máquina que o MeowTalk usa pode lidar com essa correção mais facilmente.

Criar uma nova interpretação adiciona um significado que não foi codificado anteriormente. Por exemplo, se o seu gato recebe uma chamada específica quando quer seu brinquedo favorito, você pode adicionar 'Eu quero meu mouse' como uma opção. É semelhante a adicionar uma palavra ao dicionário de correção automática.

Relacionado: Como definir suas próprias palavras de autocorreção no Android

Com o tempo, você pode desenvolver um perfil de fala altamente personalizado para seu gato. Eventualmente, pode até ser sofisticado o suficiente para ser útil para cuidadores de animais de estimação ou para resolver problemas comportamentais. No mínimo, ajuda os donos de gatos a ficarem mais atentos aos seus animais de estimação.

O veredicto: os aplicativos de tradução da Cat funcionam?

No final das contas, a 'tradução de gatos' ainda depende muito do usuário ensinar o aplicativo como seu gato fala. Isso provavelmente sempre será o caso, devido ao quão única é a comunicação de cada gato.

Mas o fato de o aprendizado de máquina ter chegado tão longe que os desenvolvedores podem ter sucesso, mesmo que parcialmente, é incrível. O aprendizado de máquina e a IA estão avançando em velocidades vertiginosas, e mal podemos esperar para ver o que acontecerá em seguida.

Compartilhado Compartilhado Tweet O email Tópicos relacionados
  • Tecnologia Explicada
  • Aprendizagem de línguas
  • Aprendizado de Máquina
Sobre o autor Natalie Stewart(47 artigos publicados)

Natalie Stewart é redatora da MakeUseOf. Ela começou a se interessar por tecnologia na faculdade e desenvolveu uma paixão por escrever para a mídia na universidade. O foco de Natalie é em tecnologia que seja acessível e fácil de usar, e ela adora aplicativos e dispositivos que tornam a vida mais simples para as pessoas comuns.

Mais de Natalie Stewart

Assine a nossa newsletter

Junte-se ao nosso boletim informativo para dicas de tecnologia, análises, e-books grátis e ofertas exclusivas!

Clique aqui para se inscrever