Casa > A > A Siri Consegue Entender A Sua Própria Voz?

A Siri consegue entender a sua própria voz?

It'é uma experiência interessante para tentar -- mas teoricamente deve funcionar mal.

Automatic speech recognition (ASR), ou reconhecimento automático da fala (ASR), ou discurso a texto, é treinado com base no reconhecimento padrão da fala humana. It's tentando encontrar a melhor combinação entre uma série desconhecida de sinais acústicos e uma lista de combinações de sequências aceitáveis desses sons para uma determinada língua. It's prediz o que's mais provavelmente está correto.

Síntese de voz, ou text-to-speech (TTS), corre sobre princípios totalmente diferentes. It's geralmente não tenta prever nada, realmente, já que todo o texto está lá. (Embora tenha que tomar decisões, como se "St." é pronunciado "rua" ou "santo", e se "Houston" é pronunciado como a cidade no Texas ou a rua em NYC). It's montando uma corrente de som e seguindo regras diferentes para tentar fazer esse som o mais humano possível. TTS fica cada vez melhor a cada ano, mas it's ainda é um pouco antinatural, como qualquer um que ouve Siri lhe diria.

A única coisa que ambos podem compartilhar é o mesmo léxico ou vocabulário; ou seja, ter um dicionário de palavras e saber como pronunciá-las. Eles'estão trabalhando com o mesmo playbook, se você quiser. Mas fora isso, o ASR está operando independentemente do TTS, e usando a entrada TTS para um sistema ASR treinado em pessoas reais'os padrões vocais do ASR terão uma taxa de erro maior do que para a fala humana. (Teoricamente, pelo menos.)

De Damian

Artigos semelhantes

Os aplicativos de scanner da polícia são considerados legais ou ilegais? :: Como devo fazer o download de vídeos do XECCE?