A Siri consegue entender a sua própria voz?
It'é uma experiência interessante para tentar -- mas teoricamente deve funcionar mal.
Automatic speech recognition (ASR), ou reconhecimento automático da fala (ASR), ou discurso a texto, é treinado com base no reconhecimento padrão da fala humana. It's tentando encontrar a melhor combinação entre uma série desconhecida de sinais acústicos e uma lista de combinações de sequências aceitáveis desses sons para uma determinada língua. It's prediz o que's mais provavelmente está correto.
Síntese de voz, ou text-to-speech (TTS), corre sobre princípios totalmente diferentes. It's geralmente não tenta prever nada, realmente, já que todo o texto está lá. (Embora tenha que tomar decisões, como se "St." é pronunciado "rua" ou "santo", e se "Houston" é pronunciado como a cidade no Texas ou a rua em NYC). It's montando uma corrente de som e seguindo regras diferentes para tentar fazer esse som o mais humano possível. TTS fica cada vez melhor a cada ano, mas it's ainda é um pouco antinatural, como qualquer um que ouve Siri lhe diria.
A única coisa que ambos podem compartilhar é o mesmo léxico ou vocabulário; ou seja, ter um dicionário de palavras e saber como pronunciá-las. Eles'estão trabalhando com o mesmo playbook, se você quiser. Mas fora isso, o ASR está operando independentemente do TTS, e usando a entrada TTS para um sistema ASR treinado em pessoas reais'os padrões vocais do ASR terão uma taxa de erro maior do que para a fala humana. (Teoricamente, pelo menos.)
Artigos semelhantes
- Em que ordem devo assistir aos filmes do Capitão América para entender sua vida e sua relação com Bucky até os filmes mais recentes?
- Tesla's terá controle de voz como as opções Siri disponíveis em versões futuras?
- Como Susan Bennett não sabia que era a voz de Siri até ser reconhecida por um amigo?
- Quais são as formas eficazes de treinar a Siri para reconhecer a minha voz?