Por que o 'Google Translate' não suporta voz para a língua hebraica?
Não consigo ver a relevância da ortografia (sistemas de escrita) para uma pergunta sobre o suporte de voz. Outras respostas aqui parecem estar deslizando sobre algumas duras realidades:
- O reconhecimento da linguagem da máquina, apesar de anos de esforço tremendo em inglês ainda é relativamente chato nessa língua.
- li>Agora, lembre-se que enquanto o inglês tem vários sotaques, etc, a sua fonologia (sistema de som linguístico), se não for amplamente compreendida, está pelo menos amplamente documentada em todas as suas formas.
- li>Hebraico, embora tendo uma base de falantes muito menor (cerca de 8 milhões dos quais cerca de 4-5 são linguisticamente falantes nativos), passou por muito menos pesquisa em fonologia. Ainda menos em suas propriedades acústicas (para alguns trabalhos veja Dr. Vered Silber-Varod).>li>li>Isso pode parecer sem importância, mas o hebraico moderno tem vários meios de pronúncia. O reconhecimento da linguagem de máquina, sendo tendencioso tanto na linguagem escrita quanto nas análises sintácticas da linguagem (que não se alinham de forma alguma com o discurso natural), estão voltados para a compreensão da dicção/elocução elevada.
- Isto porque no discurso natural, o hebraico tem uma fonologia que é socialmente desprivilegiada (o que significa que é considerado "uma forma de falar ruim/bastante mal-educada"). Independentemente do preconceito, é a língua e não estamos equipados para analisar a sua verdadeira forma linguística e só quando passos significativos forem dados nessa direcção é que poderemos implementar um reconhecimento vocal realista para o hebraico falado.>
Deixe-nos comparar uma afirmação hebraica: Vou começar com a ortografia hebraica (note que é da direita para a esquerda e faltam todos os "nikud", já que não a usamos; algumas vogais são representadas), seguida de dicionarização acentuada no IPA e depois por dicionarização coloquial no sotaque em que vivo:
Hebraico: אני לא רוצה לזלול סופגניות 'Eu não quero devorar donuts'
Aumentado IPA: [aˈni lo roˈt͡se lizˈlol sufganiˈot]
Colloquial IPA: [nl̃o rt͡se lzˈlol svug̞aniˈɤt svug̞aniˈɤt̚ ]
É na verdade bastante esclarecedor sobre a natureza do nosso cérebro, uma vez que os oradores que falam [svug̞aniˈɤt̚ ] são percebidos como estando a dizer [sufganiˈot] - isto é surpreendente já que a forma original subjacente era [suvgani'ot] onde o /v/ foi submetido a devoção retrógrada... exceto que obviamente alguns alto-falantes não fazem isso, mas eles moveram a posição do fonêmico completamente - ainda assim nossos cérebros corrigem isso. Imagine quantas outras "mudanças" ouvimos mas na verdade não ouvimos ;)