Casa > E > Existe Uma Solução De Ocr De Sucesso Para Hindi?

Existe uma solução de OCR de sucesso para Hindi?

i2OCR - Free Online OCR fez o trabalho para mim razoavelmente bem. Eu tentei as outras soluções neste tópico, até o governo da Índia uma - e a precisão do OCR foi pobre (e esse só aceita tiffs, não pdf).

Com o I2ocr, eu carreguei um PDF digitalizado com texto Hindi e ele OCR'd it, página por página . A precisão foi bastante boa - eu diria que ele acertou cerca de 90+% das palavras...alguns erros com letras como त/त etc porque parecem similares, pelo menos ao OCR SW eu acho...mas uma saída limpa.

Once novamente, o que o i2OCR apresenta no final de seu processo de OCR são páginas individuais de OCR que você deve então converter manualmente para texto, uma a uma. Esta conversão é conseguida através do botão "Convert to Text" abaixo das páginas de OCR - selecione uma página de OCR e depois converta-a para texto. Talvez haja uma maneira de obter todo o texto de uma vez - tem de tentar isso a seguir. Mas, ainda assim, seu SW e interface vale uma tentativa.

P.S Try Google Lens - o aplicativo - para conversão em tempo real - ele lê e exibe texto Hindi/Devanagri copiável muito bem. Então basta iniciar o aplicativo, colocando seu telefone acima do documento e ele marcará/desligará as porções de texto no quadro, exibindo-o na caixa de texto abaixo (se o texto de origem estiver em Hindi, a Lente do Google mostrará o texto Hindi que você pode copiar - você pode ter que pressionar alguns 'botões' antes que ele mostre o que lê - como o botão do obturador e depois o botão Select All). Você pode então Copiar Texto e também Copiar Texto para Computador. A precisão é muito boa. Eu uso isso para copiar texto Hindi e Sânscrito Devanagri de livros...não o experimentei em um pdf tho'

De Most Ylonen

Qual é o melhor aplicativo para falar inglês fluente? :: Qual é a língua nacional da Índia?