Como são feitos os thesaurus?
Antes da era do computador, os thesaurus eram compilados por autores de listas compulsivas, como Peter Mark Roget, cujo trabalho monumental ainda é o padrão para o inglês. Com a ajuda dos computadores existem muitas maneiras de simplificar o processo de recolha de palavras com significados relacionados, embora estes métodos não dêem sempre melhores resultados e os thesaurus produzidos ainda possam requerer a intervenção humana para os tornar convencionalmente úteis.Um método é criar um thesaurus distributivo, no qual um corpus é pesquisado e as palavras são agrupadas de acordo com as suas afinidades para o mesmo espaço sintáctico em milhares de frases. Isto frequentemente dá resultados semelhantes a um corpus tradicional, mas com algumas diferenças, tais como o aparecimento de antônimos no mesmo agrupamento de palavras (uma vez que os antônimos muitas vezes têm comportamento sintático quase idêntico).
Um thesaurus mais convencional pode ser compilado computacionalmente pesquisando uma base de dados de dicionário e, através de várias iterações, coletando palavras que se cruzam, coletando listas de sinônimos que aparecem como tal, e coletando palavras cujas definições compartilham vocabulário. Isto não irá produzir um thesaurus tão bom como Roget's, mas irá fazê-lo muito mais rápido (horas em vez de décadas), e a edição humana pode fornecer deficiências e fazer correcções.
Artigos semelhantes
- Será que os filmes acabarão por deixar de ser feitos porque os filmes já feitos são demasiados e são suficientes para toda a vida da pessoa?
- Quais são algumas boas aplicações de dicionário/thesaurus para Android?
- O que é um dicionário de thesaurus?
- Quando você deve usar um thesaurus em vez de um dicionário?