Por volta de 2.300 a.C., as conquistas do rei Sargon, o Grande fizeram da Acádia o primeiro império da história. Os acadianos adaptaram a seu idioma a escrita cuneiforme inventada por seus vizinhos ao sul, os sumérios, que admiravam: séculos depois de que o povo sumério tivesse deixado de existir, os monarcas acadianos ainda se intitulavam "reis da Suméria e da Acádia".
O acadiano dividiu-se nos dialetos assírio e babilônio, que, no primeiro milênio a.C., foram substituídos pelo aramaico, e caíram no esquecimento. Mas esses povos nos legaram seus textos, escritos em inúmeras tabuletas de argila, a partir dos quais foi possível, no século 19, decifrar suas línguas mortas há milênios.
Mas ler esses textos é difícil e demorado. Muitas tabuletas de argila estão danificadas ou quebradas. E a escrita cuneiforme é complexa: o mesmo símbolo pode ter diferentes significados dependendo do contexto. Se a tradução entre idiomas atuais já requer conhecimento das respectivas culturas, imagine a dificuldade com línguas de civilizações extintas há tanto tempo. São poucos os especialistas habilitados e, por isso, a maioria dos textos da Mesopotâmia nunca foi lida.
Em trabalho publicado em março deste ano na revista PNAS Nexus e na plataforma digital GitHub, pesquisadores de Israel e da Alemanha apresentaram um algoritmo de inteligência artificial que usa redes neurais convolucionais, tecnologia semelhante à do popular Google Tradutor, para passar do acadiano ao inglês quase instantaneamente.
Primeiro, o texto precisa ser digitalizado, convertendo os símbolos na argila em códigos do padrão Unicode específicos para cuneiforme. Isso é feito automaticamente a partir de fotos da tabuleta. O banco de digitalizações ORACC foi usado para treinar o algoritmo a traduzir usando dois sistemas diferentes. No primeiro (T2E), a tradução é feita a partir de uma transliteração prévia dos códigos Unicode para o alfabeto latino. No segundo (C2E), o acadiano em Unicode é traduzido diretamente para o inglês.
Submetido a um teste padronizado, o novo algoritmo mostrou desempenho acima do esperado, com vantagem para o T2E. Não surpreende que ele lide melhor com textos formais, como decretos reais, do que textos literários, como hinos ou profecias. A ótima surpresa é que, mesmo quando o resultado requer revisão, o algoritmo é capaz de identificar o tipo de texto, e manter o respectivo estilo na tradução.
E o grande diferencial da tecnologia de "machine learning" (aprendizagem de máquina) é que o algoritmo irá melhorando sozinho à medida que for mais e mais utilizado!
Comentários
Os comentários não representam a opinião do jornal; a responsabilidade é do autor da mensagem.