Publicidade
Publicidade
06/12/2006
-
09h52
CARLOS KAUFFMANN
da Folha de S.Paulo
O Corpus do Português (www.corpusdoportugues.org), site aberto no início de novembro, oferece um meio inédito de esquadrinhar a língua portuguesa. Ele funciona como um "quem é quem" do idioma mostrando a popularidade de palavras ou de frases buscadas entre milhares de textos.
Esse grande arquivo forma o corpus da língua, que representa as diversas variedades lingüísticas do português. O corpus reúne mais de 50 mil textos, de diversas fontes (entre elas, a Folha), somando 45 milhões de palavras.
Há quatro registros principais: jornalístico, acadêmico, falado e de ficção. O site permite fazer comparações de várias naturezas, como ver a freqüência de palavras e de frases análogas nos diferentes registros, constatar diferenças de uso da língua entre o português europeu e o brasileiro e verificar a evolução do idioma, do século 14 ao século 20. Oferece ainda o recurso da visualização do entorno textual da palavra ou da frase buscada.
Janelas
A página principal é dividida em janelas. Na da esquerda, ficam vários campos para busca, que podem ser de palavras, de frases ou de categorias gramaticais, como verbos, substantivos e adjetivos. A resposta da busca é apresentada à direita, com a respectiva contagem de freqüência. Clicando nos resultados, aparecem abaixo os trechos onde ocorrem a palavra ou a expressão buscada.
O site foi desenvolvido por dois pesquisadores norte-americanos, Mark Davies, da Universidade Brigham Young (Utah, EUA), e Michael Ferreira, da Universidade de Georgetown (Distrito de Columbia, EUA). O acesso é livre e gratuito. Depois de algumas consultas, é solicitado um registro simples (nome e e-mail). A utilidade dessa ferramenta de busca do idioma é múltipla: para os estudantes, é uma chance de ver a língua exemplificada pelo uso real; para os lingüistas, renova a descrição da linguagem e possibilita a criação de melhores dicionários e gramáticas; para os escritores, cria alternativas estilísticas inovadoras e amplia os horizontes da criação literária.
Outros sites de pesquisa: Projeto Linguateca e Banco de Português
Especial
Leia o que já foi publicado sobre dicionários on-line
Site mostra as palavras mais usadas da língua portuguesa
Publicidade
da Folha de S.Paulo
O Corpus do Português (www.corpusdoportugues.org), site aberto no início de novembro, oferece um meio inédito de esquadrinhar a língua portuguesa. Ele funciona como um "quem é quem" do idioma mostrando a popularidade de palavras ou de frases buscadas entre milhares de textos.
Esse grande arquivo forma o corpus da língua, que representa as diversas variedades lingüísticas do português. O corpus reúne mais de 50 mil textos, de diversas fontes (entre elas, a Folha), somando 45 milhões de palavras.
Há quatro registros principais: jornalístico, acadêmico, falado e de ficção. O site permite fazer comparações de várias naturezas, como ver a freqüência de palavras e de frases análogas nos diferentes registros, constatar diferenças de uso da língua entre o português europeu e o brasileiro e verificar a evolução do idioma, do século 14 ao século 20. Oferece ainda o recurso da visualização do entorno textual da palavra ou da frase buscada.
Janelas
A página principal é dividida em janelas. Na da esquerda, ficam vários campos para busca, que podem ser de palavras, de frases ou de categorias gramaticais, como verbos, substantivos e adjetivos. A resposta da busca é apresentada à direita, com a respectiva contagem de freqüência. Clicando nos resultados, aparecem abaixo os trechos onde ocorrem a palavra ou a expressão buscada.
O site foi desenvolvido por dois pesquisadores norte-americanos, Mark Davies, da Universidade Brigham Young (Utah, EUA), e Michael Ferreira, da Universidade de Georgetown (Distrito de Columbia, EUA). O acesso é livre e gratuito. Depois de algumas consultas, é solicitado um registro simples (nome e e-mail). A utilidade dessa ferramenta de busca do idioma é múltipla: para os estudantes, é uma chance de ver a língua exemplificada pelo uso real; para os lingüistas, renova a descrição da linguagem e possibilita a criação de melhores dicionários e gramáticas; para os escritores, cria alternativas estilísticas inovadoras e amplia os horizontes da criação literária.
Outros sites de pesquisa: Projeto Linguateca e Banco de Português
Especial
Publicidade
As Últimas que Você não Leu
Publicidade
+ LidasÍndice
- Novo acelerador de partículas brasileiro deve ficar pronto até 2018
- Robôs que fazem sexo ficam mais reais e até já respondem a carícias
- Maratona hacker da ONU premia app que conecta médico a pacientes do SUS
- Confira lista de feeds do site da Folha
- Facebook e Google colaboram para combater notícias falsas na França
+ Comentadas