Glossário
Paremiologia ( paremiológico ) ciência que se ocupa do estudo dos provérbios , na interseção das ciências da linguagem , da cultura e fenómenos sociais
Mínimo paremiológico conjunto dos provérbios mais conhecidos e mais frequentemente utilizados pela generalidade dos falantes de uma
comunidade linguística
Corpora plural de corpus . Conjunto de textos
( escritos ou orais ) que servem de base para a descrição ou o estudo
de um determinado fenómeno linguístico
Disponibilidade lexical a intuição genérica ( em parte reprodutível ) de que certos provérbios são conhecidos pela maioria dos falantes de uma comunidade linguística
Unidade paremiológica unidade conceptual representada pelo conjunto das múltiplas variantes de um mesmo provérbio e que é definida com base em critérios formais , semânticos ( significado ) e pragmáticos ( uso )
Os provérbios fazem parte do nosso dia a dia e têm vindo a ser um objeto de interesse entre profissionais de diferentes áreas do conhecimento . Não é , por isso , raro verificar um interesse em determinar um conjunto de provérbios comum , conhecido pela maioria dos falantes de uma comunidade linguística . Este tipo de expressões surge em grande número na língua e apresenta uma riqueza cultural e linguística ( e outras ) indiscutíveis . Contudo , se a seleção de um provérbio poderá ser fortuita quando o objetivo é , por exemplo , analisar a rima ou o paralelismo , já poderá não o ser quando pretendemos ensinar português a um aluno estrangeiro ou quando estamos a utilizar os provérbios enquanto instrumento de diagnóstico de certas perturbações da linguagem . Até ao presente , ainda não estava acessível uma lista de provérbios muito usuais do português europeu ( PE ) – um mínimo paremiológico . O trabalho que aqui apresentamos visou preencher essa lacuna no conhecimento do português .
Mínimo paremiológico do português europeu
Para estabelecer o mínimo paremiológico do português europeu , foi necessário utilizar diferentes métodos baseados , essencialmente , na frequência de provérbios em diferentes tipos de fontes – nomeadamente , em corpora , em coletâneas de provérbios , em manuais escolares e na internet , – bem como recorrer a questionários on-line . Da interseção dos vários métodos constituímos o mínimo paremiológico , que inclui 318 expressões .
A partir da digitalização de coletâneas de provérbios ( em suporte papel ), construiu-se inicialmente uma base de dados digital com cerca de 114 mil entradas . Usando algumas ferramentas de processamento de linguagem natural , associaram-se a cada provérbio as respetivas palavras-chave , isto é , os elementos lexicais plenamente significativos , e determinaram-se os provérbios que mais ocorriam nessa base de dados . Contudo , tal valor não corresponde diretamente à disponibilidade lexical dos provérbios , isto é , o grau de conhecimento que a maioria dos falantes nativos tem dessas expressões , havendo , além disso , muitos provérbios que apresentam um número considerável de variantes . Introduzimos assim o conceito de unidade paremiológica , ou seja , o conjunto formado por todas as variantes de um mesmo provérbio , com o mesmo significado global e condições de uso idênticas ( Fig . 1 ). Essas unidades foram representadas sob a forma de grafos de estados finitos , de modo a permitirem o reconhecimento automático dessas expressões nos textos em que ocorrem . Num formalismo equivalente ,
Figura 1 . Grafo representando as variantes do provérbio Antes tarde que nunca .
10