Propostas para pôr em andamento a ILP
Valentim Paz Andrade
Ainda não sabemos como vai ser a redação
final da Lei derivada da iniciativa legislativa popular ILP Valentim Paz
Andrade que, entre outras cousas, promove a progressiva incorporação do estudo
do Português no ensino obrigatório. E, portanto, ainda também não conhecemos o
suposto decreto (ou decretos) que permitirá desenvolver e pôr em marcha os
principais elementos da dita Lei. No entanto, é importante discutirmos e
falarmos de propostas concretas, algo que já se está a fazer no âmbito do
reintegracionismo, e que não é outro que o propósito deste artigo. Antes de
nada queria dar os parabéns a todas e todos aqueles que ajudaram a levar a bom
porto esta ILP, uma das iniciativas mais transversais, em termos políticos, da
nossa história recente. Mesmo a minha mãe, fervorosa votante do partido
popular, é uma das 17.000 assinantes.
Ao respeito da parte da iniciativa ligada ao
tema do ensino, esta-se a falar de duas propostas concretas: por um lado,
introduzir o Português no ensino secundário, e talvez no primário, como língua
segunda obrigatória e, por outro, introduzir unidades de Português nas aulas de
língua galega. Desde o princípio, pensei que a primeira proposta era mais
realista e eficiente. Certo é que, desde uma perspectiva idealista, isso
significa que estamos a tratar o Português como uma língua estrangeira e não
como uma variante da nossa língua comum. Mas também é certo que, desde um ponto
de vista utilitário, conseguimos mais conhecimento e mais visibilidade do
Português ao pô-lo em contato direto com milhares de estudantes. E eu acredito
na equação 'mais Português na Galiza é igual a mais Reintegracionismo'. O
principal receio que tinha para a segunda proposta, a introdução do Português
nas aulas de Galego, derivava da minha pouca fé no professorado. Fazer depender
o ensino do Português em professores de língua galega é uma aposta demasiado
arriscada se não se desenha, organiza e leva a cabo um protocolo bem ajeitado
de formação.
Nestes momentos, penso que as duas propostas
poderiam levar-se a cabo conjuntamente. De facto, cada vez vejo mais fácil a
introdução do Português em aulas de Galego. Para além de existirem excelentes
manuais didáticos de fácil consumo por parte de estudantes e professores, como
'Do Ñ para o NH', 'Manual galego de língua e estilo', as unidades didáticas dos
cursos OPS, etc., vou propor a seguir uma metodologia ou estratégia
complementária, ligada à linguística de corpus e às novas tecnologias da
língua.
Todos sabemos que o passo do Galego ao
Português não é um processo cognitivo complexo de tradução senão uma função
mecánica simples de transliteração ortográfica com alguma adatação lexical.
Deste jeito, um galego pode escrever Português padrão se conhece as regras
ortográficas do padrão português. Em função do interesse, tempo e energia da
pessoa, a maioria destas regras podem aprender-se em um dia, uma semana, um
mês, ... não muito mais tempo. Mas também podemos tornar ainda mais eficiente o
ensino das regras se estas se ordenam e organizam em função de critérios de
produtividade e cobertura. É aqui onde entram as novas tecnologias. Podemos
conhecer com bastante exatidão quais as regras que se aplicam com mais
frequência em textos reais. Uma vez identificadas as regras mais frequentes,
estas poderiam ser as primeiras em ensinar-se e aprender-se, o que ajudaria a
motivar os estudantes, pois com 5 minutos de estudo conseguiriam produzir
textos ortograficamente muito próximos (80-90% de similaridade) de textos em
Português padrão. Temos de ter em conta que todo produto de natureza
linguística segue a Lei de Zipf (instância da Lei de Potência), e neste caso, a
lei manifesta-se assim: muito poucas regras ortográficas aplicam-se a quase
todos os casos de transliteração, enquanto que a maioria das regras são
marginais e com pequena cobertura. Devemos, portanto, conhecer quais são essas
regras de grande cobertura e fomentar que se aprendam primeiro para motivar aos
estudantes a escrever. Depois, pouco a pouco, podem ir aprendendo as regras com
menos cobertura.
A jeito de brincadeira, fiz um pequeno estudo
quantitativo do processo inverso: a partir de um texto português e de um
conjunto de regras de transliteração, geramos um texto em galego RAG e medimos
o grau de eficiência desse processo. Para levar a cabo este estudo, utilizei o,
já velho, transliterador port2gz (que é uma versão ampliada do software inicial
por2gal de Alberto Garcia), os léxicos do Galego e Português do projeto
FreeLing e mais dous corpus de textos de notícias tirados de Galicia-Hoxe e do
Jornal de Notícias, com 50.000 palavras cada corpus. O método é o seguinte.
Calculo primeiro a percentagem de palavras do corpus galego que se encontra no
léxico galego e também no português, tirando os nomes próprios, números,
símbolos, etc. A seguir, translitero esse corpus e volto a calcular agora a
percentagem de palavras do corpus transliterado que aparece no léxico
português. O resultado que obtenho é uma aproximação ao Português a partir das
regras de transliteração. Quanto mais próximo estiver do Português, mais
eficientes são as regras utilizadas. Estes foram os resultados concretos:
O 96% das palavras do texto original galego
encontram-se no léxico galego. O 4% restante são, em geral, neologismos, erros
ortográficos, castelhanismos, etc. Por outro lado, o 69% das palavras do texto
original galego estão contidas no léxico português. O objectivo da transliteração
é portanto, partir desse 69% e achegar-se o máximo possível ao patamar do 96%.
Uma vez feita a transliteração a partir do corpus português, a percentagem de
palavras que se encontra no léxico galego é do 94%, só 2 pontos de distância ao
respeito do texto original galego. Como era esperado, o conjunto de regras
ortográficas tem uma grande eficiência em termos de adaptação da norma escrita
portuguesa para a norma da RAG.
O que precisamos fazer para desenvolver a
minha proposta é, no entanto, justo o contrário: definir as regras ortográficas
que produzam Português padrão a partir de Galego RAG. Este processo é algo mais
complexo do que o inverso pois a letra 'x' da norma RAG é muito ambígua. Mas é
possível definir um conjunto de regras, desde as mais produtivas até as menos
abrangentes, utilizando a estratégia quantitativa que acabei de descrever no
parágrafo acima. Não se trata de desenvolver um método de tradução em base a um
léxico e regras léxico-sintáticas, como faz muito bem o motor de tradução OpenTrad,
senão de operar com regras ortográficas simples e comparar os resultados
utilizando o léxico. O objectivo é descobrir as regras mais frequentes para
assim elaborar uma primeira lista de regras eficientes de grande abrangência.
Com médio fólio de regras, e mais o Galego que já conhecem, as estudantes
poderão escrever um texto com mais do 90% de palavras em bom Português.
Se ainda assim, as nossas estudantes seguem
sem motivar-se, sempre podemos recorrer ao Plano B: um vídeo de Elis Regina a
cantar Águas de Março. Paulo Gamalho –
Galiza in “Portal Galego da Língua”
Sem comentários:
Enviar um comentário