Pintura Arq. Eduardo Moreira Santos, Lx (28.08.1904 - 23.04.1992)

segunda-feira, 30 de dezembro de 2013

Propostas

Propostas para pôr em andamento a ILP Valentim Paz Andrade

Ainda não sabemos como vai ser a redação final da Lei derivada da iniciativa legislativa popular ILP Valentim Paz Andrade que, entre outras cousas, promove a progressiva incorporação do estudo do Português no ensino obrigatório. E, portanto, ainda também não conhecemos o suposto decreto (ou decretos) que permitirá desenvolver e pôr em marcha os principais elementos da dita Lei. No entanto, é importante discutirmos e falarmos de propostas concretas, algo que já se está a fazer no âmbito do reintegracionismo, e que não é outro que o propósito deste artigo. Antes de nada queria dar os parabéns a todas e todos aqueles que ajudaram a levar a bom porto esta ILP, uma das iniciativas mais transversais, em termos políticos, da nossa história recente. Mesmo a minha mãe, fervorosa votante do partido popular, é uma das 17.000 assinantes.

Ao respeito da parte da iniciativa ligada ao tema do ensino, esta-se a falar de duas propostas concretas: por um lado, introduzir o Português no ensino secundário, e talvez no primário, como língua segunda obrigatória e, por outro, introduzir unidades de Português nas aulas de língua galega. Desde o princípio, pensei que a primeira proposta era mais realista e eficiente. Certo é que, desde uma perspectiva idealista, isso significa que estamos a tratar o Português como uma língua estrangeira e não como uma variante da nossa língua comum. Mas também é certo que, desde um ponto de vista utilitário, conseguimos mais conhecimento e mais visibilidade do Português ao pô-lo em contato direto com milhares de estudantes. E eu acredito na equação 'mais Português na Galiza é igual a mais Reintegracionismo'. O principal receio que tinha para a segunda proposta, a introdução do Português nas aulas de Galego, derivava da minha pouca fé no professorado. Fazer depender o ensino do Português em professores de língua galega é uma aposta demasiado arriscada se não se desenha, organiza e leva a cabo um protocolo bem ajeitado de formação.

Nestes momentos, penso que as duas propostas poderiam levar-se a cabo conjuntamente. De facto, cada vez vejo mais fácil a introdução do Português em aulas de Galego. Para além de existirem excelentes manuais didáticos de fácil consumo por parte de estudantes e professores, como 'Do Ñ para o NH', 'Manual galego de língua e estilo', as unidades didáticas dos cursos OPS, etc., vou propor a seguir uma metodologia ou estratégia complementária, ligada à linguística de corpus e às novas tecnologias da língua.

Todos sabemos que o passo do Galego ao Português não é um processo cognitivo complexo de tradução senão uma função mecánica simples de transliteração ortográfica com alguma adatação lexical. Deste jeito, um galego pode escrever Português padrão se conhece as regras ortográficas do padrão português. Em função do interesse, tempo e energia da pessoa, a maioria destas regras podem aprender-se em um dia, uma semana, um mês, ... não muito mais tempo. Mas também podemos tornar ainda mais eficiente o ensino das regras se estas se ordenam e organizam em função de critérios de produtividade e cobertura. É aqui onde entram as novas tecnologias. Podemos conhecer com bastante exatidão quais as regras que se aplicam com mais frequência em textos reais. Uma vez identificadas as regras mais frequentes, estas poderiam ser as primeiras em ensinar-se e aprender-se, o que ajudaria a motivar os estudantes, pois com 5 minutos de estudo conseguiriam produzir textos ortograficamente muito próximos (80-90% de similaridade) de textos em Português padrão. Temos de ter em conta que todo produto de natureza linguística segue a Lei de Zipf (instância da Lei de Potência), e neste caso, a lei manifesta-se assim: muito poucas regras ortográficas aplicam-se a quase todos os casos de transliteração, enquanto que a maioria das regras são marginais e com pequena cobertura. Devemos, portanto, conhecer quais são essas regras de grande cobertura e fomentar que se aprendam primeiro para motivar aos estudantes a escrever. Depois, pouco a pouco, podem ir aprendendo as regras com menos cobertura.

A jeito de brincadeira, fiz um pequeno estudo quantitativo do processo inverso: a partir de um texto português e de um conjunto de regras de transliteração, geramos um texto em galego RAG e medimos o grau de eficiência desse processo. Para levar a cabo este estudo, utilizei o, já velho, transliterador port2gz (que é uma versão ampliada do software inicial por2gal de Alberto Garcia), os léxicos do Galego e Português do projeto FreeLing e mais dous corpus de textos de notícias tirados de Galicia-Hoxe e do Jornal de Notícias, com 50.000 palavras cada corpus. O método é o seguinte. Calculo primeiro a percentagem de palavras do corpus galego que se encontra no léxico galego e também no português, tirando os nomes próprios, números, símbolos, etc. A seguir, translitero esse corpus e volto a calcular agora a percentagem de palavras do corpus transliterado que aparece no léxico português. O resultado que obtenho é uma aproximação ao Português a partir das regras de transliteração. Quanto mais próximo estiver do Português, mais eficientes são as regras utilizadas. Estes foram os resultados concretos:

O 96% das palavras do texto original galego encontram-se no léxico galego. O 4% restante são, em geral, neologismos, erros ortográficos, castelhanismos, etc. Por outro lado, o 69% das palavras do texto original galego estão contidas no léxico português. O objectivo da transliteração é portanto, partir desse 69% e achegar-se o máximo possível ao patamar do 96%. Uma vez feita a transliteração a partir do corpus português, a percentagem de palavras que se encontra no léxico galego é do 94%, só 2 pontos de distância ao respeito do texto original galego. Como era esperado, o conjunto de regras ortográficas tem uma grande eficiência em termos de adaptação da norma escrita portuguesa para a norma da RAG.

O que precisamos fazer para desenvolver a minha proposta é, no entanto, justo o contrário: definir as regras ortográficas que produzam Português padrão a partir de Galego RAG. Este processo é algo mais complexo do que o inverso pois a letra 'x' da norma RAG é muito ambígua. Mas é possível definir um conjunto de regras, desde as mais produtivas até as menos abrangentes, utilizando a estratégia quantitativa que acabei de descrever no parágrafo acima. Não se trata de desenvolver um método de tradução em base a um léxico e regras léxico-sintáticas, como faz muito bem o motor de tradução OpenTrad, senão de operar com regras ortográficas simples e comparar os resultados utilizando o léxico. O objectivo é descobrir as regras mais frequentes para assim elaborar uma primeira lista de regras eficientes de grande abrangência. Com médio fólio de regras, e mais o Galego que já conhecem, as estudantes poderão escrever um texto com mais do 90% de palavras em bom Português.

Se ainda assim, as nossas estudantes seguem sem motivar-se, sempre podemos recorrer ao Plano B: um vídeo de Elis Regina a cantar Águas de Março. Paulo Gamalho – Galiza in “Portal Galego da Língua”

Sem comentários:

Enviar um comentário