VOLTAR À PÁGINA INICIAL 

 

EDUCAÇÃO & LITERATURA

 

TRADUTORES AUTOMÁTICOS

Josué Geraldo Botura do Carmo[1]

Janeiro/2004

JOSUÉ GERALDO BOTURA DO CARMO

 

 

 

“A TA é um dos problemas interdisciplinares

mais profundos na história da pesquisa científica”.

Tucker

 Foi no início da década de 50 do século passado que, segundo a autora, inicia-se um novo campo de investigação científica de natureza multidisciplinar envolvendo a Psicologia, a Filosofia, a Teoria da Informação, a Inteligência Artificial (IA), a Matemática, a Neurologia, cujo objeto de estudo é a mente como processador de informações. 

A Lingüística Computacional (LC), também conhecida como Processamento de Linguagem Natural (PLN) é uma conseqüência das pesquisas em Inteligência Artificial (IA) que é uma ciência que resulta de métodos programados em computador, que simulam atividades mentais humanas.

A LC vai estudar os sistemas computacionais usados para a compreensão e a geração de linguagem natural. É uma interseção entre a Lingüística e a Computação, trabalhando com a razão e a lógica. O grande elo entre essas duas disciplinas é a Lingüística Formal de Noam Chomsky que afirma que a competência lingüística do falante de uma língua pode ser descrita em termos de um número finito de regras ou princípios lingüísticos capazes de gerar um número infinito de frases nessa língua e de eliminar um número infinito de frases consideradas agramaticais.

A principal área de aplicação da LC será o Processamento de Textos, que vai viabilizar o desenvolvimento de Tradutores Automáticos, Corretores Gramaticais e de Sistemas de Pergunta e Resposta. A Tradução Automática (TA) é um dos domínios da LC que mais envolve conhecimento lingüístico, pois vai codificar informações de uma língua para outra.

O desenvolvimento da TA se deve ao grande interesse de americanos e ingleses, durante a época da Guerra Fria de decifrar informações científicas soviéticas. Booth e Warren Weaver, de nacionalidades inglesa e americana respectivamente, desenvolvem uma calculadora científica com dados suficientes para realizar uma tradução palavra por palavra, sem considerar questões sintáticas ou de ordem lexical. Podia-se dessa forma ter acesso à tradução de uma lista de palavras-chave de determinado texto, e assim ter uma idéia de seu conteúdo. Em 1948 o inglês Richens introduz nessa mesma máquina informações de caráter gramatical e sintático da língua russa, que vai propiciar uma maior eficiência na consulta automática. Em 1948 Richens introduz nessa mesma máquina informações de caráter gramatical e sintático da língua russa, que vem propiciar uma maior eficiência na consulta automática.

No início dos anos 50, Weaver propõe a exploração automática do contexto dos termos tentando solucionar problemas de ambigüidade semântica, acreditando que os circuitos lógicos das calculadoras seriam capazes de resolver os elementos lógicos da linguagem, auxiliados pela determinação da área à qual a informação pertence, mas essa idéia foi refutada.

No ano de 1954 houve, na Universidade de Georgetown, a primeira experiência bem sucedida de TA entre o russo e o inglês realizada por um computador. O vocabulário continha 250 palavras e seis regras sintáticas de acordo com Alfaro[2] (1998), segundo a autora.

Com a criação da Comunidade Econômica Européia, na década de 80, há uma retomada de interesse pela TA, devido à explosão de informação e ao desenvolvimento e estabelecimento de teorias no âmbito da Lingüística Formal, com grande investigação semântica, ao processamento informatizado de línguas naturais com base em gramáticas de análise e de geração, segundo Alfaro (1998), de acordo com a autora.

Assim o campo da IA, principalmente no tocante a LC e mais especificamente a TA, passa a receber apoio principalmente de países europeus. Os objetivos agora eram desenvolver aplicativos computacionais que auxiliassem a tradução e programas de TA que previssem a intervenção humana.

Estes programas hoje são medidos pela quantidade de pré e pós-revisão requerida. É considerado como aceitável um programa cujo índice de revisão posterior seja menor do que 20%, ou seja, uma correção a cada cinco palavras. E em muitos casos o sistema pode ir sendo melhorado com o uso, conforme o tradutor humano vai adquirindo prática na otimização do sistema, vai aprendendo a reconhecer os erros típicos da TA.

Com a proliferação da Internet nos anos 90 esses programas passam a ser bastante usados na rede. Grande é a quantidade de informações repassadas através da rede e também diversificado o número de usuários de línguas completamente diferentes, com acesso a essas informações.

Temos nos dias de hoje tradutores automáticos com capacidade de aquisição lexical como o Globalink Power Translator Pro® (1995), que é um software de tradução multilígüe inteligente, o que significa que o usuário pode acrescentar informações ao seu banco de dados, mas isso não isenta a necessidade de uma pós-edição, de uma intervenção humana no resultado final da TA.

Em 1999, foi introduzido no mercado o Delta Translator®, um tradutor bilíngüe entre a língua inglesa e uma segunda língua. O fato de este tradutor realizar a tradução somente entre duas línguas ele vai ter um banco de dados mais compacto, pois lida somente com o léxico de dois idiomas e menos regras gramaticais e sintáticas de correspondência entre as línguas. Contudo necessita também da pós-revisão humana no final da TA. Esse programa possui também um dicionário de palavras e um dicionário de expressões, que podem ser otimizados pelo usuário, e ainda, uma função de voz, incluindo a possibilidade de se ouvir o texto original e a tradução, que auxilia também na aprendizagem da pronúncia das línguas e é uma ferramenta de grande auxílio para os deficientes visuais. Dispõe ainda de um assistente sintático-semântico que resolve casos de ambigüidades categorial de itens lexicais.

Esses tradutores eletrônicos podem auxiliar muito tanto tradutores profissionais como leigos em seus trabalhos de tradução, contudo não podemos nos esquecer que necessitam de uma revisão humana, antes, durante e após a tradução, não dispensando uma interação humana especializada.

Temos também o TRANSIT que não é um tradutor automático, mas uma memória de tradução. Esse software nos chega com memória zero e o banco de dados é preenchido on-line, durante a tradução do usuário. Toda vez que o TRANSIT detecta uma frase ao menos semelhante àquela do seu banco de dados, ele imediatamente fornece a tradução e a percentagem de semelhança com a frase a ser traduzida. É um sistema eficiente principalmente para tradutores técnicos que se dedicam a um mesmo domínio terminológico.

O aperfeiçoamento desses programas acontecerão com a comunhão de diversos domínios da ciência com a Lingüística Computacional, a Engenharia Computacionaltradutores tprofissionais como leigos em seus trabalhos de traduincipalmente de pa, a Inteligência Artificial e a Neurologia unidos à criatividade e o conhecimento acumulado.


REFERÊNCIA BIBLIOGRÁFICA

GARRÃO, Milena de Uzeda. (PUC-Rio) Tradução automáticaainda um enigma multidisciplinar.

<http://www.filologia.org.br/vcnlf/anais%20v/civ11_05.htm>

Acessado em11 de janeiro de 2004

 Bibliografia Recomendada


ALFARO, C. Descobrindo, Compreendendo e Analisando a Tradução Automática. Monografia de Fim de Curso de Especialização em Tradução Inglês/Português, PUC-Rio, 1998.
ALFARO, C & M.C.P. DIAS. “Tradução Automática: uma ferramenta de auxílio ao tradutor”. In Cadernos de Tradução n° 3. Centro de Comunicação e Expressão: GT de Tradução.
Universidade Federal de Santa Catarina, 1998.
BAR-HILLEL. Language and Information. Selected essays on their theory and application. Massachusetts : Addison-Wesley Publishing Company., 1964.
BOGURAEV, B. & J. PUSTEJOVSKY. Issues in Text-based Lexical Acquisition. In B. Boguraev e J. Pustejovsky (orgs.) Corpus Processing for Lexical Acquistion. Cambridge, Massachusetts : MIT Press, 1995.
CHURCHLAND, P. & GRUSH, R. Computation and the Brain.
<http://mitpress.mit.edu/MITECS/work/churchland_r.html>, 1999.
DAMASIO, A. Descartes’ Error: emotion, reason, and the human brain.
Nova York : Putnam, 1994.
FREITAS, NAME & SILVEIRA. Modelos Modulares e Modelos Conexionistas: abordagens possíveis para o processamento da informação. Versão escrita da palestra apresentada no curso Evolução do Pensamento Lingüístico, PUC-Rio, 1999.
FODOR, J. & PYLYSHYN, Z (1988) “Connectionism and Cognitive Architecture: A Critical Analysis”, In Pinker & Mehler, J.(Ed.) Connections and Symbols. Cognition, Special Issue.
KURZWEIL, R. The Age of Spiritual Machines: When Computers Excede Human Intelligence. Cambridge, Massachusetts: MIT Press, 2000.
NIRENBURG, S. “Knowledge and Choices in Machine Translation”. In Niremburg S. (Org). Machine Translation. Cambridge : Cambridge University Press, 1987.
OLIVEIRA, C. O Processamento Automático do Léxico. Monografía de fim do curso Introdução à Lingüística Computacional. PUC-Rio, 2000.
PINKER, S. Como a Mente Funciona. São Paulo : Companhia das Letras. 1999.
SANTOS, P. “Tradução Automática”. In Mateus, M.H. & Branco, A. H. (orgs.) Engenharia da Linguagem. Faculdade de Letras da Universidade de Lisboa.
Lisboa : Colibri. 1995.
TUCKER, A. B. “Current Strategies in Machine Translation Research and Development”. In Niremburg S. (Org). Machine Translation. Cambridge : Cambridge University Press, 1987.
VALE, O. A. “Sintaxe, léxico e expressões idiomáticas”. In Brito & Vale (eds.) Filosofia, lingüística e informática: aspectos da linguagem, Goiânia : UFG, 1999.

[1] Pedagogo com habilitação em Administração Escolar de 1. e 2. graus e Magistério das Matérias Pedagógicas de 2. grau. Professor Facilitador em Informática Aplicada à Educação pelo PROINFO - MEC - NTE - MG-2

[2] ALFARO, C. Descobrindo, Compreendendo e Analisando a Tradução Automática. Monografia de Fim de Curso de Especialização em Tradução Inglês/Português, PUC-Rio, 1998.
ALFARO, C & M.C.P. DIAS. “Tradução Automática: uma ferramenta de auxílio ao tradutor”. In Cadernos de Tradução n° 3. Centro de Comunicação e Expressão: GT de Tradução.
Universidade Federal de Santa Catarina, 1998.