Radicalizador do português brasileiro baseado na Morfologia Distribuída

Autores

DOI:

https://doi.org/10.5380/rel.v103i1.80580

Palavras-chave:

Radicalizador, Português brasileiro, Morfologia Distribuída

Resumo

A discussão teórica e empírica acerca do processamento morfológico tem sido relacionada às diferentes arquiteturas de processamento. Enquanto os modelos de Full Entry propõem o acesso lexical por meio da ativação da palavra inteira, os modelos de Full Parsing propõem o acesso lexical por meio da decomposição morfológica. Nesse sentido, radicalizadores (stemmers) são mecanismos úteis para análise morfológica porque permitem a conflação de palavras no léxico e a modelagem computacional do processamento morfológico, assim como das interfaces morfofonológica e morfossintática. Contudo, os radicalizadores atuais de Processamento de Linguagem Natural foram desenvolvidos desconsiderando os modelos teóricos de Morfologia ou da Linguística. Sendo assim, o objetivo do presente trabalho foi desenvolver um radicalizador do português brasileiro baseado na teoria linguística da Morfologia Distribuída. Os objetivos específicos foram i. apresentar o repertório de morfemas flexionais e derivacionais, ii. analisar os morfemas em termos de traços morfossintáticos e classes gramaticais, e, iii. modelar a decomposição de palavras polimorfêmicas. Nossos resultados apontam que um modelo decomposicional é capaz de processar as estruturas morfológicas do português brasileiro. Ainda, um modelo flexível com diferentes subestruturas para os casos de alomorfia poderia apresentar resultados mais eficazes para a derivação e a flexão irregular. Além da radicalização, nosso algoritmo apresenta algumas características específicas, tais como i. a ativação dos traços morfossintáticos, ii. a definição da classe gramatical derivacional e iii. especificação teórica baseado na teoria. Enfim, o algoritmo possui código aberto e acesso livre para utilização em diversas aplicações, estando disponível em https://lexicodoportugues.shinyapps.io/Stemmer/.

Biografia do Autor

Gustavo Lopez Estivalet, Universidade Federal da Paraíba (UFPB) Laboratório de Processamento Linguístico (LAPROL)

Professor do Departamento de Letras Estrangeiras Modernas (DLEM) da área de francês e do Programa de Pós-Graduação em Linguística (PROLING) da área de Teoria e Análise Linguística da Universidade Federal da Paraíba (UFPB), João Pessoa-PB, Brasil. Pesquisador do Laboratório de Processamento Linguístico (LAPROL) da UFPB. Realizou pós-doutorado (PDJ/CNPq, 2018) no Laboratório da Linguagem e Processos Cognitivos (LabLing) da Universidade Federal de Santa Catarina (UFSC), Florianópolis-SC, Brasil, com pesquisa sobre o processamento fonológico e o acesso lexical em crianças disléxicas e não disléxicas. Possui doutorado (GDE/CNPq, 2016) em Neurociências e Ciências Cognitivas na Université Claude Bernard Lyon 1 (UCBL), Lyon, França, com pesquisa sobre o processamento morfológico e o acesso lexical em falantes nativos e não nativos. Possui mestrado (CAPES, 2012) em Linguística na UFSC com pesquisa sobre a aquisição da linguagem e a produção oral em língua estrangeira. Possui graduação em Letras - Língua Francesa e Literaturas, habilitação em licenciatura e habilitação em bacharelado na UFSC. Tem interesse em linguística, psicolinguística, neurolinguística, linguística computacional, fonologia, morfologia, sintaxe e línguas estrangeiras.

Karla Araújo Pinheiro, Universidade Federal da Paraíba (UFPB) Laboratório de Processamento Linguístico (LAPROL)

Graduada em Letras pela Universidade Federal da Paraíba(UFPB) (2018), mestranda em Linguística pelo Programa de Pós Graduação em Linguística (PROLING) pela Universidade Federal da Paraíba (UFPB) (2020-2021). Com Curso de Extensão em Libras da Universidade Federal da Paraíba (UFPB) em andamento (2018 - 2021). Atualmente, desenvolvendo trabalhos na Área de Teoria e Análise Linguística diante da Aquisição da Linguagem e Processamento Linguístico.

José Ferrari Neto, Universidade Federal da Paraíba (UFPB) Laboratório de Processamento Linguístico (LAPROL)

Possui graduação em Letras pela Universidade Católica de Petrópolis (1999), especialização em Língua Portuguesa pela Universidade Federal do Rio de Janeiro (2000), mestrado (2003) e doutorado (2008) em Estudos da Linguagem pela Pontificia Universidade Catolica - RJ (2003). Pós-Doutorado em Linguística pela Universidade Estadual de Campinas (Unicamp). Tem experiência em docência e pesquisa na área de Lingüística, com ênfase em Psicolingüística e Aquisição da Linguagem. Foi Professor Assistente de Língua Portuguesa e Línguística Geral na Universidade Católica de Petrópolis (RJ) e Professor de Linguística na Universidade Federal Rural de Pernambuco (UFRPE). Atualmente é Professor Associado II de Linguística e Língua Portuguesa na Universidade Federal da Paraíba (UFPB), atuando no Programa de Pós-Graduação em Linguística (Proling) e desenvolvendo pesquisas no LAPROL (Laboratório de Processamento Linguístico), com investigações voltadas para o léxico, morfologia, correferência e leitura.

Downloads

Publicado

2021-12-22

Como Citar

Estivalet, G. L., Pinheiro, K. A., & Ferrari Neto, J. (2021). Radicalizador do português brasileiro baseado na Morfologia Distribuída. Revista Letras, 103(1). https://doi.org/10.5380/rel.v103i1.80580

Edição

Seção

V Colóquio Brasileiro de Morfologia