Avaliação comparativa de modelos de linguagem de pequeno porte na tradução para o português

MORAIS, Bianca Lopes G. de; FRANCO, Gustavo Henrique Braz; REIS, Lucas Araújo Silva dos

Please use this identifier to cite or link to this item: https://ric.cps.sp.gov.br/handle/123456789/35260

Title:	Avaliação comparativa de modelos de linguagem de pequeno porte na tradução para o português
Authors:	MORAIS, Bianca Lopes G. de FRANCO, Gustavo Henrique Braz REIS, Lucas Araújo Silva dos
Advisor:	CARVALHO, Luciano Gonçalves de
type of document:	Artigo Científico
Keywords:	Processamento de texto;Tradução;Língua inglesa;Língua portuguesa
Issue Date:	2024
Publisher:	184
Citation:	MORAIS, Bianca Lopes G. de; FRANCO, Gustavo Henrique Braz; REIS, Lucas Araújo Silva dos. Avaliação comparativa de modelos de linguagem de pequeno porte na tradução para o português, 2024. Trabalho de conclusão de curso (Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas) - Faculdade de Tecnologia de Mogi das Cruzes, Mogi das Cruzes, 2024
Abstract:	Este estudo avalia o desempenho de dois modelos de linguagem open source amplamente reconhecidos em 2024: Llama 3.1 8B Instruct e Mistral Instruct 7B, com foco na tradução do inglês para o português. As traduções foram analisadas com base nas métricas BLEU e METEOR, que são baseadas em n-gramas (sequências de tokens). Os experimentos utilizaram conjuntos de dados abertos disponíveis do OPUS e foram conduzidos localmente. O Llama 3.1 8B Instruct apresentou maior consistência e melhor desempenho geral, enquanto o Mistral Instruct mostrou maior variação de desempenho. Ambos os modelos demonstraram limitações ao lidar com expressões e construções mais complexas, mas, com os resultados apresentados, há uma possibilidade de uso para determinadas atividades. This study evaluates the performance of two widely recognized open-source language models in 2024: Llama 3.1 8B Instruct and Mistral Instruct 7B, focusing on the translation from English to Portuguese. The translations were analyzed based on the BLEU and METEOR metrics, which are based on n-grams (sequences of tokens). The experiments utilized publicly available open datasets from OPUS and were conducted locally. The Llama 3.1 8B Instruct demonstrated greater consistency and better overall performance, while the Mistral Instruct showed more variation in performance. Both models exhibited limitations when dealing with expressions and more complex constructions; however, given the results presented, there is potential for use in certain activities.
Description:	Artigo publicado Revista Eletrônica Anima Terra, Faculdade de Tecnologia de Mogi das Cruzes – FATEC-MC. Mogi das Cruzes-SP., n°18, ano IX, p.16-30, 2° semestre de 2024. ISSN 2526-1940.
URI:	https://ric.cps.sp.gov.br/handle/123456789/35260
Appears in Collections:	Trabalhos de Conclusão de Curso

Files in This Item:

File	Description	Size	Format
analiseedesenvolvimentodesistemas_2024_2_biancalopesgdemorais_avaliacaocomparativademodelosde.pdf Restricted Access		187.23 kB	Adobe PDF	View/Open Request a copy

Show full item record Recommend this item