Use este identificador para citar ou linkar para este item:
https://ric.cps.sp.gov.br/handle/123456789/35260
Título: | Avaliação comparativa de modelos de linguagem de pequeno porte na tradução para o português |
Autor(es): | MORAIS, Bianca Lopes G. de FRANCO, Gustavo Henrique Braz REIS, Lucas Araújo Silva dos |
Orientador(es): | CARVALHO, Luciano Gonçalves de |
Tipo documental: | Artigo Científico |
Palavras-chave: | Processamento de texto;Tradução;Língua inglesa;Língua portuguesa |
Data do documento: | 2024 |
Editor: | 184 |
Referência Bibliográfica: | MORAIS, Bianca Lopes G. de; FRANCO, Gustavo Henrique Braz; REIS, Lucas Araújo Silva dos. Avaliação comparativa de modelos de linguagem de pequeno porte na tradução para o português, 2024. Trabalho de conclusão de curso (Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas) - Faculdade de Tecnologia de Mogi das Cruzes, Mogi das Cruzes, 2024 |
Resumo: | Este estudo avalia o desempenho de dois modelos de linguagem open source
amplamente reconhecidos em 2024: Llama 3.1 8B Instruct e Mistral Instruct 7B, com foco
na tradução do inglês para o português. As traduções foram analisadas com base nas
métricas BLEU e METEOR, que são baseadas em n-gramas (sequências de tokens). Os
experimentos utilizaram conjuntos de dados abertos disponíveis do OPUS e foram
conduzidos localmente. O Llama 3.1 8B Instruct apresentou maior consistência e melhor
desempenho geral, enquanto o Mistral Instruct mostrou maior variação de desempenho.
Ambos os modelos demonstraram limitações ao lidar com expressões e construções
mais complexas, mas, com os resultados apresentados, há uma possibilidade de uso
para determinadas atividades. This study evaluates the performance of two widely recognized open-source language models in 2024: Llama 3.1 8B Instruct and Mistral Instruct 7B, focusing on the translation from English to Portuguese. The translations were analyzed based on the BLEU and METEOR metrics, which are based on n-grams (sequences of tokens). The experiments utilized publicly available open datasets from OPUS and were conducted locally. The Llama 3.1 8B Instruct demonstrated greater consistency and better overall performance, while the Mistral Instruct showed more variation in performance. Both models exhibited limitations when dealing with expressions and more complex constructions; however, given the results presented, there is potential for use in certain activities. |
Descrição: | Artigo publicado Revista Eletrônica Anima Terra, Faculdade de Tecnologia de Mogi das Cruzes – FATEC-MC. Mogi das Cruzes-SP., n°18, ano IX, p.16-30, 2° semestre de 2024. ISSN 2526-1940. |
URI: | https://ric.cps.sp.gov.br/handle/123456789/35260 |
Aparece nas coleções: | Trabalhos de Conclusão de Curso |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
analiseedesenvolvimentodesistemas_2024_2_biancalopesgdemorais_avaliacaocomparativademodelosde.pdf Restricted Access | 187.23 kB | Adobe PDF | Visualizar/Abrir Solictar uma cópia |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.