Please use this identifier to cite or link to this item:
https://ric.cps.sp.gov.br/handle/123456789/43920| Title: | Utilização de Voyant Tools para compreensão de documentos não estruturados |
| Other Titles: | Using Voyant Tools to understand unstructured documents |
| Authors: | ROCHA, Gabriela Alves da |
| Advisor: | CAPELOCI, Eloíza Martins Primo |
| type of document: | Artigo Científico |
| Keywords: | Mineração de dados;Linguagem natural;Processamento de texto;Processamento de dados |
| Issue Date: | 29-Nov-2023 |
| Publisher: | 259 |
| Citation: | ROCHA, Gabriela Alves da. Utilização de Voyant Tools para compreensão de documentos não estruturados, 2023. Trabalho de conclusão de curso (Curso Superior de Tecnologia em Big Data no Agronegócio) - Faculdade de Tecnologia FATEC Shunji Nishimura (Pompéia), Pompéia, 2023. |
| Abstract: | A análise e mineração de dados textuais tem sido importante na interpretação de dados textuais gerados em um cenário cada vez mais informatizado, onde dados são gerados a todo tempo. Estima-se que aproximadamente 2,0 quintilhões de bytes de dados assumem a forma de texto diariamente. A mineração de dados não estruturados representa o processo de extrair informações uteis e conhecimento a partir de uma certa quantidade de dados textuais, constituído por texto em linguagem natural, como por exemplo documentos em formato PDF, e-mails e postagens em redes sociais. Desde a origem da computação, tanto linguistas quanto especialistas em recuperação da informação têm criado softwares com o intuito de identificar padrões de linguagem que não são identificados em uma leitura convencional. Este estudo aborda a análise de conteúdo textual por meio da utilização da ferramenta web Voyant Tools que explora análise textual e mineração de dados textuais. O objetivo central é explorar como esta ferramenta pode contribuir para a compreensão de documentos não estruturados, que não seguem um padrão definido por conta da sua variedade linguística, contexto e intenção, estilo de escrita e a inclusão de elementos não textuais, como gráficos e tabelas, imagens e vídeos. Para a análise também foram incorporadas algumas técnicas de Processamento de Linguagem Natural (PLN) relevantes para uma análise textual mais precisa e significativa. Dentre as técnicas, destacam-se a remoção das stopwords, contagem de palavras e análise de frequência de cada termo dentro de um corpus textual. |
| URI: | https://ric.cps.sp.gov.br/handle/123456789/43920 |
| Appears in Collections: | Trabalhos de Conclusão de Curso |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| bigdata_2023_2_gabrielarocha_utilizacaodevoyanttools.pdf | 709.13 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.