Use este identificador para citar ou linkar para este item:
https://ric.cps.sp.gov.br/handle/123456789/43920| Título: | Utilização de Voyant Tools para compreensão de documentos não estruturados |
| Título(s) alternativo(s): | Using Voyant Tools to understand unstructured documents |
| Autor(es): | ROCHA, Gabriela Alves da |
| Orientador(es): | CAPELOCI, Eloíza Martins Primo |
| Tipo documental: | Artigo Científico |
| Palavras-chave: | Mineração de dados;Linguagem natural;Processamento de texto;Processamento de dados |
| Data do documento: | 29-Nov-2023 |
| Editor: | 259 |
| Referência Bibliográfica: | ROCHA, Gabriela Alves da. Utilização de Voyant Tools para compreensão de documentos não estruturados, 2023. Trabalho de conclusão de curso (Curso Superior de Tecnologia em Big Data no Agronegócio) - Faculdade de Tecnologia FATEC Shunji Nishimura (Pompéia), Pompéia, 2023. |
| Resumo: | A análise e mineração de dados textuais tem sido importante na interpretação de dados textuais gerados em um cenário cada vez mais informatizado, onde dados são gerados a todo tempo. Estima-se que aproximadamente 2,0 quintilhões de bytes de dados assumem a forma de texto diariamente. A mineração de dados não estruturados representa o processo de extrair informações uteis e conhecimento a partir de uma certa quantidade de dados textuais, constituído por texto em linguagem natural, como por exemplo documentos em formato PDF, e-mails e postagens em redes sociais. Desde a origem da computação, tanto linguistas quanto especialistas em recuperação da informação têm criado softwares com o intuito de identificar padrões de linguagem que não são identificados em uma leitura convencional. Este estudo aborda a análise de conteúdo textual por meio da utilização da ferramenta web Voyant Tools que explora análise textual e mineração de dados textuais. O objetivo central é explorar como esta ferramenta pode contribuir para a compreensão de documentos não estruturados, que não seguem um padrão definido por conta da sua variedade linguística, contexto e intenção, estilo de escrita e a inclusão de elementos não textuais, como gráficos e tabelas, imagens e vídeos. Para a análise também foram incorporadas algumas técnicas de Processamento de Linguagem Natural (PLN) relevantes para uma análise textual mais precisa e significativa. Dentre as técnicas, destacam-se a remoção das stopwords, contagem de palavras e análise de frequência de cada termo dentro de um corpus textual. |
| URI: | https://ric.cps.sp.gov.br/handle/123456789/43920 |
| Aparece nas coleções: | Trabalhos de Conclusão de Curso |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| bigdata_2023_2_gabrielarocha_utilizacaodevoyanttools.pdf | 709.13 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.