Use este identificador para citar ou linkar para este item: https://ric.cps.sp.gov.br/handle/123456789/43920
Título: Utilização de Voyant Tools para compreensão de documentos não estruturados
Título(s) alternativo(s): Using Voyant Tools to understand unstructured documents
Autor(es): ROCHA, Gabriela Alves da
Orientador(es): CAPELOCI, Eloíza Martins Primo
Tipo documental: Artigo Científico
Palavras-chave: Mineração de dados;Linguagem natural;Processamento de texto;Processamento de dados
Data do documento: 29-Nov-2023
Editor: 259
Referência Bibliográfica: ROCHA, Gabriela Alves da. Utilização de Voyant Tools para compreensão de documentos não estruturados, 2023. Trabalho de conclusão de curso (Curso Superior de Tecnologia em Big Data no Agronegócio) - Faculdade de Tecnologia FATEC Shunji Nishimura (Pompéia), Pompéia, 2023.
Resumo: A análise e mineração de dados textuais tem sido importante na interpretação de dados textuais gerados em um cenário cada vez mais informatizado, onde dados são gerados a todo tempo. Estima-se que aproximadamente 2,0 quintilhões de bytes de dados assumem a forma de texto diariamente. A mineração de dados não estruturados representa o processo de extrair informações uteis e conhecimento a partir de uma certa quantidade de dados textuais, constituído por texto em linguagem natural, como por exemplo documentos em formato PDF, e-mails e postagens em redes sociais. Desde a origem da computação, tanto linguistas quanto especialistas em recuperação da informação têm criado softwares com o intuito de identificar padrões de linguagem que não são identificados em uma leitura convencional. Este estudo aborda a análise de conteúdo textual por meio da utilização da ferramenta web Voyant Tools que explora análise textual e mineração de dados textuais. O objetivo central é explorar como esta ferramenta pode contribuir para a compreensão de documentos não estruturados, que não seguem um padrão definido por conta da sua variedade linguística, contexto e intenção, estilo de escrita e a inclusão de elementos não textuais, como gráficos e tabelas, imagens e vídeos. Para a análise também foram incorporadas algumas técnicas de Processamento de Linguagem Natural (PLN) relevantes para uma análise textual mais precisa e significativa. Dentre as técnicas, destacam-se a remoção das stopwords, contagem de palavras e análise de frequência de cada termo dentro de um corpus textual.
URI: https://ric.cps.sp.gov.br/handle/123456789/43920
Aparece nas coleções:Trabalhos de Conclusão de Curso

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
bigdata_2023_2_gabrielarocha_utilizacaodevoyanttools.pdf709.13 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.