Please use this identifier to cite or link to this item:
https://ric.cps.sp.gov.br/handle/123456789/12838
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | LACERDA, Antonio Alfredo | - |
dc.contributor.author | TELES, Caio Matheus | - |
dc.contributor.author | SILVA, Lucas Alves da | - |
dc.contributor.other | ROCCIA, Clerivaldo José | - |
dc.contributor.other | SOFFNER, Renato Kraide | - |
dc.date.accessioned | 2023-05-31T17:32:43Z | - |
dc.date.available | 2023-05-31T17:32:43Z | - |
dc.date.issued | 2021-12-08 | - |
dc.identifier.citation | TELES, Caio Matheus, SILVA, Lucas Alves da. Jambo: coleta de dados com web scraping, 2021. Trabalho de conclusão de curso (Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas) - Faculdade de Tecnologia de Americana, Americana, 2021 | pt_BR |
dc.identifier.uri | https://ric.cps.sp.gov.br/handle/123456789/12838 | - |
dc.description.abstract | Esse Projeto propõe uma ferramenta para auxiliar em pesquisas para fins estudantis, a ideia é retirar informações da internet de forma automática e trazer para o usuário através de uma tela amigável de maneira simples, direta e sem distrações. Foram utilizadas as práticas de engenharia de software além de frameworks e serviços integrados que foram inseridos no desenvolvimento e agilizaram a criação da ferramenta. O programa foi escrito na linguagem de programação Python utilizando uma técnica conhecida como Web Scraping e estabelece um algoritmo capaz de extrair dados e salvar informações em arquivos, além do mais, o programa possibilita o uso de um navegador integrado para pesquisas auxiliares. Para além da criação de um protótipo, é importante ressaltar questões éticas e legais sobre o impacto de uma ferramenta automatizada em servidores de terceiros, portanto, no final do trabalho foi descrito algumas questões importantes que foram plenamente seguidas a fim de evitar problemas relacionados a dados ou infraestrutura alheia, uma vez que, um script que coleta dados da web pode causar danos se criado de maneira incorreta. | pt_BR |
dc.description.abstract | This Project proposes a tool to assist in research for student purposes, the idea is to automatically retrieve information from the internet and bring it to the user through a friendly screen in a simple, direct and without distractions. Software engineering practices were used, in addition to frameworks and integrated services that were included in the development and streamlined the creation of the tool. The program was written in the Python programming language using a technique known as Web Scraping and establishes an algorithm capable of extracting data and saving information in files, moreover, the program allows the use of an integrated browser for auxiliary searches. In addition for creating a prototype, it is important to highlight ethical and legal issues about the impact of an automated tool on third-party servers, so at the end of the work some important issues were described that were fully followed to avoid problems related to external data or infrastructure, as a script that collects data from the web can cause damage if created incorrectly. | pt_BR |
dc.description.sponsorship | Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas | pt_BR |
dc.language.iso | pt_BR | pt_BR |
dc.publisher | 004 | pt_BR |
dc.subject | Engenharia de software | pt_BR |
dc.subject | Python | pt_BR |
dc.subject | Mineração de dados | pt_BR |
dc.subject | Frameworks | - |
dc.subject.other | Informação e Comunicação | pt_BR |
dc.title | Jambo: coleta de dados com web scraping | pt_BR |
dc.title.alternative | Jambo: data collection with web scraping | pt_BR |
dc.type | Monografia | pt_BR |
Appears in Collections: | Trabalhos de Conclusão de Curso |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
20212S_Caio Matheus Teles_OD1485.pdf | 1.7 MB | Adobe PDF | View/Open | |
TermodeAutorização - Caio Matheus Teles.pdf Restricted Access | 636.93 kB | Adobe PDF | View/Open Request a copy |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.