Please use this identifier to cite or link to this item:
https://ric.cps.sp.gov.br/handle/123456789/28872
Title: | Análise comparativa de algoritmos para anonimização de dados pessoais |
Other Titles: | Comparative analysis of algorithms for personal data anonymization |
Authors: | SILVA, João Pedro da |
Advisor: | BORGES, Vanessa dos Anjos |
type of document: | Artigo Científico |
Keywords: | Privacidade;Proteção de dados pessoais;Informação - segurança |
Issue Date: | 17-Dec-2024 |
Publisher: | 157 |
Citation: | SILVA, João Pedro da. Análise comparativa de algoritmos para anonimização de dados pessoais. Orientador: Vanessa dos Anjos Borges. 2024. 29 f. Trabalho de Conclusão de Curso (Tecnólogo em Análise e Desenvolvimento de Sistemas) - Faculdade de Tecnologia de Presidente Prudente, Presidente Prudente, SP, 2024. |
Abstract: | A crescente digitalização e a regulamentação da LGPD evidenciam a necessidade de proteger
dados pessoais em um contexto cada vez mais orientado por dados. Este estudo busca avaliar
e comparar técnicas de anonimização aplicadas a um dataset sintético gerado com a biblioteca
Faker, incluindo Masking, Tokenization, Hashing, k-Anonymity, l-Diversity e t-Closeness. A
pesquisa utilizou métodos aplicados que permitem balancear a privacidade com a utilidade
dos dados, respeitando princípios como confidencialidade, integridade e disponibilidade. As
técnicas foram implementadas e avaliadas quanto à eficácia e limitações. Masking oculta
parcialmente informações sensíveis, preservando a estrutura dos dados. Tokenization substitui
atributos sensíveis por tokens irreversíveis, enquanto Hashing utiliza funções para
anonimização irreversível. O k-Anonymity garante que cada registro pertença a grupos de pelo
menos k registros indistinguíveis, enquanto o l-Diversity adiciona diversidade ao atributo
sensível. O t-Closeness fortalece a proteção, controlando a proximidade da distribuição local
com a global. Os resultados mostram que cada técnica possui aplicações específicas,
dependendo da sensibilidade dos dados e da análise requerida. Conclui-se que a escolha da
abordagem deve considerar o equilíbrio entre privacidade e utilidade, sendo a combinação de
técnicas uma estratégia eficiente para atender a diferentes cenários e regulamentações. Increasing digitalization and LGPD regulation highlight the need to protect personal data in an increasingly data-driven context. This study seeks to evaluate and compare anonymization techniques applied to a dataset artificially generated with the Faker library, including Masking, Tokenization, Hashing, k-Anonymity, l-Diversity and t-Closeness. The research used applied methods that allow balancing privacy with data privacy, respecting principles such as confidentiality, integrity and availability. The techniques were innovative and evaluated for effectiveness and limitations. Masking partially confidential information, preserving the data structure. Tokenization replaces sensitive attributes with irreversible tokens, while Hashing uses functions such as SHA-256 for irreversible anonymization. k-Anonymity ensures that each record belongs to groups of at least kkk indistinguishable records, while l-Diversity adds diversity to the sensitive attribute. t-Closeness strengthens protection by controlling the proximity of local to global distribution. The results show that each technique has specific applications, depending on the sensitivity of the data and the analysis required. It is concluded that the choice of approach must consider the balance between privacy and utility, with the combination of techniques being an efficient strategy to meet different scenarios and regulations. |
URI: | https://ric.cps.sp.gov.br/handle/123456789/28872 |
Appears in Collections: | Trabalhos de Conclusão de Curso |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ads_2024_2_joaopsilva_analisecomparativadealgoritmosparaanonimizacao.pdf Restricted Access | 1.35 MB | Adobe PDF | View/Open Request a copy |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.