Análise comparativa de algoritmos para anonimização de dados pessoais

SILVA, João Pedro da

Please use this identifier to cite or link to this item: https://ric.cps.sp.gov.br/handle/123456789/28872

Title:	Análise comparativa de algoritmos para anonimização de dados pessoais
Other Titles:	Comparative analysis of algorithms for personal data anonymization
Authors:	SILVA, João Pedro da
Advisor:	BORGES, Vanessa dos Anjos
type of document:	Artigo Científico
Keywords:	Privacidade;Proteção de dados pessoais;Informação - segurança
Issue Date:	17-Dec-2024
Publisher:	157
Citation:	SILVA, João Pedro da. Análise comparativa de algoritmos para anonimização de dados pessoais. Orientador: Vanessa dos Anjos Borges. 2024. 29 f. Trabalho de Conclusão de Curso (Tecnólogo em Análise e Desenvolvimento de Sistemas) - Faculdade de Tecnologia de Presidente Prudente, Presidente Prudente, SP, 2024.
Abstract:	A crescente digitalização e a regulamentação da LGPD evidenciam a necessidade de proteger dados pessoais em um contexto cada vez mais orientado por dados. Este estudo busca avaliar e comparar técnicas de anonimização aplicadas a um dataset sintético gerado com a biblioteca Faker, incluindo Masking, Tokenization, Hashing, k-Anonymity, l-Diversity e t-Closeness. A pesquisa utilizou métodos aplicados que permitem balancear a privacidade com a utilidade dos dados, respeitando princípios como confidencialidade, integridade e disponibilidade. As técnicas foram implementadas e avaliadas quanto à eficácia e limitações. Masking oculta parcialmente informações sensíveis, preservando a estrutura dos dados. Tokenization substitui atributos sensíveis por tokens irreversíveis, enquanto Hashing utiliza funções para anonimização irreversível. O k-Anonymity garante que cada registro pertença a grupos de pelo menos k registros indistinguíveis, enquanto o l-Diversity adiciona diversidade ao atributo sensível. O t-Closeness fortalece a proteção, controlando a proximidade da distribuição local com a global. Os resultados mostram que cada técnica possui aplicações específicas, dependendo da sensibilidade dos dados e da análise requerida. Conclui-se que a escolha da abordagem deve considerar o equilíbrio entre privacidade e utilidade, sendo a combinação de técnicas uma estratégia eficiente para atender a diferentes cenários e regulamentações. Increasing digitalization and LGPD regulation highlight the need to protect personal data in an increasingly data-driven context. This study seeks to evaluate and compare anonymization techniques applied to a dataset artificially generated with the Faker library, including Masking, Tokenization, Hashing, k-Anonymity, l-Diversity and t-Closeness. The research used applied methods that allow balancing privacy with data privacy, respecting principles such as confidentiality, integrity and availability. The techniques were innovative and evaluated for effectiveness and limitations. Masking partially confidential information, preserving the data structure. Tokenization replaces sensitive attributes with irreversible tokens, while Hashing uses functions such as SHA-256 for irreversible anonymization. k-Anonymity ensures that each record belongs to groups of at least kkk indistinguishable records, while l-Diversity adds diversity to the sensitive attribute. t-Closeness strengthens protection by controlling the proximity of local to global distribution. The results show that each technique has specific applications, depending on the sensitivity of the data and the analysis required. It is concluded that the choice of approach must consider the balance between privacy and utility, with the combination of techniques being an efficient strategy to meet different scenarios and regulations.
URI:	https://ric.cps.sp.gov.br/handle/123456789/28872
Appears in Collections:	Trabalhos de Conclusão de Curso

Files in This Item:

File	Description	Size	Format
ads_2024_2_joaopsilva_analisecomparativadealgoritmosparaanonimizacao.pdf Restricted Access		1.35 MB	Adobe PDF	View/Open Request a copy

Show full item record Recommend this item