IRTUM – Institutional Repository of the Technical University of Moldova

Advanced methods of data anonymization in medical research

Show simple item record

dc.contributor.advisor ȚURCANU, Dinu
dc.contributor.advisor COJOCARU, Svetlana
dc.contributor.author SIMINIUC, Sergiu
dc.date.accessioned 2025-01-31T09:29:31Z
dc.date.available 2025-01-31T09:29:31Z
dc.date.issued 2025
dc.identifier.citation SIMINIUC, Sergiu. Advanced methods of data anonymization in medical research. Teză de master. Programul de studiu Securitate informațională. Conducător ştiinţific ȚURCANU Dinu. Universitatea Tehnică a Moldovei. Chișinău, 2025. en_US
dc.identifier.uri http://repository.utm.md/handle/5014/29236
dc.description Fişierul ataşat conţine: Abstract, Rezumat, Contents, Introduction, Bibliography. en_US
dc.description.abstract The increasing importance of data-driven healthcare, particularly in rare disease research, ne-cessitates robust methods for data anonymization. This thesis explores advanced anonymization techniques to ensure patient privacy while maintaining the utility of medical data. Rare disease datasets pose unique challenges due to their small sample sizes and the high risk of reidentification. Traditional methods, such as k-anonymity and pseudonymization, are often insufficient in addressing these complexities. This research evaluates three primary anonymization techniques—k-anonymity, differential privacy, and pseudonymization—through a structured methodology applied to synthetic and real-world datasets. The study begins with an in-depth literature review, identifying gaps in current practices and regulatory challenges, particularly under the European Union’s General Data Protection Regulation (GDPR). The methodology includes the preparation of datasets reflecting the complexity of rare disease registries, implementation of anonymization techniques, and evaluation based on metrics such as re-identification risk, data utility, and computational efficiency. Results demonstrate that k-anonymity effectively reduces reidentification risks but at the cost of significant data generalization. Differential privacy provides formal guarantees against re-identification but introduces variability that can impact statistical analyses. Pseudonymization, while useful for longitudinal studies, does not fully address reidentification risks without additional measures. This thesis highlights the trade-offs between privacy and utility inherent in anonymization techniques and emphasizes the need for a hybrid approach tailored to the specific requirements of rare disease research. Personal contributions include the development of a comprehensive framework for evaluating anonymization methods, integration of ethical considerations into the methodology, and practical recommendations for enhancing data sharing practices. The findings not only advance the understanding of anonymization in medical research but also align with global initiatives to promote ethical data use and privacy-preserving technologies. en_US
dc.description.abstract Importanța tot mai mare a îngrijirii medicale bazate pe date, în special în cercetarea privind bolile rare, impune utilizarea unor metode robuste de anonimizare a datelor. Această teză explorează tehnici avansate de anonimizare pentru a asigura confidențialitatea pacienților, menținând în același timp util-itatea datelor medicale. Seturile de date privind bolile rare prezintă provocări unice, datorită dimen-siunilor reduse ale eșantioanelor și riscului ridicat de re-identificare. Metodele tradiționale, cum ar fi k-anonimitatea și pseudonimizarea, sunt adesea insuficiente în abordarea acestor complexități. Această cercetare evaluează trei tehnici principale de anonimizare—k-anonimitatea, confidențialitatea diferențială și pseudonimizarea—printr-o metodologie structurată aplicată pe seturi de date sintetice și reale. Studiul începe cu o revizuire literară detaliată, identificând lacunele din practicile curente și provocările reglementare, în special în contextul Regulamentului General privind Protecția Datelor (GDPR) al Uniunii Europene. Metodologia include pregătirea unor seturi de date care reflectă complexitatea reg-istrelor pentru bolile rare, implementarea tehnicilor de anonimizare și evaluarea acestora pe baza unor metrici precum riscul de re-identificare, utilitatea datelor și eficiența computațională. Rezultatele arată că k-anonimitatea reduce în mod eficient riscurile de re-identificare, însă cu prețul unei generalizări sem-nificative a datelor. Confidențialitatea diferențială oferă garanții formale împotriva re-identificării, dar introduce variabilitate care poate afecta analizele statistice. Pseudonimizarea, deși utilă pentru studii longitudinale, nu abordează complet riscurile de re-identificare fără măsuri suplimentare. Această teză evidențiază compromisurile dintre confidențialitate și utilitate inerente tehnicilor de anonimizare și subliniază necesitatea unei abordări hibride, adaptate cerințelor specifice ale cercetării privind bolile rare. Contribuțiile personale includ dezvoltarea unui cadru cuprinzător pentru evaluarea metodelor de anonimizare, integrarea considerentelor etice în metodologie și recomandări practice pentru îmbunătățirea practicilor de partajare a datelor. Rezultatele obținute nu doar că avansează înțelegerea anonimizării în cercetarea medicală, dar se aliniază și inițiativelor globale de promovare a utilizării etice a datelor și a tehnologiilor care protejează confidențialitatea. en_US
dc.language.iso en en_US
dc.publisher Universitatea Tehnică a Moldovei en_US
dc.rights Attribution-NonCommercial-NoDerivs 3.0 United States *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/us/ *
dc.subject data anonymization en_US
dc.subject data-driven healthcare en_US
dc.subject medical research en_US
dc.title Advanced methods of data anonymization in medical research en_US
dc.type Thesis en_US


Files in this item

The following license files are associated with this item:

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States

Search DSpace


Browse

My Account