Anonimización de datos en proyectos de analítica: Principios, operaciones y algoritmos

22/11/2017

La anonimización de datos es el proceso que permite ocultar la información sensible contenida en un determinado conjunto de datos (Aggarwal and Yu, 2008), permitiendo su divulgación sin que ello implique vulnerar los derechos a la protección de datos de las personas y organizaciones que se puedan referenciar en los mismos. La anonimización automática o semi-automática de conjuntos de datos se constituye como un desafío importante ya que, entre otras cosas, el proceso que se lleva a cabo no se encuentra bien definido, y para su realización se deben combinar diversas operaciones y principios de anonimización. Así mismo, el proceso de anonimización debe propender por generar datos que No permitan re-identificar a la entidad a la que hacen referencia los datos (e.g. cliente, paciente), al mismo tiempo que se garantice la mínima pérdida de información posible y la viabilidad computacional del proceso.

Esta presentación realiza una introducción a los principios, operaciones y algoritmos de anonimización que deben considerarse antes de divulgar información sensible. Así mismo, durante la charla se presentarán los desafíos más importantes al incorporar este proceso en proyectos de analítica que requieran entregar información a externos a la empresa dueña de los datos, como investigadores y firmas consultoras.

alexandra pomares

Alexandra Pomares Quimbaya

CV

Profesora Asociada de la Pontificia Universidad Javeriana en Bogotá, Colombia y dirige el grupo de Investigación ISTAR. A lo largo de su carrera ha estado involucrada en las áreas de inteligencia de negocios e integración de datos tanto a nivel académico, como de investigación y consultoría. Alexandra estudió Ingeniería de Sistemas en la Pontificia Universidad Javeriana, Maestría en Ingeniería de Sistemas y Computación en la Universidad de los Andes, Doctorado en Ingeniería de la Universidad de los Andes y Doctorado en Informática de la Universidad de Grenoble, Francia. Actualmente trabaja en una iniciativa colombiana que busca mejorar la calidad de la información disponible en el ámbito de la investigación médica para promover la medicina basada en el valor. Así mismo, es líder técnica del equipo de investigación de la Pontificia Universidad Javeriana en CAOBA, el Centro de Excelencia y Apropiación en Big Data y Data Analytics de Colombia.