Anonimizar
La operación Anonimizar te permite proteger los datos sensibles reemplazando los valores originales con datos anonimizados. Esta operación se aplica durante la fase de transformación del pipeline.
Resumen
La operación Anonimizar te permite:
- Proteger información personal identificable (PII) sensible
- Reemplazar datos originales con datos falsos realistas
- Aplicar diferentes técnicas de anonimización a diferentes campos
- Mantener la utilidad de los datos mientras se asegura el cumplimiento de privacidad
- Trabajar con varios tipos de datos (cadenas, números, fechas)
Configuración
Anonimización a Nivel de Campo
La operación Anonimizar se configura a nivel de campo, permitiéndote especificar diferentes métodos de anonimización para cada campo sensible. Cuando configuras la anonimización a nivel de campo, verás un ícono de lápiz (✎) en la columna de acciones que abre el panel de Editar Función para una configuración más detallada.
Cada campo puede configurarse con uno de los siguientes métodos de anonimización organizados en el menú desplegable:
Usar Datos Falsos
Reemplaza los valores con datos falsos realistas basados en etiquetas de campo. Cuando seleccionas esta opción, aparece un menú desplegable de etiquetas que permite al usuario elegir el generador estándar de datos falsos. Este menú desplegable contiene varias etiquetas categorizadas por tipo (Idioma, Fecha, Global, Personalizado) que determinan qué tipo de datos falsos se generarán. Por ejemplo, un campo etiquetado como "person/name" sería reemplazado con nombres falsos, mientras que un campo etiquetado como "contact/email" sería reemplazado con direcciones de correo falsas.
Opciones de datos falsos
- Etiquetas basadas en idioma (por ejemplo, "person/name", "contact/email")
- Etiquetas de formato de fecha (por ejemplo, "date/yyyy-mm-dd")
- Etiquetas globales (por ejemplo, "global/url")
- Etiquetas personalizadas (por ejemplo, "custom/IBAN")
Funciones
Funciones de anonimización integradas que pueden aplicarse a los campos.
Enmascarado
Reemplaza partes de los valores con caracteres de máscara manteniendo el formato. Por ejemplo, un número de tarjeta de crédito "1234-5678-9012-3456" podría convertirse en "--****-3456".
Mezcla
Reordena aleatoriamente los valores dentro del conjunto de datos manteniendo la misma distribución de valores.
Lista
Reemplaza los valores seleccionando aleatoriamente de una lista predefinida de valores.
Eliminar campo
Elimina completamente el campo del conjunto de datos de salida.
Campo en blanco
Reemplaza todos los valores con valores nulos/vacíos.
Funciones Guardadas
Usa una función personalizada creada y guardada previamente. Estas funciones guardadas provienen de tus Funciones de Proyecto que pueden reutilizarse en diferentes modelos dentro del mismo proyecto.
Función Personalizada
Escribe tu propia función de anonimización usando código JavaScript. Para más información sobre crear funciones personalizadas, consulta Funciones Personalizadas.
Sin Acción
Mantiene los valores originales sin cambios (útil para pruebas o cuando ciertos campos no necesitan anonimización).
Opciones de Editar Función
Cuando haces clic en el ícono de lápiz (✎) para un campo con el método de anonimización "Datos falsos", verás varias opciones de configuración:
Configuración Regional
Especifica la configuración regional a usar para generar datos falsos. Esto afecta las características culturales de los datos generados como nombres, direcciones y números de teléfono. Por ejemplo, usando la configuración regional "es-ES" se generarán nombres y direcciones españolas, mientras que "en-US" generará nombres y direcciones estadounidenses. La configuración regional se establece automáticamente basada en la configuración regional de la etiqueta seleccionada pero puede ser sobreescrita.
Formato de Texto
Controla el formato de los datos falsos generados. Las opciones incluyen:
- Ninguno: Mantiene el formato original del generador
- MAYÚSCULAS: Convierte todo el texto a mayúsculas
- minúsculas: Convierte todo el texto a minúsculas
- Mayúsculas Iniciales: Capitaliza la primera letra de cada palabra
- Guión_bajo: Convierte espacios a guiones bajos
- Guión-medio: Convierte espacios a guiones medios
Prefijo
Agrega un prefijo personalizado a todos los valores de datos falsos generados. Activa la opción de prefijo con la casilla de verificación, luego ingresa tu prefijo deseado en el campo de texto. Por ejemplo, con el prefijo "TEST_" un nombre generado "Juan Pérez" se convertiría en "TEST_Juan Pérez".
Sufijo
Agrega un sufijo personalizado a todos los valores de datos falsos generados. Activa la opción de sufijo con la casilla de verificación, luego ingresa tu sufijo deseado en el campo de texto. Por ejemplo, con el sufijo "_USUARIO" un nombre generado "Juan Pérez" se convertiría en "Juan Pérez_USUARIO".
Diccionario
Controla cómo se mapean y reusan los valores de reemplazo. Esta opción determina el alcance en el que los valores generados se almacenan y reusan para mantener consistencia. Para información detallada sobre los modos de diccionario, consulta Funciones de Diccionario.
Modos de Diccionario
Cuando anonimizas datos, puedes controlar cómo se mapean los valores de reemplazo usando diferentes modos de diccionario:
Heredar de la regla
Usa el comportamiento predeterminado del diccionario definido a nivel de regla.
Saltar diccionario
No mantener mapeo consistente entre valores originales y de reemplazo.
Alcance de etiqueta
Mantener mapeo consistente dentro de campos que tienen la misma etiqueta.
Alcance de nombre de campo
Mantener mapeo consistente dentro de campos que tienen el mismo nombre.
Alcance Entidad/Campo
Mantener mapeo consistente dentro de la misma combinación de entidad y campo.
Alcance global
Mantener mapeo consistente a través de todas las entidades y campos.
Alcance definido por usuario
Define tu propio alcance para mapeo consistente usando una cadena de alcance personalizada. Cuando se selecciona, puedes especificar un nombre de alcance personalizado en el campo de texto proporcionado.
Ejemplos
Anonimización Básica
Para anonimizar datos de clientes:
- Ejecuta una operación de descubrimiento primero para identificar campos sensibles
- Selecciona la entidad cliente
- Para el campo "name", elige "Datos falsos" con etiqueta "name"
- Para el campo "email", elige "Datos falsos" con etiqueta "email"
- Para el campo "phone", elige "Enmascarado" para preservar el formato mientras ocultas los números reales
Anonimización Consistente
Para asegurar que el mismo nombre de cliente siempre sea reemplazado con el mismo nombre falso:
- Selecciona el modo de diccionario "Alcance de etiqueta" para campos de nombre
- Esto asegura que cuando "Juan Pérez" aparezca en cualquier campo etiquetado como "name", siempre será reemplazado con el mismo nombre falso como "María García"
Función de Anonimización Personalizada
Para aplicar un algoritmo de anonimización personalizado:
- Selecciona un campo y elige "Función personalizada"
- Escribe código JavaScript que tome el valor original y retorne una versión anonimizada
Esta operación ayuda a asegurar que tus datos cumplan con regulaciones de privacidad manteniendo características de datos realistas para propósitos de prueba y desarrollo.