Operaciones

Anonimizar

La operación Anonimizar te permite proteger los datos sensibles reemplazando los valores originales con datos anonimizados. Esta operación se aplica durante la fase de transformación del pipeline.

Resumen

La operación Anonimizar te permite:

  • Proteger información personal identificable (PII) sensible
  • Reemplazar datos originales con datos falsos realistas
  • Aplicar diferentes técnicas de anonimización a diferentes campos
  • Mantener la utilidad de los datos mientras se asegura el cumplimiento de privacidad
  • Trabajar con varios tipos de datos (cadenas, números, fechas)

Configuración

Anonimización a Nivel de Campo

La operación Anonimizar se configura a nivel de campo, permitiéndote especificar diferentes métodos de anonimización para cada campo sensible. Cuando configuras la anonimización a nivel de campo, verás un ícono de lápiz (✎) en la columna de acciones que abre el panel de Editar Función para una configuración más detallada.

Cada campo puede configurarse con uno de los siguientes métodos de anonimización organizados en el menú desplegable:

Usar Datos Falsos

Reemplaza los valores con datos falsos realistas basados en etiquetas de campo. Cuando seleccionas esta opción, aparece un menú desplegable de etiquetas que permite al usuario elegir el generador estándar de datos falsos. Este menú desplegable contiene varias etiquetas categorizadas por tipo (Idioma, Fecha, Global, Personalizado) que determinan qué tipo de datos falsos se generarán. Por ejemplo, un campo etiquetado como "person/name" sería reemplazado con nombres falsos, mientras que un campo etiquetado como "contact/email" sería reemplazado con direcciones de correo falsas.

Opciones de datos falsos

  • Etiquetas basadas en idioma (por ejemplo, "person/name", "contact/email")
  • Etiquetas de formato de fecha (por ejemplo, "date/yyyy-mm-dd")
  • Etiquetas globales (por ejemplo, "global/url")
  • Etiquetas personalizadas (por ejemplo, "custom/IBAN")

Funciones

Funciones de anonimización integradas que pueden aplicarse a los campos.

Enmascarado

Reemplaza partes de los valores con caracteres de máscara manteniendo el formato. Por ejemplo, un número de tarjeta de crédito "1234-5678-9012-3456" podría convertirse en "--****-3456".

Mezcla

Reordena aleatoriamente los valores dentro del conjunto de datos manteniendo la misma distribución de valores.

Lista

Reemplaza los valores seleccionando aleatoriamente de una lista predefinida de valores.

Eliminar campo

Elimina completamente el campo del conjunto de datos de salida.

Campo en blanco

Reemplaza todos los valores con valores nulos/vacíos.

Funciones Guardadas

Usa una función personalizada creada y guardada previamente. Estas funciones guardadas provienen de tus Funciones de Proyecto que pueden reutilizarse en diferentes modelos dentro del mismo proyecto.

Función Personalizada

Escribe tu propia función de anonimización usando código JavaScript. Para más información sobre crear funciones personalizadas, consulta Funciones Personalizadas.

Sin Acción

Mantiene los valores originales sin cambios (útil para pruebas o cuando ciertos campos no necesitan anonimización).

Opciones de Editar Función

Cuando haces clic en el ícono de lápiz (✎) para un campo con el método de anonimización "Datos falsos", verás varias opciones de configuración:

Configuración Regional

Especifica la configuración regional a usar para generar datos falsos. Esto afecta las características culturales de los datos generados como nombres, direcciones y números de teléfono. Por ejemplo, usando la configuración regional "es-ES" se generarán nombres y direcciones españolas, mientras que "en-US" generará nombres y direcciones estadounidenses. La configuración regional se establece automáticamente basada en la configuración regional de la etiqueta seleccionada pero puede ser sobreescrita.

Formato de Texto

Controla el formato de los datos falsos generados. Las opciones incluyen:

  • Ninguno: Mantiene el formato original del generador
  • MAYÚSCULAS: Convierte todo el texto a mayúsculas
  • minúsculas: Convierte todo el texto a minúsculas
  • Mayúsculas Iniciales: Capitaliza la primera letra de cada palabra
  • Guión_bajo: Convierte espacios a guiones bajos
  • Guión-medio: Convierte espacios a guiones medios

Prefijo

Agrega un prefijo personalizado a todos los valores de datos falsos generados. Activa la opción de prefijo con la casilla de verificación, luego ingresa tu prefijo deseado en el campo de texto. Por ejemplo, con el prefijo "TEST_" un nombre generado "Juan Pérez" se convertiría en "TEST_Juan Pérez".

Sufijo

Agrega un sufijo personalizado a todos los valores de datos falsos generados. Activa la opción de sufijo con la casilla de verificación, luego ingresa tu sufijo deseado en el campo de texto. Por ejemplo, con el sufijo "_USUARIO" un nombre generado "Juan Pérez" se convertiría en "Juan Pérez_USUARIO".

Diccionario

Controla cómo se mapean y reusan los valores de reemplazo. Esta opción determina el alcance en el que los valores generados se almacenan y reusan para mantener consistencia. Para información detallada sobre los modos de diccionario, consulta Funciones de Diccionario.

Modos de Diccionario

Cuando anonimizas datos, puedes controlar cómo se mapean los valores de reemplazo usando diferentes modos de diccionario:

Heredar de la regla

Usa el comportamiento predeterminado del diccionario definido a nivel de regla.

Saltar diccionario

No mantener mapeo consistente entre valores originales y de reemplazo.

Alcance de etiqueta

Mantener mapeo consistente dentro de campos que tienen la misma etiqueta.

Alcance de nombre de campo

Mantener mapeo consistente dentro de campos que tienen el mismo nombre.

Alcance Entidad/Campo

Mantener mapeo consistente dentro de la misma combinación de entidad y campo.

Alcance global

Mantener mapeo consistente a través de todas las entidades y campos.

Alcance definido por usuario

Define tu propio alcance para mapeo consistente usando una cadena de alcance personalizada. Cuando se selecciona, puedes especificar un nombre de alcance personalizado en el campo de texto proporcionado.

Ejemplos

Anonimización Básica

Para anonimizar datos de clientes:

  1. Ejecuta una operación de descubrimiento primero para identificar campos sensibles
  2. Selecciona la entidad cliente
  3. Para el campo "name", elige "Datos falsos" con etiqueta "name"
  4. Para el campo "email", elige "Datos falsos" con etiqueta "email"
  5. Para el campo "phone", elige "Enmascarado" para preservar el formato mientras ocultas los números reales

Anonimización Consistente

Para asegurar que el mismo nombre de cliente siempre sea reemplazado con el mismo nombre falso:

  1. Selecciona el modo de diccionario "Alcance de etiqueta" para campos de nombre
  2. Esto asegura que cuando "Juan Pérez" aparezca en cualquier campo etiquetado como "name", siempre será reemplazado con el mismo nombre falso como "María García"

Función de Anonimización Personalizada

Para aplicar un algoritmo de anonimización personalizado:

  1. Selecciona un campo y elige "Función personalizada"
  2. Escribe código JavaScript que tome el valor original y retorne una versión anonimizada

Esta operación ayuda a asegurar que tus datos cumplan con regulaciones de privacidad manteniendo características de datos realistas para propósitos de prueba y desarrollo.