Descubrimiento
En este documento aprenderás a:
- Crear un nuevo job de descubrimiento.
- Identificar campos y datos sensibles de tu tap.
- Clasificar campos con etiquetas del sistema o etiquetas personalizadas.
El job de descubrimiento es el paso más importante en el contexto del modelo. Recomendamos realizar un etiquetado muy preciso y correcto de los datos, ya que será el núcleo para anonimizar el tap o generar datos sintetizados automáticamente.
Qué es un descubrimiento
Un descubrimiento es un proceso mediante el cual Gigantics analiza los datos del tap y clasifica cada campo con un % de probabilidad de que los valores de los campos pertenezcan a esa etiqueta.
Las etiquetas pueden ser modificadas o eliminadas por el usuario para ajustar el etiquetado.
Estas etiquetas son útiles porque:
- Clasifican y analizan el riesgo de los campos de tu tap.
- Las transformaciones que posteriormente se realizan en las reglas se basarán en las etiquetas de los campos para asignar valores similares a los reales.
Crear un nuevo descubrimiento
Encontrarás dos tipos de descubrimiento:
-
Descubrimiento completo: El descubrimiento completo tiene una duración más larga ya que analiza la base de datos y asigna etiquetas a cada uno de los campos de la base de datos según los datos almacenados.
-
Solo escaneo: Este tipo de descubrimiento solo realizará un escaneo rápido para obtener el esquema de tu tap. Después de este job, puedes ver el esquema desde la página de Esquema.
En ambos casos, Gigantics creará un nuevo job que podrás encontrar en la página de Jobs del modelo.
Si primero escaneas tu base de datos, durante la configuración del descubrimiento puedes seleccionar las entidades que deseas descubrir.
Descubrimiento completo
Entidades
Te permite incluir o excluir las entidades que deseas descubrir. Cuantas más entidades tengas, más completo será el informe final. Puedes elegir qué entidades formarán parte del análisis o cuáles no utilizando las tablas o una expresión regular.
Permite descubrir tu tap parcialmente seleccionando las entidades que deseas descubrir. Para realizar este paso, es necesario haber escaneado previamente el tap.
Configuración
En este paso, puedes configurar los ajustes de tu job de descubrimiento.
- Fusionar con descubrimientos anteriores: Si existe un descubrimiento anterior, no sobrescribe las etiquetas existentes.
- Límite de velocidad: Limita las filas procesadas por segundo para evitar sobrecargar los servidores.
- Concurrencia: Especifica el número de veces que Gigantics analizará las columnas de las tablas. Cuanto mayor sea la concurrencia, más precisa será la clasificación, pero tomará más tiempo. Valores recomendados: 1, 2 o 3.
- Límite de filas: Establece el límite de la muestra de filas a analizar. Cuanto mayor sea el porcentaje, más preciso será el análisis, pero también tomará más tiempo.
- Probabilidad de etiquetas: Permite establecer un límite más allá del cual el sistema asignará automáticamente una etiqueta al campo.
Programación
Te permite programar el análisis para una fecha y hora específicas o ejecutarlo en ese momento. Este proceso ejecutará un job que podrás consultar en cualquier momento en la ventana de Jobs.
Solo escaneo
Escanea el tap para obtener el esquema y la lista de entidades y campos.
Mapa de calor
El mapa de calor es una representación visual del riesgo de la base de datos en caso de una filtración.
Esta representación se realiza en base a las etiquetas asignadas automáticamente por Gigantics. Si deseas saber más sobre cómo funcionan estas etiquetas, puedes ver más información aquí.
Cada etiqueta contiene dos parámetros que representan el riesgo de una entidad:
- Campo PII: Indica si el campo contiene datos sensibles.
- Severidad: Muestra la sensibilidad del campo en función de los datos que contiene.
En base a estos dos parámetros, la entidad se dibuja con un color que va desde verde (sin riesgo) hasta rojo intenso (riesgo muy alto).
Desde el mapa de calor y seleccionando una o varias entidades, podrás editar las etiquetas que se han asignado en el proceso de descubrimiento.
Si has realizado un descubrimiento parcial sin incluir todas las entidades, las entidades no descubiertas se mostrarán en gris.
Editar etiquetas
Antes de confirmar una entidad, podrás modificar las etiquetas de cada uno de los campos de la entidad.
Por defecto, cada etiqueta tiene dos opciones predeterminadas. La primera es si el campo contiene datos sensibles (por ejemplo, una identificación personal o una dirección completa) y finalmente un nivel de severidad.
Sin embargo, estos parámetros pueden ser modificados en esta página, pero solo se aplicarán para ese descubrimiento. Si deseas cambiar estos valores predeterminados, puedes hacerlo desde Configuración -> Etiquetas.
Depende del usuario evaluar la severidad y el riesgo del campo y configurarlo. Gigantics agrega valores predeterminados para facilitar esta tarea.
Confirmar entidades
Después de editar las etiquetas de los campos, puedes confirmar que la entidad es correcta. Ten cuidado porque después de la confirmación, las etiquetas de los campos no podrán ser cambiadas sin una razón.
Al confirmar las entidades, evitamos que otros usuarios cambien el etiquetado y manipulen el riesgo de los datos. Esto es importante para auditorías externas en el futuro.