Bienvenido a la Documentación de Gigantics
¿Qué es Gigantics
Gigantics integra el análisis de riesgo de datos, la anonimización y la generación de datos sintéticos en una plataforma local primero. Analiza continuamente tus bases de datos para identificar información de identificación personal (PII), evalúa el riesgo a nivel de campo y enriquece los metadatos con un motor de etiquetado impulsado por IA para que puedas enmascarar, anonimizar o sintetizar datos con confianza.
Con Gigantics, puedes:
✅ Analizar esquemas de bases de datos y compararlos con revisiones anteriores
✅ Identificar PII automáticamente y revisar el nivel de riesgo de cada campo
✅ Generar conjuntos de datos anonimizados y completamente sintéticos para pruebas seguras
✅ Producir informes de seguridad listos para auditoría bajo demanda
✅ Gobernar, compartir y descargar conjuntos de datos curados
✅ Mover datos entre entornos sin exponer registros sensibles
✅ Controlar el acceso a través de roles y permisos granulares
Operaciones de Datos: Load, Dump, Pump
Gigantics agiliza tres verbos que definen el movimiento seguro de datos. Cada verbo está respaldado por canalizaciones de anonimización integradas y conciencia de metadatos para que los valores sensibles siempre se manejen de forma segura.
Descubrimiento
Importa metadatos de tus taps (fuentes). Gigantics inspecciona la estructura, etiqueta el PII con etiquetas y almacena todo en el Modelo.
Dump
Importa datos de tus taps (fuentes) mientras anonimizas o sintetizas nuevos datos. Gigantics usa etiquetas para modificar información sensible y almacena una copia gobernada dentro de conjuntos de datos en el Modelo.
Load
Mueve datos curados desde el Modelo hacia Sinks (objetivos) aplicando enmascaramiento, anonimización o síntesis en tiempo de vuelo (si los conjuntos de datos aún no están anonimizados, o si se están generando nuevos datos) para que solo cargas compatibles salgan alguna vez de la plataforma.
Pump
Refresca continuamente entornos descendientes con capturas sintéticas o anonimizadas. Los Pumps orquestan extracciones, transformaciones y entregas recurrentes sin volver a exponer registros de producción crudos mediante trabajos de pump automatizados. Puedes sobrescribir o solo actualizar nuevos datos.
Taps y Sinks
Los Taps representan las bases de datos, almacenes o APIs desde las que extraes; los sinks son los destinos donde Gigantics entrega datos protegidos. Cada tap y sink hereda tus reglas de datos para que la anonimización y la síntesis ocurran consistentemente en todo el flujo.
Seguridad y Colaboración
En entornos de datos sensibles, el control de acceso apropiado y la estructura organizacional son críticos para mantener la seguridad de datos mientras se permite la productividad del equipo. Gigantics proporciona un framework de seguridad autoservicio flexible a través de su sistema organizacional jerárquico.
Cada usuario tiene su propio espacio que llamamos Organizaciones, que sirve como el contenedor de nivel superior para todo tu trabajo de procesamiento de datos. Dentro de cada Organización, puedes crear múltiples Proyectos para aislar diferentes flujos de trabajo, bases de datos o responsabilidades del equipo. Esta separación asegura que el acceso a datos sensibles esté apropiadamente compartimentalizado y que los equipos puedan trabajar independientemente sin interferir con los flujos de trabajo de los demás.
Los Proyectos funcionan como espacios de trabajo individuales donde los usuarios pueden:
- Crear y gestionar modelos de datos
- Configurar conexiones de bases de datos (taps y sinks)
- Definir reglas de anonimización y síntesis
- Invitar miembros del equipo con niveles de permiso apropiados
- Compartir conjuntos de datos y colaborar de forma segura
El modelo de seguridad está diseñado para ser autoservicio, permitiendo a los equipos crear sus propias organizaciones y proyectos sin requerir intervención administrativa. Esta flexibilidad permite experimentación y desarrollo rápido mientras mantiene límites de seguridad a través de controles de acceso basados en roles granulares. Los usuarios pueden ser asignados diferentes niveles de permiso dentro de cada proyecto, asegurando que solo el personal autorizado pueda acceder o modificar conjuntos de datos sensibles.
Este enfoque jerárquico a la seguridad permite a las organizaciones implementar un modelo de manejo de datos "confianza cero" donde:
- El acceso a datos sensibles se controla a nivel de organización
- Los equipos pueden trabajar independientemente dentro de sus proyectos
- Las políticas de gobernanza de datos se aplican consistentemente en todos los espacios de trabajo
- Los requisitos de cumplimiento pueden cumplirse mediante registro de acceso y controles apropiados
Rápido, Gigantesco
Gigantics está diseñado para procesamiento de datos de alto rendimiento, aprovechando tecnologías de vanguardia para manejar conjuntos de datos a gran escala con velocidad y eficiencia notables. Nuestra plataforma procesa flujos de datos en paralelo usando tres estrategias de optimización centrales:
Reglas de IA Gestionadas Localmente
Todo el procesamiento de IA ocurre localmente en tu infraestructura, eliminando latencia de red y cuellos de botella de transferencia de datos. Este enfoque no solo asegura máxima seguridad y cumplimiento sino que también entrega tiempos de procesamiento más rápidos ya que los datos no necesitan viajar a través de redes para análisis.
Funciones Rápidas de JavaScript
Las transformaciones de datos personalizadas y operaciones de anonimización se ejecutan a través de funciones JavaScript altamente optimizadas. Estas funciones ligeras proporcionan velocidades de procesamiento rápidas mientras mantienen la flexibilidad para implementar lógica compleja de manipulación de datos adaptada a tus requisitos específicos.
Arquitectura de Streams de Node
Gigantics emplea streams de Node.js para procesar datos incrementalmente en lugar de cargar conjuntos de datos completos en memoria. Este enfoque de streaming permite uso eficiente de memoria y permite que los datos fluyan a través de canalizaciones de procesamiento sin esperar cargas completas de conjuntos de datos, reduciendo significativamente los tiempos de procesamiento para bases de datos grandes.
Estas tecnologías trabajan en concierto para entregar capacidades de procesamiento paralelo que escalan con tu volumen de datos. Ya sea anonimizando una base de datos pequeña o sintetizando conjuntos de datos masivos, Gigantics mantiene rendimiento consistente a través de gestión inteligente de recursos y streams de procesamiento concurrentes.
Qué leer a continuación
¿Listo para profundizar en Gigantics? Aquí están los temas esenciales para explorar a continuación:
- Taps - Aprende cómo conectar Gigantics a tus bases de datos y sistemas fuente
- Sinks - Entiende cómo configurar destinos de salida para tus datos procesados
- Modelos - Descubre el framework central donde defines reglas de procesamiento de datos
- Reglas - Domina la configuración de flujos de trabajo de transformación y anonimización de datos
- Etiquetas - Explora cómo Gigantics identifica automáticamente campos de datos sensibles
- Funciones - Personaliza transformaciones de datos con funciones JavaScript
- Diccionarios - Asegura consistencia en anonimización de datos a través de tus conjuntos de datos
- Conjuntos de Datos - Aprende cómo crear, gestionar y exportar colecciones de datos procesados
- Auditoría - Genera informes de seguridad listos para cumplimiento para tus operaciones de datos
- Sintetizar - Crea conjuntos de datos completamente nuevos y realistas desde cero
- Anonimizar - Protege información sensible mientras mantienes la utilidad de los datos
- Descubrimiento - Escanea y clasifica datos automáticamente en tus bases de datos
- Trabajos - Ejecuta y monitorea operaciones de procesamiento de datos
- Pipelines - Programa operaciones de datos recurrentes con flujos de trabajo automatizados
- Entornos - Organiza tus conexiones de bases de datos para diferentes casos de uso
- Transformar - Aplica lógica JavaScript personalizada para remodelar tus datos
- Glosario - 📘 ¡Decodifica el universo Gigantics - tu pasaporte al dominio de la privacidad de datos!
- Detección PII - Técnicas avanzadas para identificar información personal sensible
- Listas de Datos - Gestiona colecciones curadas de datos para procesamiento dirigido
- Guía de Instalación y Configuración - 🚀 Comienza aquí para poner Gigantics en marcha en tu sistema