Jobs

La página de Jobs es tu centro operativo para gestionar todos los jobs de procesamiento de datos en tu modelo. Aquí puedes ver todo lo que se ha ejecutado, se está ejecutando o está programado para ejecutarse en el futuro. Es como un panel de control para todas tus operaciones de datos.

Vista general de la página

┌──────────────────────────────────────────────────────────────────────┐
│ Página de Jobs                                                       │
│ ┌──────────────────┬─────────────────┐   ┌─────────────────────────┐ │
│ │ Jobs recientes   │ Programados     │   │ Nuevo job ⊕ • Ordenar ▾ │ │
│ └──────────────────┴─────────────────┘   └─────────────────────────┘ │
│ ┌──────────────────────────────────────────────────────────────────┐ │
│ │ Estado | Nombre | Tipo | Regla | ...                             │ │
│ │   ●    | volcado tap→sink                                        │ │
│ │   ○    | descubrimiento nocturno                                 │ │
│ └──────────────────────────────────────────────────────────────────┘ │
└──────────────────────────────────────────────────────────────────────┘

Área de la interfaz	Qué muestra	Cómo interactuar
Pestañas (`Jobs recientes`, `Jobs programados`)	Filtran tu vista entre jobs recientes y jobs programados futuros.	Haz clic en las pestañas para cambiar entre vistas.
Barra de herramientas (`Nuevo job`, `Ordenar`)	Acciones principales para crear nuevos jobs o ordenar los existentes.	Usa el botón Nuevo job para crear una nueva tarea de procesamiento de datos.
Tabla de jobs	Tabla que muestra todos tus jobs de procesamiento de datos con su estado y detalles.	Haz clic en cualquier encabezado de columna para filtrar resultados. Haz clic en el nombre de un job para ver detalles.

Columnas de la tabla de jobs

Columna	Valor de ejemplo	Qué muestra
`Estado`	Indicador en ejecución o marca de completado	Estado actual del job.
`Nombre`	`tap-a-s3 (2024-05-06 01:00)`	Nombre descriptivo del job. Haz clic para ver registros detallados.
`Modelo` (solo vista del proyecto)	`Datos de clientes`	A qué modelo de datos pertenece este job.
`Tipo`	`volcado`, `carga`, `bombeo`, `descubrir`, `escanear`	Qué tipo de operación realiza el job.
`Regla`	`Anonimizar PII`	Si aplica, qué regla se aplicó a tus datos.
`Creado por`	`juan.gomez`	Quién inició el job.
`Información`	`Iniciado: 12:21 • Duración: 00:03:18` o `Próximo: 07/24/2024 22:00`	Cuándo se inició/terminó el job o cuándo está programado para ejecutarse.
`Acciones`	`⋮` menú con acciones disponibles	Acciones contextuales basadas en el estado actual del job.

Estado de los jobs

Estado	Qué significa	Qué puedes hacer
`en cola`	Job aceptado y esperando para iniciar.	Cancelar si es necesario, de lo contrario esperar a que comience.
`en ejecución`	Job actualmente procesando datos.	Monitorear el progreso a través de la página de detalles; cancelar si es necesario.
`completado`	Job terminado exitosamente.	Ver resultados o repetir si es necesario.
`fallido`	Job encontró un error.	Reiniciar para reintentar las partes fallidas o repetir completamente.
`programado`	Job configurado para ejecutarse en un tiempo futuro.	Editar o cancelar el tiempo programado.

Trabajando con jobs

Iniciar nuevos jobs

El botón Nuevo job (+) en la barra de herramientas abre el Modal Nuevo Job, que es la interfaz principal para crear nuevas tareas de procesamiento de datos. El modal proporciona una interfaz de configuración completa con las siguientes capacidades:

Características clave del Modal Nuevo Job:

Panel Desde: Elige tu fuente (tap o dataset) con información de entorno y driver
Panel Hasta: Enruta datos a sinks, taps, o crea nuevos datasets
Panel Regla: Aplica reglas opcionales de transformación o anonimización
Panel Opciones de carga: Ajusta tamaños de lote, modos de escritura y configuraciones de rendimiento
Panel Programación: Elige entre ejecución inmediata, programación única, o pipelines recurrentes

Cómo usar:

Haz clic en el botón Nuevo job (+) en la barra superior derecha
Sigue los paneles paso a paso para configurar tu flujo de datos
Elige ejecutar inmediatamente (Ejecutar ahora), programar para más tarde (Ejecutar después), o guardar como pipeline reutilizable
Revisa los resúmenes de paneles colapsados para asegurarte de que todos los campos requeridos estén configurados

Para información detallada sobre todas las opciones disponibles y configuraciones, consulta la documentación completa del Modal Nuevo Job.

Gestionando jobs existentes

Haz clic en cualquier nombre de job para ver sus detalles y registros
Usa el menú de Acciones (⋮) para realizar acciones apropiadas al contexto como:

Cancelar jobs en cola o en ejecución

A veces puedes necesitar detener un job que está ejecutándose actualmente o esperando en la cola. Esto es útil cuando:

Has iniciado un job por error
Te das cuenta de que necesitas hacer cambios en la configuración antes de proceder
El job está tardando más de lo esperado y bloquea otras operaciones
Has identificado un problema que hace innecesario el job

Importante: Cancelar un job puede dejarlo en un estado no deseado, así que usa esta acción con cuidado. Cualquier procesamiento de datos que ya se haya completado permanecerá, pero las operaciones parciales pueden necesitar limpieza manual.

Reiniciar jobs fallidas

Cuando una job falla, puedes reiniciarla desde el punto de fallo en lugar de comenzar completamente de nuevo. Esta acción:

Omite las entidades que ya se procesaron exitosamente
Reintenta solo las entradas que fallaron o que aún no habían comenzado
Continúa procesando desde donde se detuvo

Esto es particularmente útil para jobs que procesan grandes volúmenes de datos donde la mayoría de las entidades fueron exitosas, y solo necesitas reintentar las fallidas.

Repetir jobs completadas

Esta acción inicia una job completamente desde el principio, reutilizando todas las configuraciones originales de la job. ¿Por qué querrías hacer esto?

Repetir la misma operación: Ejecutar exactamente el mismo análisis, descubrimiento o procesamiento de datos nuevamente con los mismos parámetros
Actualizar datos: Obtener resultados actualizados basados en el estado actual de tus fuentes de datos
Probar consistencia: Verificar que la job produce los mismos resultados cuando se ejecuta múltiples veces
Aplicar a nuevos datos: Si tu fuente de datos ha sido actualizada, repetir la job para procesar la nueva información

Esta es una forma eficiente de repetir operaciones sin tener que reconfigurar todas las opciones.

Eliminar historial de jobs

Eliminar jobs completadas de tu lista de historial. Esta acción:

Limpia tu lista de jobs para mejor organización
Remueve jobs antiguas que ya no son relevantes
Ayuda a mantener una vista enfocada en operaciones recientes y activas

Eliminar el historial de jobs solo remueve el registro de esta lista - no afecta ningún dato que fue procesado o creado por la job misma.

Descargar configuración de reglas como YAML

Exportar la configuración de reglas utilizada en una job como archivo YAML. Esto es útil cuando:

Quieres compartir configuraciones de jobs con miembros del equipo
Necesitas enviar detalles de configuración al soporte de Gigantics para solución de problemas
Quieres replicar un problema o una configuración específica de job
Necesitas auditar o documentar las reglas aplicadas a tus datos
Estás migrando configuraciones entre ambientes

Jobs programados

Las jobs pueden programarse para ejecutarse automáticamente de varias maneras:

Método de programación	Qué hace
Ejecutar ahora	Ejecuta la job inmediatamente.
Programación única	Establece una fecha y hora específica para que la job se ejecute.
Pipeline manual	Guarda la configuración de la job como una plantilla de pipeline reutilizable.
Pipeline recurrente	Crea una job que se repite automáticamente (diaria, semanal, etc.).

Los jobs programados aparecen en la pestaña Jobs programados hasta que se ejecutan, facilitando ver qué está por venir.

Origen de los jobs

Las jobs provienen de varias acciones en la plataforma:

Discover — Escaneando tus fuentes de datos en busca de información sensible
Reglas — Operaciones de anonimización o transformación de datos
Conjuntos de datos — Operaciones de exportación, copia o fusión de datos
Destinos — Cargando datos procesados a destinos
Pipelines — Secuencias automatizadas de jobs

Cada vez que configuras una de estas operaciones, si está programada para ejecutarse en el futuro, aparecerá en tu pestaña de Jobs programados.

Tabla de Contenidos