Modelo

Jobs

La página de Jobs es tu centro operativo para gestionar todos los jobs de procesamiento de datos en tu modelo. Aquí puedes ver todo lo que se ha ejecutado, se está ejecutando o está programado para ejecutarse en el futuro. Es como un panel de control para todas tus operaciones de datos.

Vista general de la página

┌──────────────────────────────────────────────────────────────────────┐
│ Página de Jobs                                                       │
│ ┌──────────────────┬─────────────────┐   ┌─────────────────────────┐ │
│ │ Jobs recientes   │ Programados     │   │ Nuevo job ⊕ • Ordenar ▾ │ │
│ └──────────────────┴─────────────────┘   └─────────────────────────┘ │
│ ┌──────────────────────────────────────────────────────────────────┐ │
│ │ Estado | Nombre | Tipo | Regla | ...                             │ │
│ │   ●    | volcado tap→sink                                        │ │
│ │   ○    | descubrimiento nocturno                                 │ │
│ └──────────────────────────────────────────────────────────────────┘ │
└──────────────────────────────────────────────────────────────────────┘
Área de la interfazQué muestraCómo interactuar
Pestañas (Jobs recientes, Jobs programados)Filtran tu vista entre jobs recientes y jobs programados futuros.Haz clic en las pestañas para cambiar entre vistas.
Barra de herramientas (Nuevo job, Ordenar)Acciones principales para crear nuevos jobs o ordenar los existentes.Usa el botón Nuevo job para crear una nueva tarea de procesamiento de datos.
Tabla de jobsTabla que muestra todos tus jobs de procesamiento de datos con su estado y detalles.Haz clic en cualquier encabezado de columna para filtrar resultados. Haz clic en el nombre de un job para ver detalles.

Columnas de la tabla de jobs

ColumnaValor de ejemploQué muestra
EstadoIndicador en ejecución o marca de completadoEstado actual del job.
Nombretap-a-s3 (2024-05-06 01:00)Nombre descriptivo del job. Haz clic para ver registros detallados.
Modelo (solo vista del proyecto)Datos de clientesA qué modelo de datos pertenece este job.
Tipovolcado, carga, bombeo, descubrir, escanearQué tipo de operación realiza el job.
ReglaAnonimizar PIISi aplica, qué regla se aplicó a tus datos.
Creado porjuan.gomezQuién inició el job.
InformaciónIniciado: 12:21 • Duración: 00:03:18 o Próximo: 07/24/2024 22:00Cuándo se inició/terminó el job o cuándo está programado para ejecutarse.
Acciones menú con acciones disponiblesAcciones contextuales basadas en el estado actual del job.

Estado de los jobs

EstadoQué significaQué puedes hacer
en colaJob aceptado y esperando para iniciar.Cancelar si es necesario, de lo contrario esperar a que comience.
en ejecuciónJob actualmente procesando datos.Monitorear el progreso a través de la página de detalles; cancelar si es necesario.
completadoJob terminado exitosamente.Ver resultados o repetir si es necesario.
fallidoJob encontró un error.Reiniciar para reintentar las partes fallidas o repetir completamente.
programadoJob configurado para ejecutarse en un tiempo futuro.Editar o cancelar el tiempo programado.

Trabajando con jobs

Iniciar nuevos jobs

El botón Nuevo job (+) en la barra de herramientas abre el Modal Nuevo Job, que es la interfaz principal para crear nuevas tareas de procesamiento de datos. El modal proporciona una interfaz de configuración completa con las siguientes capacidades:

Características clave del Modal Nuevo Job:

  • Panel Desde: Elige tu fuente (tap o dataset) con información de entorno y driver
  • Panel Hasta: Enruta datos a sinks, taps, o crea nuevos datasets
  • Panel Regla: Aplica reglas opcionales de transformación o anonimización
  • Panel Opciones de carga: Ajusta tamaños de lote, modos de escritura y configuraciones de rendimiento
  • Panel Programación: Elige entre ejecución inmediata, programación única, o pipelines recurrentes

Cómo usar:

  1. Haz clic en el botón Nuevo job (+) en la barra superior derecha
  2. Sigue los paneles paso a paso para configurar tu flujo de datos
  3. Elige ejecutar inmediatamente (Ejecutar ahora), programar para más tarde (Ejecutar después), o guardar como pipeline reutilizable
  4. Revisa los resúmenes de paneles colapsados para asegurarte de que todos los campos requeridos estén configurados

Para información detallada sobre todas las opciones disponibles y configuraciones, consulta la documentación completa del Modal Nuevo Job.

Gestionando jobs existentes

  • Haz clic en cualquier nombre de job para ver sus detalles y registros
  • Usa el menú de Acciones (⋮) para realizar acciones apropiadas al contexto como:

Cancelar jobs en cola o en ejecución

A veces puedes necesitar detener un job que está ejecutándose actualmente o esperando en la cola. Esto es útil cuando:

  • Has iniciado un job por error
  • Te das cuenta de que necesitas hacer cambios en la configuración antes de proceder
  • El job está tardando más de lo esperado y bloquea otras operaciones
  • Has identificado un problema que hace innecesario el job

Importante: Cancelar un job puede dejarlo en un estado no deseado, así que usa esta acción con cuidado. Cualquier procesamiento de datos que ya se haya completado permanecerá, pero las operaciones parciales pueden necesitar limpieza manual.

Reiniciar jobs fallidas

Cuando una job falla, puedes reiniciarla desde el punto de fallo en lugar de comenzar completamente de nuevo. Esta acción:

  • Omite las entidades que ya se procesaron exitosamente
  • Reintenta solo las entradas que fallaron o que aún no habían comenzado
  • Continúa procesando desde donde se detuvo

Esto es particularmente útil para jobs que procesan grandes volúmenes de datos donde la mayoría de las entidades fueron exitosas, y solo necesitas reintentar las fallidas.

Repetir jobs completadas

Esta acción inicia una job completamente desde el principio, reutilizando todas las configuraciones originales de la job. ¿Por qué querrías hacer esto?

  • Repetir la misma operación: Ejecutar exactamente el mismo análisis, descubrimiento o procesamiento de datos nuevamente con los mismos parámetros
  • Actualizar datos: Obtener resultados actualizados basados en el estado actual de tus fuentes de datos
  • Probar consistencia: Verificar que la job produce los mismos resultados cuando se ejecuta múltiples veces
  • Aplicar a nuevos datos: Si tu fuente de datos ha sido actualizada, repetir la job para procesar la nueva información

Esta es una forma eficiente de repetir operaciones sin tener que reconfigurar todas las opciones.

Eliminar historial de jobs

Eliminar jobs completadas de tu lista de historial. Esta acción:

  • Limpia tu lista de jobs para mejor organización
  • Remueve jobs antiguas que ya no son relevantes
  • Ayuda a mantener una vista enfocada en operaciones recientes y activas

Eliminar el historial de jobs solo remueve el registro de esta lista - no afecta ningún dato que fue procesado o creado por la job misma.

Descargar configuración de reglas como YAML

Exportar la configuración de reglas utilizada en una job como archivo YAML. Esto es útil cuando:

  • Quieres compartir configuraciones de jobs con miembros del equipo
  • Necesitas enviar detalles de configuración al soporte de Gigantics para solución de problemas
  • Quieres replicar un problema o una configuración específica de job
  • Necesitas auditar o documentar las reglas aplicadas a tus datos
  • Estás migrando configuraciones entre ambientes

Jobs programados

Las jobs pueden programarse para ejecutarse automáticamente de varias maneras:

Método de programaciónQué hace
Ejecutar ahoraEjecuta la job inmediatamente.
Programación únicaEstablece una fecha y hora específica para que la job se ejecute.
Pipeline manualGuarda la configuración de la job como una plantilla de pipeline reutilizable.
Pipeline recurrenteCrea una job que se repite automáticamente (diaria, semanal, etc.).

Los jobs programados aparecen en la pestaña Jobs programados hasta que se ejecutan, facilitando ver qué está por venir.

Origen de los jobs

Las jobs provienen de varias acciones en la plataforma:

  • Discover — Escaneando tus fuentes de datos en busca de información sensible
  • Reglas — Operaciones de anonimización o transformación de datos
  • Conjuntos de datos — Operaciones de exportación, copia o fusión de datos
  • Destinos — Cargando datos procesados a destinos
  • Pipelines — Secuencias automatizadas de jobs

Cada vez que configuras una de estas operaciones, si está programada para ejecutarse en el futuro, aparecerá en tu pestaña de Jobs programados.