Jobs
La página de Jobs es tu centro operativo para gestionar todos los jobs de procesamiento de datos en tu modelo. Aquí puedes ver todo lo que se ha ejecutado, se está ejecutando o está programado para ejecutarse en el futuro. Es como un panel de control para todas tus operaciones de datos.
Vista general de la página
| Área de la interfaz | Qué muestra | Cómo interactuar |
|---|---|---|
Pestañas (Jobs recientes, Jobs programados) | Filtran tu vista entre jobs recientes y jobs programados futuros. | Haz clic en las pestañas para cambiar entre vistas. |
Barra de herramientas (Nuevo job, Ordenar) | Acciones principales para crear nuevos jobs o ordenar los existentes. | Usa el botón Nuevo job para crear una nueva tarea de procesamiento de datos. |
| Tabla de jobs | Tabla que muestra todos tus jobs de procesamiento de datos con su estado y detalles. | Haz clic en cualquier encabezado de columna para filtrar resultados. Haz clic en el nombre de un job para ver detalles. |
Columnas de la tabla de jobs
| Columna | Valor de ejemplo | Qué muestra |
|---|---|---|
Estado | Indicador en ejecución o marca de completado | Estado actual del job. |
Nombre | tap-a-s3 (2024-05-06 01:00) | Nombre descriptivo del job. Haz clic para ver registros detallados. |
Modelo (solo vista del proyecto) | Datos de clientes | A qué modelo de datos pertenece este job. |
Tipo | volcado, carga, bombeo, descubrir, escanear | Qué tipo de operación realiza el job. |
Regla | Anonimizar PII | Si aplica, qué regla se aplicó a tus datos. |
Creado por | juan.gomez | Quién inició el job. |
Información | Iniciado: 12:21 • Duración: 00:03:18 o Próximo: 07/24/2024 22:00 | Cuándo se inició/terminó el job o cuándo está programado para ejecutarse. |
Acciones | ⋮ menú con acciones disponibles | Acciones contextuales basadas en el estado actual del job. |
Estado de los jobs
| Estado | Qué significa | Qué puedes hacer |
|---|---|---|
en cola | Job aceptado y esperando para iniciar. | Cancelar si es necesario, de lo contrario esperar a que comience. |
en ejecución | Job actualmente procesando datos. | Monitorear el progreso a través de la página de detalles; cancelar si es necesario. |
completado | Job terminado exitosamente. | Ver resultados o repetir si es necesario. |
fallido | Job encontró un error. | Reiniciar para reintentar las partes fallidas o repetir completamente. |
programado | Job configurado para ejecutarse en un tiempo futuro. | Editar o cancelar el tiempo programado. |
Trabajando con jobs
Iniciar nuevos jobs
El botón Nuevo job (+) en la barra de herramientas abre el Modal Nuevo Job, que es la interfaz principal para crear nuevas tareas de procesamiento de datos. El modal proporciona una interfaz de configuración completa con las siguientes capacidades:
Características clave del Modal Nuevo Job:
- Panel Desde: Elige tu fuente (tap o dataset) con información de entorno y driver
- Panel Hasta: Enruta datos a sinks, taps, o crea nuevos datasets
- Panel Regla: Aplica reglas opcionales de transformación o anonimización
- Panel Opciones de carga: Ajusta tamaños de lote, modos de escritura y configuraciones de rendimiento
- Panel Programación: Elige entre ejecución inmediata, programación única, o pipelines recurrentes
Cómo usar:
- Haz clic en el botón Nuevo job (+) en la barra superior derecha
- Sigue los paneles paso a paso para configurar tu flujo de datos
- Elige ejecutar inmediatamente (Ejecutar ahora), programar para más tarde (Ejecutar después), o guardar como pipeline reutilizable
- Revisa los resúmenes de paneles colapsados para asegurarte de que todos los campos requeridos estén configurados
Para información detallada sobre todas las opciones disponibles y configuraciones, consulta la documentación completa del Modal Nuevo Job.
Gestionando jobs existentes
- Haz clic en cualquier nombre de job para ver sus detalles y registros
- Usa el menú de Acciones (⋮) para realizar acciones apropiadas al contexto como:
Cancelar jobs en cola o en ejecución
A veces puedes necesitar detener un job que está ejecutándose actualmente o esperando en la cola. Esto es útil cuando:
- Has iniciado un job por error
- Te das cuenta de que necesitas hacer cambios en la configuración antes de proceder
- El job está tardando más de lo esperado y bloquea otras operaciones
- Has identificado un problema que hace innecesario el job
Importante: Cancelar un job puede dejarlo en un estado no deseado, así que usa esta acción con cuidado. Cualquier procesamiento de datos que ya se haya completado permanecerá, pero las operaciones parciales pueden necesitar limpieza manual.
Reiniciar jobs fallidas
Cuando una job falla, puedes reiniciarla desde el punto de fallo en lugar de comenzar completamente de nuevo. Esta acción:
- Omite las entidades que ya se procesaron exitosamente
- Reintenta solo las entradas que fallaron o que aún no habían comenzado
- Continúa procesando desde donde se detuvo
Esto es particularmente útil para jobs que procesan grandes volúmenes de datos donde la mayoría de las entidades fueron exitosas, y solo necesitas reintentar las fallidas.
Repetir jobs completadas
Esta acción inicia una job completamente desde el principio, reutilizando todas las configuraciones originales de la job. ¿Por qué querrías hacer esto?
- Repetir la misma operación: Ejecutar exactamente el mismo análisis, descubrimiento o procesamiento de datos nuevamente con los mismos parámetros
- Actualizar datos: Obtener resultados actualizados basados en el estado actual de tus fuentes de datos
- Probar consistencia: Verificar que la job produce los mismos resultados cuando se ejecuta múltiples veces
- Aplicar a nuevos datos: Si tu fuente de datos ha sido actualizada, repetir la job para procesar la nueva información
Esta es una forma eficiente de repetir operaciones sin tener que reconfigurar todas las opciones.
Eliminar historial de jobs
Eliminar jobs completadas de tu lista de historial. Esta acción:
- Limpia tu lista de jobs para mejor organización
- Remueve jobs antiguas que ya no son relevantes
- Ayuda a mantener una vista enfocada en operaciones recientes y activas
Eliminar el historial de jobs solo remueve el registro de esta lista - no afecta ningún dato que fue procesado o creado por la job misma.
Descargar configuración de reglas como YAML
Exportar la configuración de reglas utilizada en una job como archivo YAML. Esto es útil cuando:
- Quieres compartir configuraciones de jobs con miembros del equipo
- Necesitas enviar detalles de configuración al soporte de Gigantics para solución de problemas
- Quieres replicar un problema o una configuración específica de job
- Necesitas auditar o documentar las reglas aplicadas a tus datos
- Estás migrando configuraciones entre ambientes
Jobs programados
Las jobs pueden programarse para ejecutarse automáticamente de varias maneras:
| Método de programación | Qué hace |
|---|---|
| Ejecutar ahora | Ejecuta la job inmediatamente. |
| Programación única | Establece una fecha y hora específica para que la job se ejecute. |
| Pipeline manual | Guarda la configuración de la job como una plantilla de pipeline reutilizable. |
| Pipeline recurrente | Crea una job que se repite automáticamente (diaria, semanal, etc.). |
Los jobs programados aparecen en la pestaña Jobs programados hasta que se ejecutan, facilitando ver qué está por venir.
Origen de los jobs
Las jobs provienen de varias acciones en la plataforma:
- Discover — Escaneando tus fuentes de datos en busca de información sensible
- Reglas — Operaciones de anonimización o transformación de datos
- Conjuntos de datos — Operaciones de exportación, copia o fusión de datos
- Destinos — Cargando datos procesados a destinos
- Pipelines — Secuencias automatizadas de jobs
Cada vez que configuras una de estas operaciones, si está programada para ejecutarse en el futuro, aparecerá en tu pestaña de Jobs programados.