¡Bienvenidos de nuevo a nuestra serie "Construye y despliega"! En una publicación anterior, creamos y desplegamos dos pipelines e integrarlos en un workflow en Apache Hop utilizando el Hop GUI. Ahora, es momento de llevar las cosas al siguiente nivel ejecutando esos archivos desde la línea de comandos usando Hop Run.
En esta publicación, explicaremos cómo ejecutar pipelines y workflows del proyecto de ejemplo "my-hop-project" utilizando Hop Run, en lugar de depender del Hop GUI. Este método es particularmente útil para automatizar procesos, integrarse con pipelines CI/CD o ejecutar trabajos en entornos sin interfaz gráfica.
Hop Run es una herramienta de línea de comandos que permite ejecutar workflows y pipelines sin necesidad de iniciar el Hop GUI. Esto ofrece varias ventajas:
Antes de comenzar, asegúrate de contar con lo siguiente:
A continuación, revisaremos los pasos para ejecutar nuestros pipelines y workflows utilizando Hop Run.
Dependiendo de tu sistema operativo, el script de Hop Run está disponible en dos formatos diferentes:
Estos scripts se encuentran en el directorio raíz de la instalación de Apache Hop. Navega a este directorio antes de proceder con los siguientes comandos.
Para acceder al directorio raíz de Apache Hop, usa los siguientes comandos según tu sistema operativo:
Windows
MacOS/Linux
Reemplaza "ruta/a/tu/directorio-de-apache-hop" con la ruta real donde Apache Hop está instalado en tu sistema.
Empecemos ejecutando un pipeline creado en "my-hop-project", encargado de extraer y transformar los datos.
Ejecuta el siguiente comando desde la línea de comandos:
Windows
MacOS/Linux
Explicación:
-j my-hop-project
: Especifica el proyecto en el que existe el pipeline.-f <ruta>
: Apunta al archivo .hpl del pipeline.-r local
: Indica a Hop Run que use la configuración de ejecución local.Después de ejecutar el comando, Hop Run iniciará el pipeline, extraerá y transformará los datos, y mostrará los resultados, al igual que en el Hop GUI.
Podemos ejecutar los pipelines en un workflow. Por ejemplo, ejecutaremos el workflow creado en "Build & deploy 2: Develop your first pipelines in a workflow".
Windows
MacOS/Linux
Explicación:
-j my-hop-project
: Especifica el proyecto en el que existe el workflow.-f <ruta>
: Especifica la ruta al archivo del workflow .hwf.-r local
: Indica a Hop Run que use la configuración de ejecución local.El workflow ejecutará los dos pipelines en secuencia, asegurando que los datos se extraigan y transformen antes de cargarse.
Cuando ejecutes pipelines y workflows vía Hop Run, es importante manejar los errores adecuadamente. Hop Run proporciona códigos de salida para indicar éxito o falla:
Puedes usar estos códigos de salida para desencadenar notificaciones o respuestas automáticas en scripts o pipelines de despliegue.
Es importante especificar el nivel de registro utilizando la opción -l
o --level
. Puedes elegir entre varios niveles, como NOTHING, ERROR, MINIMAL, BASIC, DETAILED, DEBUG o ROWLEVEL, dependiendo del nivel de detalle de registro que necesites.
Por ejemplo, configurar en ERROR solo registrará los errores, mientras que DEBUG o ROWLEVEL proporcionan información más detallada sobre la ejecución, útil para análisis en profundidad.
Para automatizar completamente el proceso, puedes crear un script de shell que ejecute el workflow, monitoree el código de salida y envíe una notificación o registre el resultado. Aquí tienes un ejemplo para Linux/macOS:
Este script ejecuta el workflow y verifica el código de salida para determinar si se completó con éxito. Puedes ampliarlo con registros, notificaciones por correo electrónico o integraciones con pipelines CI/CD.
Ejecutar tus pipelines y workflows de Apache Hop vía Hop Run abre un mundo de posibilidades para la automatización y flexibilidad. Ya sea que te integres con un pipeline CI/CD o ejecutes procesos de datos en un servidor remoto, Hop Run simplifica la ejecución de workflows complejos sin depender del Hop GUI.