Harness Engineering: lo que llevas un año haciendo sin saber su nombre

Hashimoto, OpenAI, Anthropic, Fowler y Karpathy convergen en una fórmula: Agente = Modelo + Harness. Un repo con 28 stars enseña a hacerlo, y otro con 128.000 ya lo trae empaquetado. Marco lo descubre a las dos y cuarto de la mañana.
Harness Engineering: lo que llevas un año haciendo sin saber su nombre

Hola,

Dos semanas sin newsletter. Toca catch-up triple en el G33K TEAM y un episodio temático para compensar.

El 5 de febrero, Mitchell Hashimoto —el cofundador de HashiCorp, el que creó Terraform— publicó en su blog una idea simple: cada vez que un agente comete un error, no lo corrijas, ingenia el entorno para que ese error sea estructuralmente imposible. Lo llamó engineering the harness. Seis días después, OpenAI publicaba el caso real: cinco meses, un millón de líneas de código en producción, cero escritas a mano. En abril, Birgitta Böckeler de Thoughtworks lo ordenaba en taxonomía formal en martinfowler.com. Karpathy enterraba el vibe coding en Sequoia AI Ascent y proponía agentic engineering como sucesor.

La fórmula que la industria adoptó: Agente = Modelo + Harness.

Y lo incómodo: si llevas un año escribiendo CLAUDE.md, acotando tools, validando con shell scripts y separando permisos por rol, ya estabas haciendo Harness Engineering. Solo no tenía nombre. Hoy te traigo el episodio entero: la historia, las cinco piezas que componen un harness de verdad, el repositorio con 28 stars que está enseñando a hacerlo bien, y al final el agente con 128.000 estrellas que ya lo trae todo empaquetado. Marco lo descubre a las dos y cuarto de la mañana, después de tres tazas de café, y se da cuenta de que llevaba un año reinventando algo que alguien ya había hecho por él.

De hecho, el tema te lo van a contar tres veces en este número: Tete y Oriol en el directo de la semana pasada llegaron por su cuenta a la misma tesis, y el directo de hace dos semanas tiene a Oriol confesando autocrítica que estaba muy equivocado sobre Docker Compose vs Kubernetes ahora que el LLM domina ambos. Está todo en el bloque G33K TEAM, que esta semana viene triple.

Vamos al lío 👇

📅 G33K TEAM de la Semana

Han sido dos semanas. Hubo viaje desde Italia a Cantabria con mi coche, hubo cliente, hubo desconexión. Toca catch-up triple: el episodio de esta semana al detalle, y los dos anteriores en formato condensado para los que se perdieron.

🎙️ Episodio 43 — Vulnerabilidades, arqueología digital y RAM que no aparece

Episodio precumpleaños de Oriol. Sin Néstor, con Oriol convaleciente "de cuerpo presente nada más", y yo desde la casa con piscina. Salió de todo: CVEs, arqueología pre-web, mi router de viaje, mi servidor de geocoding y un buen par de dardos al cloud abusivo y a las apps Electron de los chats de IA.

Las dos vulnerabilidades de la semana: CoPyFAIL en el módulo de paginación de Linux —afecta a todo Linux desde 2017, escalada a sudo con diez líneas de código si tienes acceso a la máquina— y bypass de login en cPanel sin credenciales. El vector real preocupante son las máquinas de CI con pipelines automáticas en repos públicos. Cierra una vuln de GitHub vía bug bounty para acceder a repos ajenos. Las tres descubiertas con asistencia de IA. Patrón emergente.

GitHub ha perdido todos los nueves: Oriol abrió melón. GitHub quitó hace tres años los números agregados de su status page. La comunidad mantiene la métrica real: 84% de uptime en 90 días. Cruzó el dato con el despido del 20% de plantilla en Cloudflare y planteó la pregunta del episodio: ¿estamos aceptando como sector lanzar más cosas mal hechas porque la IA nos deja producir más rápido y los números cuadran igual?

Arqueología digital: Oriol se desató con Gopher, NNTP, FTP por mail —mandar `get ls-lR` a Stanford y recibir el listado por email en cachos de varios megas— Mosaic, NCSA, NCFTP. Plato fuerte: él en bachillerato haciendo packet radio con una HP 48G + walkie-talkie + bacon TNC para descargarse apuntes en la selectividad por X.25 amateur. Llegó a conectar al sur de Italia sin repetidor.

Mi router de viaje: presenté el GL.iNet con OpenWRT. Caso real reciente: barco con bono de 12 horas y viaje de 22, bypass del portal cautivo clonando MAC con ARP scan, WireGuard local y mi mujer y yo navegando por mi portátil compartido. Oriol añadió el truco del hotel: quitar el cable de ethernet de la TV y enchufarlo al GL.iNet.

Mi servidor de geocoding propio: presenté el autocompletador de direcciones que monté para no pagar la API de Google Places. Photon reescrito en Go, VPS ARM de Hetzner de tres euros al mes, España e Italia, 25 GB de base de datos. Oriol cerró con el caso IKEA Australia: meter validación de direcciones en la tarjeta IKEA Family les disparó el volumen de negocio en todo el país.

Costes en cloud y arquitecturas pesadas: Oriol contó un caso real con 200.000 €/mes en Kubernetes que migra a AWS sabiendo que sale más caro "porque ya asumimos un error de arquitectura grave". Hablamos de alternativas a Cloudflare Tunnels: Pangolin, Netbird —acaban de levantar serie A de 10M$— y Tailscale. La conclusión de Oriol: el cloud no vale dos duros, vale mucho dinero, y mucha gente joven todavía no lo ha internalizado.

El dardo de Tete a las apps Electron: Claude Desktop y ChatGPT Desktop te levantan máquinas virtuales de 9 a 10 GB cada vez que las usas. RAM consumida sin control. Mencioné `npkill` para limpiar `node_modules` huérfanos. Queja perenne de Oriol: "tengo 128 GB de RAM y se caben". Comparación con Chrome ganando a Internet Explorer hace años por ligero y rápido — y siendo hoy el problema.

Y el detalle que enlaza con el resto del newsletter: cuando hablamos de mi capa de orquestación de agentes les dije que estoy usando MQTT por debajo. Sí, MQTT. El mismo protocolo que vimos hace meses corriendo en una Spectrum y una Commodore 64 en aquella charla brutal. Lo viejo no muere, se reencarna como Harness Engineering.

🔗 Links del episodio:


📺 Y si te perdiste estas dos semanas...

🎙️ Episodio 44 — La cruzada de Néstor contra Anthropic y el cambio de paradigma a Kubernetes

Episodio sin mí — me pillaron en carretera Roma-Barcelona-Cantabria. Tema central: Néstor abriendo melón con Anthropic por el cambio de pricing y los weekly limits que penalizan a quien no usa el harness oficial de Claude Code. Néstor reportó 61 instancias de Claude simultáneas a tope sin agotar la suscripción de 200€, pero el problema no es el precio — es la inestabilidad de la política: hace dos meses decían lo contrario, y los tweets están guardados.

Oriol soltó el cambio de paradigma del año: lleva meses migrando todo a Kubernetes con OVH Managed Kubernetes —cluster gratis + worker de 15€/mes—. Su conclusión, autocrítica incluida: "yo pensaba que Docker Compose era más fácil. Estaba muy equivocado. Lo que pasa es que el modelo sabe hacer Kubernetes muy bien." Cuando el LLM domina una herramienta, lo "fácil" se redefine.

Y dos joyas técnicas: Mirage (virtual file system unificado para agentes — monta Notion, Google Drive, GitHub, SSHFS como árbol de directorios para que el agente acceda con ls, grep y find baratos) y Pi (otro harness extremadamente minimalista y open source, opuesto a Claude Code en filosofía: no trae nada de serie, te lo picas todo vía plugins). Oriol también enseñó cómo usa Engram como skill cross-proyecto e infraestructura con Kubernetes + cert-manager + npm gestionando certificados privados desde una UI.

🔗 Links del episodio 44:

🎙️ Episodio 45 — Pentesting, Unix System V con 14 años y libertad digital catalana

Estuvimos los tres admins —Oriol, Tete y yo— en un episodio sin Néstor y sin tema fijo. Salió un buen pack improvisado en arqueología y herramientas.

Empezaron con la ola de vulnerabilidades de la semana —Nginx 1.30 con fallo en módulo de redirecciones, Polkit en Ubuntu, InfluxDB Time Series, y la familia Frag tras CoPyFAIL—. Tete reflexionó sobre por qué le aburre el pentesting actual: la IA está automatizando lo que antes requería pensamiento lateral.

Tete y Oriol llegaron a la misma tesis que cierra este episodio del newsletter, pero por su cuenta: el harness no es nada nuevo, es prompt engineering con mejor empaquetado. Tete lo formuló así: "los arneses no son nada más que cómo estás alimentando el contexto. Llevamos hablando de esto desde el segundo cero. Simplemente que antes el system prompt era fijo y todo entraba por user prompt, y ahora entre una cosa y otra hemos inventado una fiesta descomunal." Y Tete cerró con una bomba: "para tema de harnesses estoy usando Hermes con MiniMax y funciona muchísimo mejor que OpenCloud."

Oriol se desató con arqueología digital II: Unix System V que estudió y certificó con 14 años, los 25-37 disquetes de 5¼ que costaron a su madre medio año de ahorro, Minix, Linus Torvalds reescribiendo el kernel y haciéndolo open source, Steve Jobs viendo el ratón en Xerox PARC y prediciendo todo. Enseñé yo ISARD VDI, un proyecto open source catalán para montar VDIs colaborativos en VPS de 15€/mes con Docker + KVM — alternativa real a Citrix para empresas pequeñas o profesores con alumnos, lo uso para virtualizar incluso Android. Oriol cerró enseñando Donut Browser —control plane de navegadores aislados con MCP por cada profile, perfecto para automatización con Claude haciéndose pasar por ti en distintos servicios.

🔗 Links del episodio 45:


Horizonte Artificial

Aquí compartimos las novedades más relevantes del mundo del NoCODE, la inteligencia artificial generativa y open source para que estés siempre al día y aprendas a usar estas herramientas como un profesional.


🌟 TopGit - Resumen Semanal (2026-05-23)

📚 Repositorios Destacados de la Semana

Los siguientes repositorios han sido seleccionados por su relevancia, calidad y métricas de GitHub:

🔧 🤖 Automatización de WhatsApp

@open-wa/wa-automate es una herramienta en Node.js que te permite transformar la automatización de WhatsApp Web en una herramienta que puedes usar para construir APIs locales, backends de bots, fuentes de webhooks o servidores de agentes de IA. Con este toolkit, puedes establecer inbox de atención al cliente, notificaciones, bots reactivos, y más mediante una integración simple y eficiente.

📊 Estadísticas de GitHub:
- ⭐ 3,580 estrellas
- 🔄 692 forks
- 👀 102 observadores
- 📝 171 issues abiertos
- 🔤 Principal lenguaje: TypeScript


🔧 🎙️ Aplicación Web de Doblaje e Idiomas

Voice-Pro es una aplicación web de última generación que permite la creación de contenido multimedia. Integra la descarga de videos de YouTube, separación de voces, reconocimiento de voz, traducción y texto a voz en una sola herramienta poderosa, diseñada para creadores, investigadores y profesionales multilingües. Ofrece un reconocimiento de voz excepcional, clonación de voz en cero disparos y traducción instantánea para más de 100 idiomas, facilitando la creación de contenido global.

📊 Estadísticas de GitHub:
- ⭐ 9,923 estrellas
- 🔄 1,378 forks
- 👀 62 observadores
- 📝 41 issues abiertos
- 🔤 Principal lenguaje: Python


🔧 🧠 Código semántico con CodeGraph

CodeGraph es una herramienta que crea un grafo de conocimiento preindexado para el código, mejorando la inteligencia semántica en herramientas como Claude Code, Codex, Cursor y Hermes Agent. Esto permite realizar consultas sobre relaciones de símbolos y estructuras de código de manera instantánea, sin necesidad de escanear archivos constantemente.

📊 Estadísticas de GitHub:
- ⭐ 19,259 estrellas
- 🔄 1,063 forks
- 👀 61 observadores
- 📝 132 issues abiertos
- 🔤 Principal lenguaje: TypeScript


🔧 📄 Docusaurus

Docusaurus es una herramienta de código abierto para crear, desplegar y mantener sitios web de documentación de forma sencilla. Su enfoque se centra en la facilidad de uso, lo que permite a los desarrolladores concentrarse en sus proyectos sin preocuparse por el proceso de construcción del sitio web.

📊 Estadísticas de GitHub:
- ⭐ 64,989 estrellas
- 🔄 9,894 forks
- 👀 433 observadores
- 📝 395 issues abiertos
- 🔤 Principal lenguaje: TypeScript


🔧 🚀 Emulador Local de Azure

Floci es un emulador local de Azure gratuito y de código abierto que permite simular los servicios de Azure como Storage, Functions, App Configuration, Key Vault y Event Hubs. Es ideal para desarrolladores que desean probar sus aplicaciones sin necesidad de una cuenta de Azure.

📊 Estadísticas de GitHub:
- ⭐ 147 estrellas
- 🔄 15 forks
- 👀 1 observadores
- 📝 6 issues abiertos
- 🔤 Principal lenguaje: Java


🔧 📦 Repomix: Empaquetando tu Código

Repomix es una potente herramienta que empaqueta todo tu repositorio en un solo archivo compatible con IA. Es ideal para alimentar tu código a modelos de lenguaje como Claude, ChatGPT y otros.


📊 Análisis de Distribución por Categorías

La siguiente gráfica muestra la distribución de proyectos por categoría en TopGit:

Distribución de Categorías

📈 Estadísticas Semanales

🏆 Top 3 Categorías

Top 3 Categorías

📊 Distribución Detallada

🌐 Web Development    ██████████    50%  (3 repos)
🔧 Dev                ██████        33%  (2 repos)
🤖 IA & Machine Learning ███           17%  (1 repos)

🚀 Tendencias Destacadas

📈 Métricas Clave

  • Repositorios Totales: 6
  • Promedio Diario: 0.9 repos/día
  • Categorías Activas: 3

🎯 Categorías Dominantes

  1. Web Development
    - 3 repositorios
    - 50.0% del total

  2. Dev
    - 2 repositorios
    - 33.3% del total

  3. IA & Machine Learning
    - 1 repositorios
    - 16.7% del total

💡 Análisis de Tendencias

Esta semana, hemos observado varias tendencias emocionantes en GitHub, algunas de las cuales son nuevas y otras continúan una evolución constante en el campo de la tecnología.

La primera que destaca es la automatización de WhatsApp. La librería open-wa/wa-automate se ha generado como tendencia debido a su utilidad para integrarse con WhatsApp Web en varias funcionalidades bastante útiles. Esto muestra una mayor tendencia hacia la automatización de tareas rutinarias y la adaptación de las redes sociales y las aplicaciones de mensajería para satisfacer necesidades más complejas.

La próxima tendencia es una aplicación de traducción y doblaje, Voice-Pro. Esta herramienta puede descargar videos de YouTube, separar voces, realizar reconocimiento de voz, traducción e incluso texto a voz. Esto ilustra cómo la inteligencia artificial se está utilizando para superar las barreras del idioma y mejorar la comunicación.

CodeGraph, un proyecto que mejora la búsqueda y el reconocimiento semántico en las aplicaciones de codificación, muestra cómo la IA y el aprendizaje automático son cada vez más prominentes en el desarrollo y análisis de software.

Docusaurus sigue siendo una herramienta dominante para la creación y gestión de documentación, lo que refleja la creciente necesidad de documentación clara y bien organizada en el desarrollo de software.

El emulador de Azure, Floci, indica un aumento en la necesidad de mejorar la eficiencia del desarrollo y la prueba de aplicaciones en la nube, proporcionando un entorno local para simular Azure.

Finalmente, Repomix se destaca como una herramienta que compacta todo tu repositorio en un solo archivo compatible con IA. Esto subraya la expansión de la inteligencia artificial en gestión de código y en el sector tecnológico en general.

En resumen, la inteligencia artificial, la automatización, la mejora de la documentación, el desarrollo eficiente de aplicaciones basadas en la nube y la optimización de la gestión de código son tendencias notables en GitHub esta semana.

🌵
Descubre, Participa, Comunícate
- 🐥 Únete a nuestra vibrante comunidad en Twitter y mantente en la vanguardia.
- 💌 ¿Tienes algo que compartir? No dudes en contactarnos.

El día que Marco descubrió que llevaba un año haciendo Harness Engineering

Once y media de la noche, un cliente que cierra el ticket con un "perfecto, gracias", y un repositorio de GitHub con 28 stars que le pone los pelos de punta.


Marco abre el portátil a las once y media de la noche. El cliente acaba de cerrar el ticket con un perfecto, gracias después de tres horas peleando con un bug que el agente había introducido "casualmente" mientras refactorizaba un módulo que nadie le había pedido tocar.

Tres horas. De esas en las que ya no estás programando, estás deshaciendo lo que tu agente programó.

Abre Twitter por reflejo, no por interés. Lo primero que ve es un hilo: "Anthropic ran a controlled experiment. Same model, same prompt. Without a harness: 9 dólares, 20 minutos, no funciona. With a full harness: 200 dólares, 6 horas, juego que funciona. The model didn't change. The harness did."

Marco se queda mirando la frase.

The harness did.

Pincha el link. Termina en un repositorio de GitHub con 28 stars. walkinglabs/learn-harness-engineering. Lee el README entero sin parpadear. Le suda la espalda.

Hay una línea que le hace cerrar el portátil un momento y volver a abrirlo:

"If the agent can't see it, it doesn't exist."

Es la regla con la que él lleva un año peleando sin saber formularla. Cuando metió las reglas de validación de DNI en un archivo en lugar del prompt. Cuando movió los secretos al Secret Manager. Cuando dejó de explicarle al agente "no toques los campos encriptados" y empezó a separar la tabla Cliente de la tabla Contrato con campos purgables.

Eso era harness. Solo que no tenía nombre.

Las cinco piezas

El repo lo divide en cinco subsistemas. Marco los lee con la sensación creciente de estar viendo el plano de un edificio que ya construyó sin plano.

Instructions   AGENTS.md, CLAUDE.md, feature_list, docs/
State          progress.md, feature_list, git log, handoff
Verification   tests + lint + type-check + smoke runs
Scope          una feature a la vez, definición de done
Lifecycle      init.sh al inicio, clean-state al final

Su CRM tiene cuatro de los cinco. El único que le falta de verdad es el lifecycle estructurado. El agente entra y sale de las sesiones como un becario sin manual, leyendo el git log con suerte y memoria con menos.

Marco abre una terminal. Se mete en el repo del CRM.

¡Únete a NoCode OpenSource!

Únete a nuestra comunidad NoCode OpenSource y accede a noticias clave. Explora The {AI}rtist para obtener contenido exclusivo y accionable sobre IA directamente en tu bandeja de entrada.

Newsletter NoCode OpenSource - Lo último en NoCode

¡Genial! Te has inscrito con éxito.

Bienvenido de nuevo! Has iniciado sesión correctamente.

Te has suscrito correctamente a Newsletter NoCode OpenSource - Lo último en NoCode.

¡Éxito! Comprueba en tu correo electrónico el enlace mágico para iniciar sesión.

Éxito! Su información de facturación ha sido actualizada.

Su facturación no se actualizó.

Update cookies preferences