El router que le devolvió el control a Marco - OmniRoute + RTK + OpenClaw

OmniRoute conecta OpenClaw a 98 providers con fallback automático y cache semántico. RTK reduce el output de herramientas un 80%. Juntos eliminan el 95% del coste.
El router que le devolvió el control a Marco - OmniRoute + RTK + OpenClaw

Hola,

Esta semana hablamos de algo que a Marco le cambió la forma de pensar sobre los costes de sus agentes: OmniRoute, un gateway de IA local que conecta OpenClaw a 98 providers con fallback automático, cache semántico y circuit breaker — incluyendo providers completamente gratuitos como Kiro (Claude ilimitado vía AWS) y NVIDIA NIM (1.000 créditos gratis al mes con modelos como GPT-OSS 120B y Llama 4 Maverick).

Y luego está RTK, el proxy CLI en Rust que complementa a OmniRoute desde el otro ángulo: mientras OmniRoute elimina el coste de las peticiones repetidas, RTK comprime el output de las herramientas que ejecutan los agentes. Juntos consiguen más del 95% de reducción de coste total frente a un setup sin optimizar.

En el G33K TEAM, Néstor volvía de Londres con una revelación: en un meetup de desarrolladores, menos de la mitad de la sala usaba Claude Code o Codex activamente. Aitor presentó su herramienta de sincronización de Obsidian self-hosted con CouchDB — la misma que usa para que sus agentes enriquezcan fichas de clientes en tiempo real. Y el debate gordo: startups de Silicon Valley, exits, Y Combinator y si el valor real del producto importa o todo es una cuestión de contactos.

Vamos al lío 👇

📅 G33K TEAM de la Semana

🎙️ Episodio de esta semana — Obsidian Sync self-hosted, startups de Silicon Valley y Claude Design

Semana sin Oriol — estaba dando clase — así que Aitor, Néstor y Tete llevaron el episodio. Néstor volvía de Londres donde dio un workshop, una charla en escenario y un meetup donde le dejó helado descubrir que menos de la mitad de la sala usaba Claude Code o Codex activamente. Aitor presentó su herramienta de sincronización de Obsidian self-hosted. Y el debate gordo fue sobre startups de Silicon Valley, exits y si el valor real importa o solo los contactos.

🔹 Obsidian LiveSync self-hosted (Aitor): Herramienta para sincronizar Obsidian directamente contra un servidor CouchDB propio, sin pasar por el servicio de pago de Obsidian Sync. Se despliega con Docker Compose, expone HTTPS cifrado, tiene modo daemon con intervalo configurable (systemd), y sincronización incremental tras el inicial. La ventaja para agentes: los agentes escriben en el vault, y el vault se sincroniza automáticamente al PC y al móvil en tiempo real.

🔹 Obsidian como base de conocimiento de agentes: Aitor tiene conectado su vault a OpenClaw. Los agentes leen el correo, enriquecen las fichas de cliente directamente en Obsidian, consultan el CRM vía webhooks y actualizan los datos. Resultado: cuando entra al día siguiente, toda la información está actualizada sin haberla tocado manualmente.

🔹 El momento de revelación de Néstor en Londres: En el meetup preguntó a sala quiénes tenían Claude Code o Codex corriendo en ese momento. Menos de la mitad levantaron la mano. La conclusión: los developers siguen viendo la IA como autocompletado de línea, no como agente. El mindset del desarrollador-artista es el freno real — les cuesta ceder el pincel.

🔹 Startups de Silicon Valley y el debate del exit: Una amiga de Néstor renunció a su trabajo para ir a presentar a Y Combinator. El debate: ¿el valor real importa o solo los contactos? La tesis de Tete: en ese ecosistema el dinero fluye porque los inversores buscan exit en 5-8 años, no empresas que duren generaciones. El producto es una cerilla con mecha larga. Los datos de los usuarios valen más que el producto en sí.

🔹 Ruflo como alternativa a Engram para multiagente: Tete presentó Ruflo, framework de agentes con arquitectura de enjambre que comparte contexto entre agentes vía gossip y consenso. A diferencia de Gentelman (orientado a desarrollo con TDD), Ruflo está pensado para cualquier perfil — marketing incluido. Usa Postgres por detrás y coordina por RALF en loop continuo para no perder contexto.

🔹 Claude Design y el fin de Figma para perfiles técnicos: Néstor llevaba tiempo queriendo esto. Claude Design genera HTML medianamente bonito que luego puede validar con diseñadores. El truco que comparte Aitor: usar Dribbble como referencia visual, hacer captura de pantalla de dashboards o landings que te gusten, y combinarlo con un design.md que tenga colores, tipografías y logos — los modelos multimodales lo fusilan directamente.

🔗 Links del episodio:


ℍ𝕠𝕣𝕚𝕫𝕠𝕟𝕥𝕖 𝔸𝕣𝕥𝕚𝕗𝕚𝕔𝕚𝕒𝕝

Te presentamos "Horizonte Artificial", la nueva y flamante sección de nuestra newsletter dedicada exclusivamente a la Inteligencia Artificial. Pero no esperes el contenido convencional que inunda TikTok o YouTube. Aquí, nos sumergiremos en el fascinante mundo del OpenSource, explorando proyectos libres que puedes desplegar en tu propio servidor. Y para guiarnos en esta travesía, contamos con la experticia de Jesús Pacheco, mejor conocido en nuestra comunidad HiveAgile como "Pachecodes". ¡Bienvenidos al horizonte!


🌟 TopGit - Resumen Semanal (2026-04-25)

📚 Repositorios Destacados de la Semana

Los siguientes repositorios han sido seleccionados por su relevancia, calidad y métricas de GitHub:

🔧 🛠️ Listmonk

Listmonk es un gestor de boletines y listas de correo autohospedado de alto rendimiento. Está diseñado para ser rápido y repleto de características, todo en una única aplicación binaria. Utiliza PostgreSQL como su base de datos para almacenar datos.

Una interfaz moderna permite a los usuarios crear y gestionar campañas de correo electrónico y listas de suscriptores de manera eficiente. Además, se enfoca en la facilidad de uso y la integración, lo que lo convierte en una excelente opción para aquellos que buscan un software de gestión de newsletters autohospedado.

📊 Estadísticas de GitHub:
- ⭐ 19,623 estrellas
- 🔄 2,008 forks
- 👀 129 observadores
- 📝 101 issues abiertos
- 🔤 Principal lenguaje: Go


🔧 🧠 Impeccable: Lenguaje de diseño para IA

Impeccable es una herramienta diseñada para mejorar el diseño de interfaces a través de una colección de comandos optimizados para inteligencia artificial. Permite auditar, revisar y pulir el diseño de tus proyectos, asegurando que cumplan con altos estándares de calidad y usabilidad. Su enfoque en patrones anti-funcionales ayuda a prevenir errores comunes en el diseño moderno.

📊 Estadísticas de GitHub:
- ⭐ 21,895 estrellas
- 🔄 1,062 forks
- 👀 43 observadores
- 📝 34 issues abiertos
- 🔤 Principal lenguaje: JavaScript


🔧 🤖 Herramienta de Ingeniería Inversa de Android

Una herramienta que permite descompilar archivos APK/XAPK/JAR/AAR y extraer las APIs HTTP utilizadas por la aplicación. Utiliza motores como jadx y Fernflower para decompilar y extraer información como endpoints de Retrofit, llamadas de OkHttp y URLs codificadas, facilitando su documentación sin necesidad del código fuente original.

📊 Estadísticas de GitHub:
- ⭐ 4,923 estrellas
- 🔄 569 forks
- 👀 20 observadores
- 📝 10 issues abiertos
- 🔤 Principal lenguaje: Shell


🔧 💻 Claude Code Game Studios

Claude Code Game Studios transforma una sola sesión de Claude Code en un completo estudio de desarrollo de juegos. Con 49 agentes AI y 72 habilidades de flujo de trabajo, este sistema proporciona la estructura necesaria para organizar proyectos de manera eficaz. Cada agente tiene responsabilidades específicas y trabaja en equipo, permitiendo a los desarrolladores centrarse en la creatividad mientras se mantienen los estándares de calidad. Añade un nivel de organización y profesionalismo a tus proyectos de juego.

📊 Estadísticas de GitHub:
- ⭐ 16,111 estrellas
- 🔄 2,310 forks
- 👀 146 observadores
- 📝 13 issues abiertos
- 🔤 Principal lenguaje: Shell


🔧 💻 Plugin de Codex para Claude

El plugin de Codex permite a los usuarios de Claude Code realizar revisiones de código y delegar tareas a Codex de manera eficiente. Este plugin está diseñado para facilitar el flujo de trabajo de los desarrolladores al permitir que Codex se integre directamente en su entorno de trabajo.

📊 Estadísticas de GitHub:
- ⭐ 16,057 estrellas
- 🔄 903 forks
- 👀 51 observadores
- 📝 145 issues abiertos
- 🔤 Principal lenguaje: JavaScript


🔧 🌐 Diseño con DESIGN.md

Descripción: Esta herramienta es una colección de archivos DESIGN.md inspirados en populares sistemas de diseño de marcas. Simplemente copia uno en tu proyecto y permite que los agentes de código generen una UI a juego.

Características: Permite que los agentes de IA comprendan cómo debe lucir y sentirse tu proyecto. Incluye aspectos visuales, paletas de colores, reglas tipográficas y más, todo en un formato markdown fácil de usar.

Beneficios: Mejora la consistencia en el diseño de UI, agiliza el proceso de desarrollo y permite la reutilización de componentes sin necesidad de herramientas específicas. Su integración en el flujo de trabajo es sencilla y accesible para desarrolladores.

Casos de uso: Ideal para proyectos que buscan acelerar la creación visual, desde aplicaciones web hasta herramientas de desarrollo, aprovechando la capacidad de la IA para generar diseños consistentes y atractivos.

📊 Estadísticas de GitHub:
- ⭐ 65,229 estrellas
- 🔄 8,040 forks
- 👀 276 observadores
- 📝 277 issues abiertos
- 🔤 Principal lenguaje: No especificado


🔧 📺 ASCII Studio

ASCII Studio es una herramienta que transforma videos en animaciones ASCII de alto rendimiento. Procesa los fotogramas del video en tiempo real y los convierte en representaciones ASCII precisas utilizando un pipeline de renderizado optimizado. Puedes personalizar la densidad, el contraste y los conjuntos de caracteres para generar salidas únicas, todo sin salir de la navegador.

📊 Estadísticas de GitHub:
- ⭐ 1,024 estrellas
- 🔄 47 forks
- 👀 3 observadores
- 📝 0 issues abiertos
- 🔤 Principal lenguaje: TypeScript


🔧 💻 Notchy: Terminal Integrado

Notchy es una aplicación para macOS que añade una funcionalidad innovadora al área de notificación de la barra de menú, permitiendo acceder a una terminal desde la muesca del MacBook. Detecta automáticamente proyectos abiertos de Xcode y permite múltiples sesiones de terminal al mismo tiempo. La aplicación mejora la interacción con Claude Code, mostrando el estado en tiempo real en la muesca.

📊 Estadísticas de GitHub:
- ⭐ 685 estrellas
- 🔄 61 forks
- 👀 0 observadores
- 📝 13 issues abiertos
- 🔤 Principal lenguaje: Swift


🔧 🤖 ClawSweeper

ClawSweeper es un bot conservador para mantenedores de OpenClaw. Revisa los problemas abiertos y PRs, genera un registro markdown por cada elemento abierto y solo cierra aquellos que tengan evidencia sólida. Maneja diversas razones para cerrar, asegurando un flujo de trabajo basado en evidencias y no en suposiciones.

📊 Estadísticas de GitHub:
- ⭐ 335 estrellas
- 🔄 28 forks
- 👀 3 observadores
- 📝 3 issues abiertos
- 🔤 Principal lenguaje: JavaScript


🔧 🤖 Agente de Sincronización en Vivo para Obsidian

El agente de sincronización en vivo para Obsidian permite la sincronización bidireccional de los vaults de Obsidian utilizando CouchDB. Es una herramienta fascinante para quienes buscan mantener sus notas al día en diferentes dispositivos sin pérdidas.

📊 Estadísticas de GitHub:
- ⭐ 2 estrellas
- 🔄 0 forks
- 👀 0 observadores
- 📝 0 issues abiertos
- 🔤 Principal lenguaje: Rust


📊 Análisis de Distribución por Categorías

La siguiente gráfica muestra la distribución de proyectos por categoría en TopGit:

Distribución de Categorías

📈 Estadísticas Semanales

🏆 Top 3 Categorías

Top 3 Categorías

📊 Distribución Detallada

🔧 Dev                ██████████████  70%  (7 repos)
🤖 IA & Machine Learning ██            10%  (1 repos)
⚡ Productivity       ██            10%  (1 repos)
📊 Data & Analytics   ██            10%  (1 repos)

🚀 Tendencias Destacadas

📈 Métricas Clave

  • Repositorios Totales: 10
  • Promedio Diario: 1.4 repos/día
  • Categorías Activas: 4

🎯 Categorías Dominantes

  1. Dev
  2. 7 repositorios
  3. 70.0% del total

  4. IA & Machine Learning

  5. 1 repositorios
  6. 10.0% del total

  7. Productivity

  8. 1 repositorios
  9. 10.0% del total

💡 Análisis de Tendencias

Basándonos en las tendencias actuales de los repositorios de GitHub, podemos observar que las innovaciones principales se centran en una serie de temáticas comunes:

  1. Integración de la Inteligencia Artificial (IA): Los desarrollos tecnológicos cada vez más buscan explotar el potencial de la IA, ya sea en lenguajes de diseño basados en IA, como Impeccable, o en la delegación de revisiones de código a agentes de IA, como el plugin de Codex para Claude.

  2. Automatización y eficiencia: Los desarrolladores están creando herramientas que mejoran la eficiencia y simplifican procesos complejos o que consumen mucho tiempo, como la herramienta de ingeniería inversa de Android y ClawSweeper.

  3. Facilitación de la Gestión de Proyectos: Herramientas como Listmonk y Claude Code Game Studios, permiten una gestión eficiente de boletines, listas de correo y proyectos de desarrollo de juegos, respectivamente.

  4. Exploración Creativa en el Diseño: Proyectos como ASCII Studio y DESIGN.md animan a los desarrolladores a experimentar con nuevas formas de diseño, ya sea a través de animaciones ASCII de alto rendimiento o mediante la generación de UI con ayuda de agentes de IA.

  5. Mejora de la Usabilidad: Aplicaciones como Notchy buscan mejorar la usabilidad del software al proporcionar acceso a una terminal desde la muesca del MacBook o la sincronización bidireccional de vaults de Obsidian a través el Agente de Sincronización en Vivo.

En general, se puede apreciar un énfasis en la mejora de los procesos de desarrollo y diseño, la integración de la IA en diferentes ámbitos y la creación de interfaces y experiencias de usuario más amigables y eficientes. Estas tendencias demuestran la constante evolución en la industria del software y la incesante búsqueda de formas más inteligentes, eficientes y creativas de construir y diseñar tecnología.

🌵
Descubre, Participa, Comunícate
- 🐥 Únete a nuestra vibrante comunidad en Twitter y mantente en la vanguardia.
- 💌 ¿Tienes algo que compartir? No dudes en contactarnos.

The Airtist

El router que le devolvió el control a Marco

OmniRoute: cómo conectar OpenClaw a 98 proveedores de IA — incluyendo modelos completamente gratuitos y un sistema de cache que elimina el 70-90% del coste en agentes repetitivos — sin tocar una sola línea de código.


Era domingo por la noche y Marco estaba repasando los costes del mes.

No había ninguna sorpresa dramática. Las facturas de API estaban donde esperaba que estuvieran. Pero había algo que le incomodaba más que el importe: la rigidez. Cada agente de OpenClaw estaba hardcodeado a un proveedor. Si Anthropic subía precios, él pagaba. Si llegaba un modelo mejor y más barato, tenía que ir agente por agente a cambiarlo. Si un proveedor caía a las 3 de la mañana y un agente fallaba, no se enteraba hasta el lunes.

Y luego estaba el detalle que más le dolía: el agente que clasifica emails en urgente o puede esperar consumía exactamente los mismos tokens que el agente que analiza contratos de veinte páginas. Claude Sonnet para todo. Sin discriminar.

Tengo diez agentes corriendo. Estoy un cambio de política de precios lejos de tener que reescribir todo.

No era una situación crítica. Era una dependencia invisible que no notaba hasta que dolía.

Esa noche encontró OmniRoute.


Qué es OmniRoute

OmniRoute es un gateway de IA con routing inteligente, fallback automático, 98 proveedores y servidor MCP con herramientas de control de agentes. Escucha en localhost:20128 y expone un endpoint 100% compatible con la API de OpenAI. Para cualquier herramienta que acepte un endpoint personalizado — OpenClaw, Claude Code, Cursor, Codex CLI — OmniRoute es invisible. Solo ven una API respondiendo.

Por dentro es otra historia.

Cuando un agente de Marco manda una petición, OmniRoute ejecuta su cadena de fallback de 4 capas:

[SUSCRIPCIÓN]  Claude Code, Codex Plus, Gemini CLI (180K/mes gratis)
      ↓ cuota agotada
[API KEY]      DeepSeek, Groq, NVIDIA NIM (1.000 créditos gratis), Mistral
      ↓ límite de presupuesto
[BARATO]       GLM-4.7 ($0.06/1M), MiniMax M2 ($0.02/1M), Kimi K2.5
      ↓ siempre activo
[GRATIS]       Qoder AI (8 modelos sin límite), Kiro (Claude gratis vía AWS)

Los proveedores marcados como FREE son genuinamente ilimitados sin cargos ocultos. Qoder AI ofrece acceso gratuito a 8+ modelos vía OAuth bajo el prefijo if/. Kiro da Claude Sonnet y Haiku ilimitados vía AWS Builder ID. El dashboard muestra un "coste estimado" que no es una factura sino un tracker de ahorro — lo que habrías pagado si usaras APIs de pago directamente.

Marco configuró OpenClaw para apuntar a OmniRoute. Sus agentes siguieron funcionando exactamente igual. Solo que ahora, cuando la cuota de un proveedor se agota, OmniRoute lo detecta y cambia solo al siguiente. Sin interrupciones. Sin que Marco se entere.

Pero lo que Marco no esperaba era el cache.


La arquitectura que hace que funcione

Antes de entrar en los comandos vale la pena entender por qué OmniRoute no es simplemente "un proxy con reintentos".

Combos con estrategia. Un combo es un grupo de modelos con una política de selección. Puedes configurar fill-first (agota el primero antes de pasar al siguiente), round-robin, least-used, cost-optimized, o p2c (power-of-two-choices, el mismo algoritmo de balanceo de carga que usa Nginx). Para agentes de OpenClaw con tasks de distinta criticidad, esto cambia completamente el modelo de coste.

Circuit breaker por proveedor. Cada proveedor tiene su propio circuit breaker. Si las peticiones consecutivas fallan, el breaker se abre y OmniRoute deja de intentarlo durante el cooldown configurado. Cuando el proveedor se recupera, el breaker se cierra solo. Sin intervención manual, sin agentes fallando en silencio a las 3AM.

Servidor MCP nativo. OmniRoute expone un servidor MCP en tres modos de transporte (stdio, SSE y Streamable HTTP). Tus agentes de OpenClaw pueden consultar cuota disponible, cambiar de combo en tiempo real o ver el estado de los circuit breakers — todo desde dentro del agente, sin salir del contexto.

Protocolo A2A. Soporta el protocolo Agent-to-Agent para comunicación directa entre agentes vía JSON-RPC. Todavía emergente, pero es la dirección hacia donde va el ecosistema agentic.

Y luego está el sistema de cache. Que merece su propia sección.


El cache que elimina el 70-90% del coste en agentes repetitivos

Esta es la feature que más diferencia hace en producción y la que menos se menciona.

OmniRoute tiene tres capas de ahorro independientes que funcionan a la vez. No tienes que activar nada — están encendidas por defecto desde el primer momento.

Capa 1 — Semantic Cache. Las peticiones con temperature=0 y stream=false se cachean automáticamente. La clave es un SHA-256 de modelo + mensajes normalizados + temperature + top_p. Primera capa: LRU en memoria con hasta 500 entradas y 1 hora de TTL. Segunda capa: SQLite persistente que sobrevive a reinicios del contenedor.

Traducido a OpenClaw: si tu agente clasificador recibe el mismo email (o uno textualmente idéntico) dos veces en una hora, la segunda petición no sale del servidor. Cero tokens consumidos. Latencia de microsegundos.

Esto no es magia — es exactamente el perfil de uso de los agentes más comunes: clasificadores de emails, extractores de datos de facturas con el mismo template, agentes de FAQ que responden las mismas veinte preguntas una y otra vez. temperature=0 porque quieres respuestas deterministas. stream=false porque el resultado va a una base de datos, no a un humano mirando la pantalla.

Agente clasificador de emails:     1.000 emails/día
Hit rate estimado del cache:        70-85%
Tokens consumidos sin cache:        4.500.000/día
Tokens consumidos con cache:        675.000-1.350.000/día
Ahorro mensual a $0.06/1M:         ~$7-8/mes por agente

Para un agente de FAQ con corpus estable, el hit rate puede superar el 90%.

Capa 2 — Idempotency Layer. Ventana de 5 segundos. Si dos peticiones con el mismo X-Request-Id o Idempotency-Key llegan en menos de 5 segundos, la segunda obtiene la respuesta de la primera sin ir al proveedor. Protege contra reintentos accidentales, webhooks duplicados, o agentes que se quedan colgados y vuelven a intentarlo. Completamente automático.

Capa 3 — Prompt Cache nativo de proveedores. OmniRoute trackea en SQLite dos campos separados: tokens_cache_read y tokens_cache_creation. Son los tokens de prompt cache nativo de Anthropic y OpenAI — cuando el proveedor reutiliza el KV cache del sistema prompt entre peticiones. Si tus agentes tienen un sistema prompt largo fijo (un SOUL.md extenso), el proveedor lo cachea en su infraestructura y cobra menos por esos tokens en peticiones sucesivas. OmniRoute lo registra y lo muestra en el dashboard de analytics para que veas exactamente cuánto te ahorra este mecanismo.

Cómo monitorizar el cache en tiempo real:

curl https://omniroute.tudominio.com/api/cache \
  -H "Authorization: Bearer tu_api_key"

# Respuesta:
{
  "semanticCache": {
    "memoryEntries": 127,
    "dbEntries": 843,
    "hits": 1204,
    "misses": 389,
    "hitRate": "75.6",
    "tokensSaved": 284710
  },
  "idempotency": {
    "activeKeys": 3
  }
}

Cómo saltarse el cache cuando no lo quieres (agentes con respuestas variables, razonamiento creativo):

# Header para bypass puntual
X-OmniRoute-No-Cache: true

Tuning del cache según el tipo de agente:

# Para agentes con corpus muy estable (FAQ, clasificadores)
SEMANTIC_CACHE_TTL_MS=86400000   # 24 horas
SEMANTIC_CACHE_MAX_SIZE=2000     # más entradas

# Para agentes con datos que cambian cada hora
SEMANTIC_CACHE_TTL_MS=3600000   # 1 hora (default)
SEMANTIC_CACHE_MAX_SIZE=500     # default

# Limpiar cache cuando cambias el sistema prompt de un agente
curl -X DELETE https://omniroute.tudominio.com/api/cache \
  -H "Authorization: Bearer tu_api_key"

La tabla de referencia para decidir el TTL:

Tipo de agente temperature stream Cache activo TTL recomendado
Clasificador de emails 0 false ✅ Sí 24h
Extractor de facturas 0 false ✅ Sí 24h
FAQ responder 0 false ✅ Sí 24h
Generador de resúmenes 0 false ✅ Sí 1h
Agente conversacional >0 true ❌ No
Razonamiento complejo >0 false ❌ No

¿Cuánto costó a Marco configurar todo esto? Diez minutos. Y no tocó ningún SOUL.md.

Eso es lo que te cuento en la parte premium.

¡Únete a NoCode OpenSource!

Únete a nuestra comunidad NoCode OpenSource y accede a noticias clave. Explora The {AI}rtist para obtener contenido exclusivo y accionable sobre IA directamente en tu bandeja de entrada.

Newsletter NoCode OpenSource - Lo último en NoCode

¡Genial! Te has inscrito con éxito.

Bienvenido de nuevo! Has iniciado sesión correctamente.

Te has suscrito correctamente a Newsletter NoCode OpenSource - Lo último en NoCode.

¡Éxito! Comprueba en tu correo electrónico el enlace mágico para iniciar sesión.

Éxito! Su información de facturación ha sido actualizada.

Su facturación no se actualizó.

Update cookies preferences