Ingeniero de IA

Diseña un agente de IA
llamado Mark

Mark se encarga de todo el marketing de una empresa: analiza, crea, publica, automatiza. Un solo agente, 167 tools. Tu misión: diseñar cómo funciona por dentro.

167 Tools

$0.85 USD / interacción

445K Tokens / interacción

42% Tool accuracy

Contexto

Qué es Mark

HeyMark es un software donde te conectas con tus redes sociales y ads, y un agente de IA llamado Mark se encarga de hacer todo tu marketing. Analiza tu contenido y competencia, genera estrategia, crea piezas (imágenes, videos UGC, carruseles, copy), automatiza DMs y comentarios, y gestiona campañas. Básicamente, es tu equipo de marketing en un chat.

El usuario habla con Mark por chat (web y WhatsApp). Mark usa tools internamente y renderiza resultados como cards interactivas en la conversación. También hay un canvas, un panel persistente con widgets live (feed, calendario, ideas, inbox).

Stack

LLM: Claude Sonnet 4.6 / Opus 4.6 · Framework: Vercel AI SDK (streamText, tool calling) · Backend: Node.js + Express · DB: PostgreSQL (Supabase) · Frontend: React + Vite · Infra: GCP Cloud Run

Datos reales

Anatomía de una interacción

Estos son números reales de producción. Úsalos para tomar decisiones de diseño.

Métrica	Valor
Tools del agente	167 registrados, organizados en 15 skills
Costo promedio	$0.85 USD por interacción (mensaje + respuesta)
Tokens promedio	~445K (acumulado en ~5 steps)
Prefix cacheado (tools + system + skills)	~102K tokens
Tool search accuracy (BM25)	42%
Max steps por respuesta	8
Proveedores de IA/Media	8 (Anthropic, Google AI, Replicate, ElevenLabs, Arcads, Deepgram, SociaVault, Zernio)

¿A dónde se van los $0.85?

45%

44%

Cache write · $0.384 (102K tok, prefix en step 1)

Non-cached · $0.377 (126K tok, historial)

Cache read · $0.065 (218K tok, prefix en steps 2+)

Output · $0.021 (1.4K tok)

167 tools, 10 dominios

Ads Management

Content Creation

Platform & Utility

UGC / Avatars

Canvas & Widgets

Competitor Intel

Content Analysis

Video Wizard

Email Marketing

Publishing & Social

El desafío

Diseña a Mark desde cero

Un agente que maneja 167 tools sin explotar el context window, recuerda al usuario y su marca entre conversaciones, opera en producción real con usuarios pagando, y cada interacción cuesta $0.85. ¿Cómo lo harías tú?

Te dejamos un Excalidraw base con la arquitectura actual de Mark como punto de partida. Puedes usarlo, modificarlo, o descartarlo y arrancar de cero, lo que prefieras. Lo importante es que tu diseño cubra estas áreas:

Descargar Excalidraw base

Arquitectura del agente

¿Single o multi-agent? ¿Cómo es el loop? ¿Cómo fluye un request de punta a punta?

Context management

¿Qué entra en el context window y qué no? ¿Cómo manejas conversaciones que crecen?

Tool selection

167 tools, 42% de accuracy hoy. ¿Cómo haces para que el agente encuentre el correcto?

Memoria

¿Cómo recuerda quién es el usuario, qué decidió antes, qué funcionó y qué no?

Skills y workflows

Flujos complejos de múltiples pasos (wizard de video, onboarding). ¿Cómo se modelan y activan?

Costo

El 89% del costo es el prefix cacheado + historial. ¿Dónde optimizas?

Entrega

Qué esperamos

📐

Excalidraw

Tu arquitectura visual con justificaciones y trade-offs anotados en el diagrama. Parte del Excalidraw base o haz uno nuevo. Tip: puedes pedirle a Claude Code que te genere un archivo .excalidraw.

🎬

Presentación

Video de ~5 min o meet de 15 min donde lo explicas y respondemos preguntas. Tú eliges.

Cada decisión con un por qué. Investiga referentes, cita papers, herramientas o patterns que respalden tus decisiones. Preferimos pocas decisiones bien justificadas sobre un diseño «completo» sin sustancia. No esperamos código, esto es arquitectura. Profundiza donde más valor puedas aportar.

Envía todo a mark@heymark.ai con el asunto:
Nombre Apellido - Engineer HeyMark

⏱ 1 día desde que recibes este documento

Evaluación

Qué vamos a mirar

Arquitectura

Single vs multi-agent justificado

Loop de razonamiento definido

Context

Estrategia para no exceder el window

Manejo de conversaciones largas

Tools

No carga todo siempre (o justifica por qué)

Mecanismo de selección razonable

Memoria

Corto plazo vs largo plazo

Qué se guarda, cuándo, cómo se recupera

Skills

Modela flujos multi-paso

Carga on-demand o siempre (justificado)

Costo

Identifica dónde está el gasto real

Propone optimización concreta

Diseña un agente de IAllamado Mark

Qué es Mark

Stack

Anatomía de una interacción

¿A dónde se van los $0.85?

167 tools, 10 dominios

Diseña a Mark desde cero

Arquitectura del agente

Context management

Tool selection

Memoria

Skills y workflows

Costo

Qué esperamos

Excalidraw

Presentación

Qué vamos a mirar

Arquitectura

Context

Tools

Memoria

Skills

Costo

Diseña un agente de IA
llamado Mark