HeyMark HeyMark
Prueba Técnica
Ingeniero de IA

Diseña un agente de IA
llamado Mark

Mark se encarga de todo el marketing de una empresa: analiza, crea, publica, automatiza. Un solo agente, 167 tools. Tu misión: diseñar cómo funciona por dentro.

167 Tools
$0.85 USD / interacción
445K Tokens / interacción
42% Tool accuracy
Contexto

Qué es Mark

HeyMark es un software donde te conectas con tus redes sociales y ads, y un agente de IA llamado Mark se encarga de hacer todo tu marketing. Analiza tu contenido y competencia, genera estrategia, crea piezas (imágenes, videos UGC, carruseles, copy), automatiza DMs y comentarios, y gestiona campañas. Básicamente, es tu equipo de marketing en un chat.

El usuario habla con Mark por chat (web y WhatsApp). Mark usa tools internamente y renderiza resultados como cards interactivas en la conversación. También hay un canvas, un panel persistente con widgets live (feed, calendario, ideas, inbox).

Stack

LLM: Claude Sonnet 4.6 / Opus 4.6  ·  Framework: Vercel AI SDK (streamText, tool calling)  ·  Backend: Node.js + Express  ·  DB: PostgreSQL (Supabase)  ·  Frontend: React + Vite  ·  Infra: GCP Cloud Run

Datos reales

Anatomía de una interacción

Estos son números reales de producción. Úsalos para tomar decisiones de diseño.

MétricaValor
Tools del agente167 registrados, organizados en 15 skills
Costo promedio$0.85 USD por interacción (mensaje + respuesta)
Tokens promedio~445K (acumulado en ~5 steps)
Prefix cacheado (tools + system + skills)~102K tokens
Tool search accuracy (BM25)42%
Max steps por respuesta8
Proveedores de IA/Media8 (Anthropic, Google AI, Replicate, ElevenLabs, Arcads, Deepgram, SociaVault, Zernio)

¿A dónde se van los $0.85?

45%
44%
8%
Cache write · $0.384 (102K tok, prefix en step 1)
Non-cached · $0.377 (126K tok, historial)
Cache read · $0.065 (218K tok, prefix en steps 2+)
Output · $0.021 (1.4K tok)

167 tools, 10 dominios

Ads Management
46
Content Creation
21
Platform & Utility
21
UGC / Avatars
17
Canvas & Widgets
14
Competitor Intel
14
Content Analysis
11
Video Wizard
10
Email Marketing
8
Publishing & Social
5
El desafío

Diseña a Mark desde cero

Un agente que maneja 167 tools sin explotar el context window, recuerda al usuario y su marca entre conversaciones, opera en producción real con usuarios pagando, y cada interacción cuesta $0.85. ¿Cómo lo harías tú?

Te dejamos un Excalidraw base con la arquitectura actual de Mark como punto de partida. Puedes usarlo, modificarlo, o descartarlo y arrancar de cero, lo que prefieras. Lo importante es que tu diseño cubra estas áreas:

Descargar Excalidraw base
1

Arquitectura del agente

¿Single o multi-agent? ¿Cómo es el loop? ¿Cómo fluye un request de punta a punta?

2

Context management

¿Qué entra en el context window y qué no? ¿Cómo manejas conversaciones que crecen?

3

Tool selection

167 tools, 42% de accuracy hoy. ¿Cómo haces para que el agente encuentre el correcto?

4

Memoria

¿Cómo recuerda quién es el usuario, qué decidió antes, qué funcionó y qué no?

5

Skills y workflows

Flujos complejos de múltiples pasos (wizard de video, onboarding). ¿Cómo se modelan y activan?

6

Costo

El 89% del costo es el prefix cacheado + historial. ¿Dónde optimizas?

Entrega

Qué esperamos

📐

Excalidraw

Tu arquitectura visual con justificaciones y trade-offs anotados en el diagrama. Parte del Excalidraw base o haz uno nuevo. Tip: puedes pedirle a Claude Code que te genere un archivo .excalidraw.

🎬

Presentación

Video de ~5 min o meet de 15 min donde lo explicas y respondemos preguntas. Tú eliges.

Cada decisión con un por qué. Investiga referentes, cita papers, herramientas o patterns que respalden tus decisiones. Preferimos pocas decisiones bien justificadas sobre un diseño «completo» sin sustancia. No esperamos código, esto es arquitectura. Profundiza donde más valor puedas aportar.

Envía todo a mark@heymark.ai con el asunto:
Nombre Apellido - Engineer HeyMark

⏱  1 día desde que recibes este documento
Evaluación

Qué vamos a mirar

Arquitectura

Single vs multi-agent justificado
Loop de razonamiento definido

Context

Estrategia para no exceder el window
Manejo de conversaciones largas

Tools

No carga todo siempre (o justifica por qué)
Mecanismo de selección razonable

Memoria

Corto plazo vs largo plazo
Qué se guarda, cuándo, cómo se recupera

Skills

Modela flujos multi-paso
Carga on-demand o siempre (justificado)

Costo

Identifica dónde está el gasto real
Propone optimización concreta