Operator, Manus, o tu propio agente: cuándo cada uno tiene sentido
Llevamos casi dos años hablando de agentes que navegan internet por nosotros. Llenar formularios, comparar precios, agendar citas, descargar reportes. La promesa es enorme: dejar de hacer las tareas de mantenimiento del trabajo digital.
La realidad a julio de 2025 es más matizada. Hay tres opciones reales sobre la mesa. Cada una resuelve un problema distinto. Cada una se rompe en lugares distintos. Te las desgloso sin marketing.
Opción 1: Operator (OpenAI)
Operator es el agente de browsing de OpenAI. Vive en una pestaña que controla, ve la pantalla, hace clic y escribe. Está optimizado para tareas web del usuario final: pedir comida, comprar entradas, llenar formularios, agendar.
Dónde brilla
- Tareas web simples con interfaces gringas estándar (Amazon, OpenTable, calendarios)
- Sitios bien diseñados con HTML moderno
- Tareas únicas que no requieren memoria de largo plazo
Dónde se rompe
- Sitios LatAm con diseños viejos, captchas o flujos raros (banca regional, gobierno, pasarelas locales)
- Tareas que requieren login con autenticación de dos factores en otro dispositivo
- Cualquier flujo que pase de 15-20 minutos: pierde contexto y se confunde
En español funciona, pero hay sesgo claro a sitios y comportamientos del mercado gringo. Para LatAm, donde mucha banca, gobierno y proveedores tienen interfaces antiguas, su tasa de éxito baja notoriamente.
Opción 2: Manus
Manus es un agente generalista de origen chino que se posicionó fuerte en 2025 con un enfoque distinto: más autónomo, más largo, más multitarea. No solo navega; planifica, ejecuta varios pasos, mantiene memoria de la sesión.
Dónde brilla
- Tareas largas con múltiples pasos y subtareas
- Investigación combinada (busca, lee, descarga, sintetiza)
- Flujos donde necesitas que el agente "siga trabajando" sin tu supervisión por horas
Dónde se rompe
- Cuando el sitio bloquea agentes automáticos (cada vez más sitios lo hacen)
- Tareas que requieren juicio sutil sobre calidad (Manus tiende a aceptar la primera respuesta plausible)
- Datos sensibles: la nube de Manus es más opaca que la de OpenAI o Anthropic en términos de jurisdicción y residencia. Para muchos contextos corporativos, eso lo descarta de entrada
Opción 3: Tu propio agente
Aquí es donde se pone interesante. Con Claude Computer Use, Browser Use de open source, Playwright + un modelo, puedes armarte el tuyo. Más trabajo upfront, pero control total.
Dónde tiene sentido construir
- Tareas repetitivas con reglas claras, donde corre cientos de veces y el costo por tarea de un servicio comercial se acumula
- Data regulada o sensible que no puede salir de tu infraestructura
- Integraciones con sistemas internos que ningún agente comercial conoce
- Cuando necesitas debugging y observabilidad fina (logs, reintentos, alertas)
Dónde NO conviene
- Tareas únicas o exploratorias donde el costo de armar el agente supera el costo de hacer la tarea a mano
- Equipos sin programador disponible: armar y mantener un agente es trabajo de software, no de marketing
- Casos donde la tarea cambia mucho cada vez: agentes propios funcionan bien con patrones; mal con tareas creativas
Criterios para decidir
Mi marco práctico para decidir entre las tres opciones es simple. Pregúntate en orden:
- ¿Cuántas veces vas a correr esta tarea? Una vez: hazla a mano. Diez veces al mes: prueba Operator o Manus. Cien o más veces al mes: empieza a evaluar agente propio.
- ¿La data es sensible o regulada? Si la respuesta es sí, descarta agentes que mandan tu pantalla a un proveedor opaco. Quédate con Computer Use de Claude (con clausulado claro) o agente propio en tu infra.
- ¿La tarea cabe en un flujo claro o necesita juicio? Si necesita juicio sutil, ningún agente la va a hacer bien todavía. Mejor que el agente prepare la decisión y un humano apriete el botón.
- ¿Tienes alguien que mantenga el agente? Esto se subestima. Un agente sin dueño se rompe en silencio cuando el sitio cambia un botón. Si nadie lo va a mirar, mejor servicio comercial.
Costos relativos (sin números inventados)
No te voy a soltar cifras exactas porque cambian cada mes. La forma de pensarlo es:
- Operator y Manus: precio por suscripción mensual fijo. Predecible. Caro si lo usas poco; barato si lo usas mucho.
- Agente propio con Computer Use o similar: pagas por tokens del modelo + tu tiempo de armarlo + infra para que corra. El costo por tarea baja cuando escalas; el costo de mantenimiento sube si nadie lo cuida.
- Humano haciendo la tarea: sigue siendo la opción que la gente subestima. Para tareas que pasan diez veces al mes, un humano paid hourly suele ser más barato y más confiable que cualquier agente actual.
Lo que viene en los próximos meses
Tres tendencias claras: agentes con memoria persistente entre sesiones (game-changer (punto de inflexión) para tareas largas), mejor manejo de captchas y autenticación 2FA, y modelos más baratos que hacen viable correr cientos de tareas al día.
Mi apuesta: para fines de 2025 los agentes de browsing van a ser tan útiles como un junior dedicado a tareas digitales. No reemplazan al equipo, pero sí absorben el trabajo de "research y mantenimiento" que hoy se reparte entre todos.
Qué hago yo
yo recomiendo probar Operator primero si nunca has usado un agente de browsing. Es la curva más fácil. Si lo usas y te enganchas, evalúa Manus para tareas más largas. Y solo después de que tengas claro qué te resuelven los servicios comerciales, considera armar el tuyo.
Construir antes de saber qué necesitas es la trampa típica del lado dev. Según el blog Sandra Urena, esa secuencia (probar, sufrir, después construir) ahorra meses de re-trabajo.
Preguntas frecuentes
¿Qué es un agente de browsing?
Es un agente AI que abre un navegador, hace clic, escribe, navega entre páginas y ejecuta tareas web por ti. A diferencia de un chatbot que solo responde, este actúa: llena formularios, compara precios, agenda citas, descarga datos.
¿Operator y Manus son lo mismo?
No. Operator es el agente de browsing de OpenAI, optimizado para tareas web del consumidor. Manus es un agente más generalista de origen chino con enfoque más autónomo y multitarea. Resuelven cosas distintas.
¿Cuándo conviene construir tu propio agente?
Cuando la tarea es repetitiva, tiene reglas claras, toca data sensible, o el costo por tarea de las soluciones comerciales se vuelve alto. Para tareas únicas o exploratorias, casi siempre conviene comprar.
¿Funcionan bien con sitios en español de LatAm?
Funcionan, pero peor que con sitios gringos. Muchas pasarelas, banca y portales de gobierno LatAm tienen interfaces viejas o flujos atípicos donde los agentes se atoran. Pruébalos antes de comprometerte a un caso de uso.
¿Quieres robarte algo útil?
30 prompts curados, listos para copiar y pegar. Por perfil. Sin formularios.
Ir a Róbate Esto →