¿Por qué Opus 4.8 se siente más lento?

Prioriza juicio y consistencia sobre velocidad: razona más antes de responder. Si necesitas respuestas rápidas, existe un modo rápido que cuesta más por token pero es tres veces más barato que el modo rápido de versiones anteriores.

¿Subió de precio respecto a 4.7?

No. El precio de uso regular es el mismo que Opus 4.7: 5 dólares por millón de tokens de entrada y 25 por millón de salida, según Anthropic.

¿Actualizo de 4.7 a 4.8 hoy mismo?

Para tareas nuevas y agentes de varios pasos, sí. Para pipelines críticos ya estables, pruébalo en paralelo antes de migrar todo. La versión nueva no siempre es mejor para tu caso particular.

Claude Opus 4.8: review honesto del día de lanzamiento

Q: ¿Cuándo salió Claude Opus 4.8?

El 28 de mayo de 2026, según el anuncio oficial de Anthropic. Quedó disponible el mismo día en la API como claude-opus-4-8, en Claude.ai, en la plataforma Cowork y en Claude Code.

Respuesta corta: Anthropic lanzó Claude Opus 4.8 el 28 de mayo de 2026, al mismo precio que 4.7. Lo nuevo de verdad: mejor juicio en tareas con agentes y, según Anthropic, cuatro veces menos propenso que 4.7 a dejar pasar fallos de código sin avisar. Se siente más lento porque razona más antes de responder; para eso está el modo rápido. Si empiezas algo nuevo, úsalo ya. Si tienes un pipeline crítico estable, pruébalo en paralelo antes de migrar todo.

Salió hoy. Y a diferencia de mi review de Opus 4.7, no te voy a vender tres semanas de pruebas que todavía no tengo. Esto es el día uno: lo que Anthropic afirma y se puede verificar, separado de lo que se siente en las primeras horas de uso real. Lo demás es hype, y aquí no hacemos eso.

Qué salió y cuándo

Claude Opus 4.8 se anunció el 28 de mayo de 2026. Quedó disponible el mismo día en la API (como claude-opus-4-8), en Claude.ai, en la plataforma Cowork y en Claude Code. Es la actualización a la clase Opus, no un modelo de familia nueva.

El dato que a un marketer le importa primero: el precio de uso regular no subió. Sigue en 5 dólares por millón de tokens de entrada y 25 por millón de salida, igual que 4.7 (fuente: anuncio oficial de Anthropic, 28 mayo 2026). Una versión más capaz al mismo costo es la clase de cosa que rara vez pasa, y vale notarla.

Lo que afirma Anthropic (y se puede verificar)

Estos números los publica Anthropic en su anuncio. No son míos, no los inventé, y los cito como lo que son: benchmarks (pruebas de referencia) del fabricante.

Online-Mind2Web: 84%. Es una prueba de navegación autónoma, es decir, el modelo manejando un navegador para completar tareas reales en la web.
Super-Agent: Anthropic dice que es el único modelo que completó todos los casos de principio a fin.
CursorBench: supera a los Opus anteriores en todos los niveles de esfuerzo.
Honestidad en código: según Anthropic, cuatro veces menos propenso que 4.7 a dejar pasar un fallo de código sin comentarlo.

Ese último punto es el más interesante para quien usa AI sin ser programador. Significa que el modelo está diseñado para señalarte el error en lugar de tragárselo para quedar bien. Un staff engineer de Anthropic, Tom Pritchard, lo resume así: el modelo "hace las preguntas correctas, atrapa sus propios errores y te lleva la contraria cuando un plan no tiene sentido". Si es verdad en tu día a día, eso vale más que cualquier punto de benchmark.

Primeras impresiones, sin fingir que llevo semanas

Día uno. Lo usé unas horas en lo de siempre: agentes de varios pasos, análisis de campañas, redacción crítica. Lo que noto, con la advertencia honesta de que es muy temprano:

El juicio se siente distinto

En tareas con agentes autónomos (agentic, donde el modelo planea y ejecuta varios pasos solo), se nota que pregunta antes de asumir. Donde 4.7 a veces se lanzaba con una suposición, 4.8 frena y pide la aclaración. Para trabajo de verdad eso es bueno. Para una tarea trivial puede sentirse como exceso de cautela.

Mantiene mejor el hilo largo

En conversaciones largas cita con más precisión lo que se dijo antes. Es la misma mejora que vi al pasar a 4.7, sostenida. Si tu cuello de botella es el contexto largo, esto te ahorra reinyectar información.

Sí, se siente más lento. Y tiene explicación

No me lo vas a discutir: 4.8 responde más despacio en uso normal. Pero no es un defecto suelto, es la consecuencia directa de que razona más antes de contestar. Más juicio cuesta tiempo. No hay magia.

Para eso existe el modo rápido (fast mode): output acelerado del mismo modelo, sin bajar a uno más chico. Cuesta más por token, pero Anthropic dice que ese modo rápido es tres veces más barato que el de las versiones anteriores. Traducción práctica: cuando necesites velocidad, la pagas, pero hoy te sale bastante menos que antes. Cuando necesites criterio, deja que se tome su tiempo.

Lo que de verdad importa para marketing

Olvídate un momento de los benchmarks de programación. Para quien hace marketing con AI, la pregunta es otra: ¿en qué cambia mi trabajo?

Menos invención silenciosa. Un modelo más honesto inventa menos datos y te avisa cuando no está seguro. En análisis de campañas y portafolio, eso es oro: el error caro es el dato falso que parece verdadero.
Agentes más confiables. Si automatizas flujos de varios pasos (reportes, clasificación, respuestas), un modelo que se autocorrige rompe menos a mitad de camino.
Mismo presupuesto. Capacidad nueva sin subir el costo regular significa que no tienes que rehacer tus cuentas.

¿Actualizas hoy o esperas?

La regla no cambió respecto a cada lanzamiento anterior. Que sea nuevo no lo hace mejor para tu caso particular.

Actualiza ya si empiezas algo desde cero, si tus tareas son agentes de varios pasos, o si trabajas con documentos largos.
Prueba en paralelo primero si tienes un pipeline en producción ya estable y con prompts afinados para 4.7. No rompas lo que funciona por moda.
Mide tú si el costo te importa al centavo. No creas a nadie, ni a mí: corre tus propios casos.

Qué hago yo

Sandra Urena recomienda no actualizar todo de golpe el día del lanzamiento. Pon Opus 4.8 a trabajar en lo nuevo y en agentes largos desde hoy, y deja tus flujos críticos en 4.7 una o dos semanas mientras pruebas en paralelo. Anota dónde mejora de verdad y dónde la cautela extra te estorba. Migra por bloque, no por proyecto entero. La emoción del lanzamiento es legítima; la decisión se toma con tus prompts, tus datos y tu juicio, no con tweets.

En un par de semanas, con horas reales encima, te cuento si las primeras impresiones aguantaron. Sin religión.

Claude Opus 4.8: review honesto del día de lanzamiento

Qué salió y cuándo

Lo que afirma Anthropic (y se puede verificar)

Primeras impresiones, sin fingir que llevo semanas

El juicio se siente distinto

Mantiene mejor el hilo largo

Sí, se siente más lento. Y tiene explicación

Lo que de verdad importa para marketing

¿Actualizas hoy o esperas?

Qué hago yo

Preguntas frecuentes

¿Quieres robarte algo útil?

Claude Opus 4.8: review honesto del día de lanzamiento

Qué salió y cuándo

Lo que afirma Anthropic (y se puede verificar)

Primeras impresiones, sin fingir que llevo semanas

El juicio se siente distinto

Mantiene mejor el hilo largo

Sí, se siente más lento. Y tiene explicación

Lo que de verdad importa para marketing

¿Actualizas hoy o esperas?

Qué hago yo

Preguntas frecuentes

Relacionado

¿Quieres robarte algo útil?