Key Takeaways
- 1GPT-4o es tu modelo del día a día, pero Claude 3.5 Sonnet lo destroza en lógica profunda.
- 2GPT-4o-mini reemplaza por completo a GPT-3.5 y te ahorra muchísima plata en el trabajo repetitivo.
- 3Hardcodear todas tus tareas a través de un solo modelo caro es un error por pereza que te sale muy caro.
- 4La nueva API de Responses de OpenAI elimina cientos de líneas de deuda técnica.
- 5Empareja la inteligencia del modelo con la complejidad de la tarea para escalar de forma rentable.
Si tu código todavía llama a `gpt-4` o `gpt-3.5-turbo`, estás quemando plata activamente.
Lo veo todas las semanas. Una startup en Medellín nos pide escalar su centro de soporte. Revisamos el código y están mandando actualizaciones simples de tickets a través de `gpt-4`.
Están desangrando su margen sin aportar ningún valor. Es como contratar a un abogado corporativo senior para clasificar tu correo de todos los días.
Usar GPT-4 para clasificación simple de datos es como contratar a un abogado senior para separar tu correo.
Los únicos tres modelos que importan ahora mismo
Ignora el humo de Twitter. Si estás construyendo automatizaciones hoy, el 99% de tus flujos de trabajo deberían depender de exactamente tres modelos.
- GPT-4o es tu todoterreno. Es rápido, maneja voz y visión de forma nativa, y cuesta la mitad de lo que costaba el viejo GPT-4. Úsalo para chatbots de atención al cliente y para extraer datos de facturas.
- Claude 3.5 Sonnet es el desarrollador senior. Si necesitas que una IA escriba un script en Python, arregle un bug anidado en JSON o analice un contrato de proveedores de 50 páginas, Anthropic gana. Destroza a GPT-4o en lógica profunda.
- GPT-4o-mini es el trabajador incansable. Reemplazó por completo a GPT-3.5. Es baratísimo e increíblemente rápido. Úsalo para clasificar textos, rutear tickets de soporte y resumir correos cortos.
Mata tus wrappers de API complejos
El viejo endpoint de chat completions de OpenAI era un desastre inflado para tareas simples. Por fin lo arreglaron.
La nueva API de Responses es brutalmente simple. Pasa `model="gpt-4o"`, pon tu prompt y entrégale el input. Borra esos wrappers personalizados que solo están ensuciando tu repo en GitHub.
La visión ya viene integrada
Si estás procesando imágenes, la API de Responses maneja archivos codificados en base64 de forma nativa. Deja de escribir parsers personalizados para cada formato de imagen. Solo codifícala y pásasela a GPT-4o.
Deja de hardcodear un solo modelo para todo
Hardcodear `gpt-4o` en toda tu aplicación es un error por pereza que sale caro.
El mes pasado, auditamos a una empresa mediana de logística en la Ciudad de México. Le estaban pagando a OpenAI $3,000 dólares al mes solo para extraer direcciones de etiquetas de envío usando GPT-4.
Lo cambiamos a GPT-4o-mini. Su factura bajó a $120 al mes. La precisión se mantuvo en 99.8%. Eso es una reducción de costos del 96% solo por emparejar el modelo correcto con la tarea.
- Audita el coeficiente intelectual requerido: Separa las tareas tontas (etiquetar, rutear, extraer keywords) de las tareas inteligentes (redactar respuestas de correo con matices).
- Asigna el cerebro correcto: Manda el trabajo pesado a GPT-4o-mini. Guarda GPT-4o y Claude 3.5 Sonnet exclusivamente para razonamiento profundo.
- Refactoriza tus endpoints: Cambia tus scripts de Python a la API de Responses hoy mismo. Toma diez minutos y elimina cientos de líneas de deuda técnica.
Deja de financiarle el yate a OpenAI
Si tus facturas de IA siguen subiendo pero tu automatización no mejora, tienes un problema de arquitectura. Vamos a arreglarlo.
Auditar mis flujos de trabajoPreguntas Frecuentes
¿Debería usar GPT-4o para todo?
Absolutamente no. GPT-4o es rápido y barato, pero para escribir código complejo o razonamiento lógico profundo, Claude 3.5 Sonnet es objetivamente mejor. Asigna el modelo según la tarea.
¿Qué pasó con GPT-3.5?
Está muerto. OpenAI lo reemplazó con GPT-4o-mini. Si tus scripts siguen llamando a gpt-3.5-turbo, estás pagando más por peores resultados. Refactoriza tu código hoy mismo.
Kyto
AI & Automation Firm
We design and build AI automations and business operating systems. Agency results + Academy sovereignty.

