Modelos de IA
“Los modelos de IA no son magia; son matemáticas, datos y arquitectura trabajando en armonía.” - Andrew Ng, cofundador de Google Brain y Coursera

En 2025, el panorama de modelos de inteligencia artificial es vasto y, sobre todo, dinámico. Como desarrollador, no necesitas conocer todos los modelos, pero sí entender las categorías principales y cómo elegir el modelo correcto para tu proyecto.
- Modelos Generales: Modelos de lenguaje de propósito general (LLMs) diseñados para chat, generación de texto creativa y razonamiento lógico complejo.
- Modelos de Código: Especializados y afinados (fine-tuned) con repositorios de código para entender sintaxis, generar funciones y documentar software.
- Modelos de Embeddings: Transforman texto (u otros datos) en vectores numéricos, permitiendo a las máquinas “entender” la similitud semántica. Son el motor de las arquitecturas RAG (Retrieval-Augmented Generation).
Matriz de decisión (Trade-offs)
Sección titulada «Matriz de decisión (Trade-offs)»No existe el “mejor modelo universal”. Elegir el modelo adecuado es un ejercicio de equilibrio entre restricciones y requisitos.
Aquí tienes una guía rápida para evaluar tus opciones:
| Factor Clave | API Propietaria (SaaS) | Open Source (Self-Hosted) |
|---|---|---|
| Privacidad | Los datos salen de tu red. Requiere acuerdos legales estrictos. | Los datos nunca salen de tu control. Ideal para RGPD/Compliance. |
| Costo | Variable (pago por uso/token). Escala linealmente. | Fijo (hardware/nube). Rentable a gran escala o uso intensivo. |
| Latencia | Variable, depende de la red y carga del proveedor. | Predecible. Optimizable con hardware dedicado. |
| Mantenimiento | Cero. El proveedor gestiona la infraestructura. | Alto. Requiere gestión de GPUs, drivers y actualizaciones. |
| Capacidad | Generalmente SOTA (State of the Art). | Muy competitivo, alcanzando a los propietarios rápidamente. |
Preguntas para definir tu stack
Sección titulada «Preguntas para definir tu stack»Antes de escribir una sola línea de código, responde a estas preguntas para filtrar tus opciones:
- ¿Cuál es la tarea específica? (¿Necesito generar SQL? -> Modelo de Código. ¿Necesito resumir noticias? -> Modelo General).
- ¿Qué latencia es aceptable? (¿Chatbot en tiempo real o análisis de documentos en batch?).
- ¿Tengo datos sensibles? (¿Puedo enviarlos a una API de terceros?).
- ¿Cuál es mi presupuesto de ingeniería? (¿Tengo equipo para mantener un clúster de Kubernetes con GPUs?).