| Modelo | Tamaño aprox. | VRAM/CPU recomendada | Uso recomendado |
|---|
| LLaMA 3.2 3B | ~2–3 GB | CPU 8 GB RAM | Chat básico, asistentes rápidos, pruebas locales. |
| Mistral 7B | ~4 GB | GPU 6–8 GB VRAM o CPU | Traducción, resúmenes cortos, tareas de texto rápidas. |
| Gemma 2B | ~1.5 GB | CPU con 4–6 GB RAM | Bots ligeros, prototipado rápido, aplicaciones móviles. |
| Phi-3 Mini | ~2.5 GB | CPU o GPU 4 GB VRAM | Tareas de programación y razonamiento simple. |
Estos modelos son ideales para:
Probar Ollama sin invertir en hardware costoso.
Ejecutar IA en entornos de desarrollo móvil o integraciones IoT.
Mantener un consumo energético bajo.
Ollama permite instalar estos modelos con el mismo comando ollama pull, simplemente cambiando el nombre del modelo, por ejemplo:
ollama pull mistral
ollama run mistral