2025年开源AI模型：格局及其对你的意义

2026年6月18日电脑和软件

2025年专有AI模型和开源替代品之间的差距已经大幅缩小。以下是对当前格局的诚实评估，以及对不同类型用户的意义。

当前层级结构

前沿专有：Claude Opus和Sonnet（Anthropic）、GPT-4o和o3（OpenAI）、Gemini Ultra（Google）——复杂推理任务的最高能力层。顶级开源：Meta的Llama 4系列、Mistral Large、DeepSeek V3/R1——在许多基准上与专有前沿模型竞争，可免费下载，可在本地或廉价云GPU上运行。小型开源：Mistral 7B、Llama 3.2 3B/8B——可在消费级硬件上运行（16GB RAM的MacBook可以运行这些），推理速度快，以低成本用于特定任务。”开源落后几年”的说法不再准确；在许多特定任务上，开源模型具有竞争力。

你实际上可以在本地运行什么

Ollama是在Mac、Windows或Linux上本地运行开源模型的最简单方法——一行安装，然后`ollama run llama3.2`或`ollama run mistral`启动模型。LM Studio提供本地模型管理的GUI。在带有Apple Silicon的MacBook（M1/M2/M3/M4）上：Llama 3.2 8B以每秒30-50个令牌运行（可读速度），Llama 3.3 70B以每秒5-10个令牌运行（可用），70B以上的模型需要比大多数消费级机器更多的RAM。本地模型的使用案例：隐私敏感任务、离线使用、API成本在大规模时prohibitive的应用程序。