表格
模型 | 参数量 | 开发者 | 核心优势 | 主要短板 |
|---|---|---|---|---|
Qwen3-0.6B | 0.6B | 阿里通义 | 极致轻量,CPU可跑,双模式推理 | 能力上限低,复杂任务乏力 |
Gemma2-27B | 27B | 英文强,生态好,Apache 2.0许可 | 中文弱,资源消耗大 | |
Mistral-Nemo-12B | 12B | Mistral/Meta | 欧洲合规,多语言均衡 | 社区支持弱于Llama |
Llama-4-7B | 7B | Meta | 全球生态最强,工具链成熟 | 中文能力一般,需微调 |
Qwen3-8B | 8B | 阿里通义 | 中文王者,长文本(32K),开箱即用 | 国际影响力待提升 |
GLM-Z1-9B-0414 | 9B | 智谱AI | 数学/代码推理突出,企业级优化 | 通用对话稍显生硬 |
DeepSeek-V3.2 | ~67B (MoE) | 深度求索 | 推理≈GPT-5,Agent能力登顶开源 | 对硬件要求高 |
Claude-Sonnet-4.6 | - | Anthropic | 闭源但API可用,稳定可靠,长文本处理 | 非完全开源,成本较高 |
Kimi-K2.5 | ~1000B (MoE) | 月之暗面 | 超长上下文(200K+),多模态领先 | 模型体积巨大,部署复杂 |
Grok-4.1 | - | xAI | 幽默感强,实时数据接入 | 开源程度有限,稳定性待考 |
