模型选择指南
本文档将帮助您了解 NekroAgent 中的不同场景下最适合使用的模型,并提供详细的性能、价格和适用性分析。目前主要提供 NekroAgent 合作中转 供应的模型选择信息,后续会逐步增加其他来源模型。
评级说明
在推荐模型中,我们使用以下评级标准:
评级 | 对应等级 | 说明 |
---|---|---|
👑 | ⭐⭐⭐⭐⭐ | 极佳 |
🥇 | ⭐⭐⭐⭐ | 优秀 |
🥈 | ⭐⭐⭐ | 良好 |
🥉 | ⭐⭐ | 一般 |
⚪ | ⭐ | 较差 |
注意
以下推荐结果仅供参考,不同来源的相同模型可能因渠道转化策略、配置设定不同、并发情况、即时状态等原因,其最终性能可能存在差异,我们鼓励您根据实际使用情况多方尝试包括不在以下表单中的模型,选择最适合您的模型!
以下量表中的模型来自 NekroAgent 合作中转 - 可用模型列表,如果您认为以下量表与实际体验有较大差异,欢迎联系我们反馈,我们将持续维护并更新量表以更符合实际体验
NekroAgent 主应用
聊天对话流程
NekroAgent 的聊天会话流程 (不包括插件功能) 主要受到三个配置项影响,分别是 主模型组(USE_MODEL_GROUP)
、调试/Agent 迁移模型组(DEBUG_MIGRATION_MODEL_GROUP)
和 备用模型组(FALLBACK_MODEL_GROUP)
,具体调度策略为:
- 一次对话流程开始时,先使用
主模型组
中的模型进行生成 - 当
主模型组
生成的代码触发了 Agent 类型方法,或者产生程序报错时,本次流程的后续调用均使用调试/Agent 迁移模型组
中的模型进行迭代 - 如果
主模型组
或调试/Agent 迁移模型组
任一模型调用失败,则使用备用模型组
中的模型进行生成 - 如果
备用模型组
也调用失败,则本次响应流程以失败结束
以下是 聊天对话流程 中推荐使用的模型列表: 排序按首字母顺序 排名不分先后 本列表更新2025年5月17日
模型名称 | 质量 | 速度 | 稳定 | 性价比 | 视觉 | 内置思维 | 备注 |
---|---|---|---|---|---|---|---|
claude-3-7-sonnet-latest | 👑 | 🥈 | 🥈 | 🥈 | 👁️ | ❌ | Anthropic 的最新主力模型,综合能力最强但供应有限,适合主力模型 |
claude-3-5-sonnet-latest | 🥇 | 🥈 | 🥇 | 🥉 | 👁️ | ❌ | Anthropic 的上代主力模型 |
claude-3-5-haiku-20241022 | 🥈 | 🥇 | 🥇 | 🥉 | 👁️ | ❌ | Anthropic 的上代模型,对标 gpt-4o-mini 水平 |
deepseek-chat (v3) | 🥇 | 🥉 | 🥇 | 🥈 | ❌ | ❌ | 经典的国产模型、中文能力优秀、语言风格鲜明 |
doubao-1.5-vision-pro-32k-250115 | 🥈 | 🥈 | 👑 | 🥈 | 👁️ | ❌ | 字节提供的国产模型、稳定性较好、多模态能力强、价格稳定、适合备用模型 |
gemini-2.5-pro-exp-03-25 | 👑 | 🥇 | 🥈 | 🥈 | 👁️ | ❌ | 综合体验最佳,语言能力、逻辑能力各方面性能均较好,适合主力模型 |
gemini-2.5-pro-exp-03-25-thinking | 👑 | 🥉 | 🥈 | 🥈 | 👁️ | 🧠 | 建议关闭外置思维链使用,速度会因思考长度有较大波动 |
gemini-2.5-flash-preview-04-17 | 🥇 | 🥇 | 🥇 | 👑 | 👁️ | ❌ | 性价比较高,速度较快,拥有均衡的逻辑能力与语言能力,适合主力模型 |
gemini-2.5-flash-preview-04-17-thinking | 🥇 | 🥈 | 🥉 | 👑 | 👁️ | 🧠 | 速度稍快的内置思维模型,生成质量较高但生成速度波动大 |
gemini-2.0-flash | 🥈 | 👑 | 🥇 | 🥇 | 👁️ | ❌ | 极低成本且快速的小模型,建议搭配外置思维链使用,也可作为迭代模型使用 |
gpt-4o | 🥇 | 🥈 | 🥇 | 🥈 | 👁️ | ❌ | GPT 生成的 AI 味较重,适合生产力使用 |
gpt-4o-mini | 🥈 | 🥈 | 🥇 | 🥇 | 👁️ | ❌ | GPT 生成的 AI 味较重,适合生产力使用 |
grok-3 | 🥈 | 🥈 | 🥇 | 🥉 | 👁️ | ❌ | xAI推出的语言模型,限制较少,AI 味较低,适合用于对话 |
注意:
- 在 NekroAgent 中对话流程首次使用的模型 (一般是主模型) 的
外置思维链
开关会影响到后续本次对话流程的思维链使用情况,例如主模型开启外置思维链
,迭代/调试模型也会产生开启外置思维链
的效果 - 通常来说支持
内置思维
的模型不推荐开启外置思维链
,否则可能会降低模型生成速度 - 由于提示词迭代机制实现,不推荐混用
支持视觉
和不支持视觉
的模型,否则可能导致请求格式出错
插件开发
NekroAgent 的 插件编辑器 中的生成修改建议模型使用 插件代码生成模型组(PLUGIN_GENERATE_MODEL_GROUP)
,用来为用户的需求生成代码解决方案,推荐使用强编码能力、高质量的模型,以下是推荐模型列表:
模型名称 | 质量 | 速度 | 稳定 | 性价比 | 视觉 | 思维 | 备注 |
---|---|---|---|---|---|---|---|
claude-3-7-sonnet-20250219-thinking | 👑 | 🥈 | 🥈 | 🥈 | 👁️ | 🧠 | Anthropic 的最新高质量主力编码模型 |
claude-3-7-sonnet-20250219 | 🥇 | 🥇 | 🥈 | 🥈 | 👁️ | ❌ | Anthropic 的最新高质量主力编码模型 |
gemini-2.5-pro-exp-03-25-thinking | 👑 | 🥉 | 🥈 | 🥉 | 👁️ | 🧠 | 谷歌最新高质量主力模型,编程领域表现尚可 |
gemini-2.5-pro-exp-03-25 | 🥇 | 🥇 | 🥈 | 🥈 | 👁️ | ❌ | 谷歌最新高质量主力模型,编程领域表现尚可 |
在生成模型生成修改建议后,我们还需要通过 插件代码应用模型组(PLUGIN_APPLY_MODEL_GROUP)
来在当前插件编辑器中应用修改建议,推荐使用强提示词遵循能力、生成速度快的模型,以下是推荐模型列表:
模型名称 | 质量 | 速度 | 稳定 | 性价比 | 视觉 | 思维 | 备注 |
---|---|---|---|---|---|---|---|
gemini-2.0-flash | 🥈 | 👑 | 🥇 | 🥈 | 👁️ | ❌ |
内置插件
表情包插件
表情包插件需要使用一个 向量嵌入模型
来提供表情包搜索能力,强烈建议使用 text-embedding-v3
模型:
模型名称 | 质量 | 速度 | 稳定 | 性价比 | 视觉 | 维度 | 备注 |
---|---|---|---|---|---|---|---|
text-embedding-v3 | 👑 | 👑 | 👑 | 👑 | ❌ | 1024 | 阿里云提供的非常便宜且高效的文本嵌入模型 |
multimodal-embedding-v1 | 👑 | 🥇 | 👑 | 👑 | ✅ | 1024 | 阿里云提供的多模态嵌入模型,但对输入限制较多,仅推荐特殊用途使用 |
绘图 (学会画画)
绘图插件支持 OpenAI 标准绘图 API (例如 DALL-E 3) 和任意支持对话生成图像的 OpenAI 聊天补全 API,以下是推荐模型列表:
模型名称 | 质量 | 速度 | 稳定 | 性价比 | 图生图 | 格式 | 备注 |
---|---|---|---|---|---|---|---|
gemini-2.0-flash-exp-image-generation | 🥇 | 🥇 | 🥈 | 🥇 | ✅ | 聊天模式 | Gemini 2.0 绘图模型 |
sora_image | 👑 | ⚪ | 🥇 | 🥈 | ✅ | 聊天模式 | 与 ChatGPT 官网 4o 绘图一致,遵从度高但非常慢 |
Kolors | 🥈 | 👑 | 👑 | 🥇 | ✅ | 图像生成模式 | 国内绘图模型,画风单一且偏 CG 风格 |
注意事项
- 模型性能可能会随时间更新而变化
- 价格信息仅供参考,实际价格请以官方报价为准
- 建议根据实际使用情况定期评估模型选择
重要提示
在使用任何生成式人工智能服务时,请务必注意遵守相关服务条款和法律法规