模型选择指南

本文档将帮助您了解 NekroAgent 中的不同场景下最适合使用的模型，并提供详细的性能、价格和适用性分析。目前主要提供 NekroAgent 官方中转供应的模型选择信息，后续会逐步增加其他来源模型。

评级说明

在推荐模型中，我们使用以下评级标准：

评级	对应等级	说明
👑	⭐⭐⭐⭐⭐	极佳
🥇	⭐⭐⭐⭐	优秀
🥈	⭐⭐⭐	良好
🥉	⭐⭐	一般
⚪	⭐	较差

注意

以下推荐结果仅供参考，不同来源的相同模型可能因渠道转化策略、配置设定不同、并发情况、即时状态等原因，其最终性能可能存在差异，我们鼓励您根据实际使用情况多方尝试包括不在以下表单中的模型，选择最适合您的模型！

以下量表中的模型来自 NekroAgent 官方中转 - 可用模型列表，如果您认为以下量表与实际体验有较大差异，欢迎联系我们反馈，我们将持续维护并更新量表以更符合实际体验

部分模型 弃用 & 停用 请查看模型弃用

NekroAgent 主应用

聊天对话流程

NekroAgent 的聊天会话流程 (不包括插件功能) 主要受到三个配置项影响，分别是 主模型组(USE_MODEL_GROUP)、调试/Agent 迁移模型组(DEBUG_MIGRATION_MODEL_GROUP) 和 备用模型组(FALLBACK_MODEL_GROUP)，具体调度策略为:

一次对话流程开始时，先使用 主模型组 中的模型进行生成
当 主模型组 生成的代码触发了 Agent 类型方法，或者产生程序报错时，本次流程的后续调用均使用 调试/Agent 迁移模型组 中的模型进行迭代
如果 主模型组 或 调试/Agent 迁移模型组 任一模型调用失败，则使用 备用模型组 中的模型进行生成
如果 备用模型组 也调用失败，则本次响应流程以失败结束

以下是 聊天对话流程 中推荐使用的模型列表:

本列表更新 2026 年 4 月 18 日

模型名称	质量	速度	稳定	性价比	视觉	内置思维	备注
claude-4-5-sonnet-latest	👑	🥈	🥈	🥈	👁️	❌	Anthropic 的最新主力模型，综合能力最强但供应有限，适合主力模型
gemini-3.1-pro-preview	👑	🥈	🥇	🥉	👁️	🧠	谷歌 3.1 代高质量主力模型，目前性能最顶尖，支持思考签名和思考等级 ⚠️ 预览版模型
gemini-3-flash-preview	🥇	🥇	🥇	👑	👁️	❌	综合体验极佳的平衡型模型，速度快且逻辑能力强，建议作为主力模型使用
gemini-2.5-pro	🥇	🥇	🥇	🥈	👁️	🧠	逻辑能力稳定，具备自适应思考能力 ⚠️ 预计于 2026 年 6 月 17 日停用
gpt-4.1	🥇	🥈	🥇	🥈	👁️	❌	GPT 系列较新主力模型，AI 特征较明显，逻辑能力尚可
gemini-3.1-flash-lite-preview	🥈	👑	🥇	👑	👁️	❌	极速小模型，推理成本极低，适合简单任务或快速迭代 ⚠️ 预览版模型
claude-4-5-haiku	🥈	🥇	🥇	🥉	👁️	❌	Anthropic 的快速模型，适合对生成风格有特定要求的场景
gemini-2.5-flash	🥇	🥇	🥇	👑	👁️	❌	性价比较高，即将被 gemini-3-flash 替代 ⚠️ 预计于 2026 年 6 月 17 日停用
deepseek-chat (v3)	🥇	🥉	🥇	🥈	❌	❌	经典的国产模型、中文能力优秀、语言风格鲜明
doubao-1.5-vision-pro-32k-250115	🥈	🥈	👑	🥈	👁️	❌	字节提供的国产模型、稳定性极佳、多模态能力强、适合备用模型
gemini-2.0-flash	🥈	👑	🥇	🥇	👁️	❌	极低成本的小模型 ⚠️ 预计于 2026 年 6 月 1 日停用
gpt-4o	🥇	🥈	🥇	🥈	👁️	❌	生产力场景常用模型，API 稳定性高
gpt-4o-mini	🥈	🥈	🥇	🥇	👁️	❌	经典的 GPT 系列小模型
grok-3	🥈	🥈	🥇	🥉	👁️	❌	xAI 推出的语言模型，个性鲜明，AI 味较低

注意:

在 NekroAgent 中对话流程首次使用的模型 (一般是主模型) 的 外置思维链 开关会影响到后续本次对话流程的思维链使用情况，例如主模型开启 外置思维链，迭代/调试模型也会产生 开启外置思维链 的效果
通常来说支持 内置思维 的模型不推荐开启 外置思维链，否则可能会降低模型生成速度
由于提示词迭代机制实现，不推荐混用 支持视觉 和 不支持视觉 的模型，否则可能导致请求格式出错

插件开发

NekroAgent 的 插件编辑器 中的生成修改建议模型使用 插件代码生成模型组(PLUGIN_GENERATE_MODEL_GROUP)，用来为用户的需求生成代码解决方案，推荐使用强编码能力、高质量的模型，以下是推荐模型列表:

模型名称	质量	速度	稳定	性价比	视觉	思维	备注
claude-4-5	👑	🥈	🥈	🥈	👁️	🧠	Anthropic 的最新高质量主力编码模型
gemini-3.1-pro-preview	👑	🥈	🥇	🥉	👁️	🧠	谷歌最新一代主力模型，编程领域表现极佳，逻辑极其严密 ⚠️ 预览版模型
gemini-2.5-pro	🥇	🥇	🥇	🥈	👁️	🧠	经典主力模型，编程能力稳定，支持自适应思考 ⚠️ 预计于 2026 年 6 月 17 日停用

在生成模型生成修改建议后，我们还需要通过 插件代码应用模型组(PLUGIN_APPLY_MODEL_GROUP) 来在当前插件编辑器中应用修改建议，推荐使用强提示词遵循能力、生成速度快的模型，以下是推荐模型列表:

模型名称	质量	速度	稳定	性价比	视觉	思维	备注
gemini-3-flash-preview	🥇	👑	🥇	👑	👁️	❌	推荐的快速逻辑应用模型
gemini-2.5-flash	🥈	👑	🥇	🥈	👁️	❌	⚠️ 预计于 2026 年 6 月 17 日停用

内置插件

表情包插件

表情包插件需要使用一个 向量嵌入模型 来提供表情包搜索能力，强烈建议使用 text-embedding-v3 模型:

模型名称	质量	速度	稳定	性价比	视觉	维度	备注
text-embedding-v3	👑	👑	👑	👑	❌	1024	阿里云提供的非常便宜且高效的文本嵌入模型
multimodal-embedding-v1	👑	🥇	👑	👑	✅	1024	阿里云提供的多模态嵌入模型，但对输入限制较多，仅推荐特殊用途使用

绘图 (学会画画)

绘图插件支持 OpenAI 标准绘图 API (例如 DALL-E 3) 和任意支持对话生成图像的 OpenAI 聊天补全 API，以下是推荐模型列表:

模型名称	质量	速度	稳定	性价比	图生图	格式	备注
gemini-3.1-flash-image-preview	👑	🥇	🥇	🥇	✅	聊天模式	Gemini 3.1 绘图模型，具备极高的理解能力与视觉质量
gemini-3-pro-image-preview	👑	🥇	🥈	🥉	✅	聊天模式	Gemini 3 旗舰绘图模型，细节表现丰富
sora_image	🥇	⚪	🥇	🥈	✅	聊天模式	与 ChatGPT 官网 4o 绘图一致，逻辑遵循好但速度较慢
Kolors	🥈	👑	👑	🥇	✅	图像生成模式	国内经典绘图模型，适合 CG 风格任务

注意事项

模型性能可能会随时间更新而变化
价格信息仅供参考，实际价格请以官方报价为准
建议根据实际使用情况定期评估模型选择
实验性模型（exp/preview）：这些模型为实验性质，可能随时更新或关闭，建议：
- 定期关注 Google Gemini API 版本说明获取最新更新
- 生产环境使用时应准备备用方案
- 优先考虑使用稳定版（GA）模型
- 部分预览版模型会自动重定向到稳定版，建议直接使用稳定版模型名称以避免重定向带来的延迟
模型重定向：部分已关闭的预览版模型会自动重定向到对应的稳定版，例如：
- gemini-3-pro-preview → gemini-3.1-pro-preview
- gemini-2.5-flash-image-preview → gemini-3.1-flash-image-preview
- gemini-2.5-pro-preview-06-05 → gemini-2.5-pro

重要提示

在使用任何生成式人工智能服务时，请务必注意遵守相关服务条款和法律法规

适配器配置

插件核心概念

高级功能

模型选择指南

评级说明

NekroAgent 主应用

聊天对话流程

插件开发

内置插件

表情包插件

绘图 (学会画画)

注意事项

模型选择指南 ​

评级说明 ​

NekroAgent 主应用 ​

聊天对话流程 ​

插件开发 ​

内置插件 ​

表情包插件 ​

绘图 (学会画画) ​

注意事项 ​

模型选择指南

评级说明

NekroAgent 主应用

聊天对话流程

插件开发

内置插件

表情包插件

绘图 (学会画画)

注意事项