// docs / models
模型配置
三层模型配置系统,支持全局默认、请求级覆盖和步骤级覆盖。 兼容任何 OpenAI-compatible API 提供商。
三层优先级
模型选择按以下优先级从高到低解析:
// 优先级 1:步骤级覆盖(最高)
setStepModel("page_implement_agent", "gpt-5.2")
// 优先级 2:请求级覆盖
setRuntimeModelId("gemini-3.1-pro-preview")
// 优先级 3:全局默认(最低)
DEFAULT_MODEL = "gemini-3-flash-preview"
→ 环境变量 OPENAI_MODEL 可覆盖
// Modify Agent 默认(可与生成不同)
MODIFY_DEFAULT_MODEL = "claude-opus-4-6" // 或由 MODIFY_MODEL 覆盖
function getModelForStep(stepName: string): ModelId {
return getStepModel(stepName) // 步骤级
?? getModelId(); // 请求级 → 全局默认
}内置模型
| 模型 ID | 显示名称 | 上下文窗口 |
|---|---|---|
| gemini-3-flash-preview | Gemini 3 Flash | 128K |
| gemini-3.1-pro-preview | Gemini 3.1 Pro | 128K |
| gpt-5.2 | GPT-5.2 | 128K |
默认模型为 gemini-3-flash-preview,兼顾速度和质量。 用户可以在前端的模型选择器中切换。
步骤级配置
每个生成步骤都可以独立配置模型:
| 步骤 ID | 说明 |
|---|---|
| analyze_project_requirement | 需求分析(Blueprint) |
| infer_design_intent | 风格 / 技术关键词推断 |
| plan_project | 站点与页面规划 |
| generate_project_design_system | Style Reference 设计系统 Markdown |
| apply_project_design_tokens | globals.css Token |
| architect_scaffold_agent | Chrome 快速搭壳 |
| chrome_optimize_agent | Chrome 精修(路由/锚点) |
| page_implement_agent | 单页工具闭环实现 |
| preselect_skills | Hero 等场景的内部 skill 选型(复用步骤 id) |
| repair_build | 构建失败修复 Agent |
推荐策略
不同步骤对模型能力的需求不同。推荐的配置策略是:
analyze + infer + plan + design_system + architect强模型理解与结构设计成本高,错误代价大
page_implement_agent(多页并行)快模型或均衡模型调用次数与迭代深度最大,需在质量与延迟间权衡
repair_build强模型需读懂编译日志并精确改文件
多页场景下,每个 slug 各有一套
page_implement_agent 会话;将快模型配给该步骤通常比配给已移除的 generate_section 批量路径更能缩小墙钟时间。自定义模型
通过 model_configs 表可以添加任意 OpenAI-compatible 模型。 添加后会出现在前端的模型选择器中。
interface ModelConfig {
id: string;
displayName: string;
contextWindow: number;
supportsThinking?: boolean; // 网关可按模型能力开启 reasoning
}步骤级覆盖持久化在 step_model_configs 表(含可选 thinking_level 列),启动生成前由 loadStepModelsFromDB() 装载。
由于使用原生 fetch 而非 OpenAI SDK,只要提供商兼容 /chat/completions 接口, 就可以无缝接入 — 包括 Gemini、Anthropic(via proxy)、本地 Ollama 等。