2.5 预览与调试:完善你的智能体
为什么要调试?
再聪明的人设,第一次也很难做到完美。调试就是不断微调,让它越来越好的过程。
预览与对话测试
找到预览入口
在 Coze 平台,右侧就是预览对话窗口,可以直接和智能体对话测试。
标准测试流程
第1轮:正常提问 → 检查回答质量
↓
第2轮:追问 → 检查上下文理解
↓
第3轮:模糊提问 → 检查追问能力
↓
第4轮:不合理请求 → 检查边界把握
↓
第5轮:同类问题重复问 → 检查一致性测试用例示例(以教案助手为例)
| 测试轮次 | 你的输入 | 期望结果 |
|---|---|---|
| 正常提问 | "帮我设计七年级上册一元一次方程第一课时的教案" | 生成完整教案,格式规范 |
| 追问 | "教学过程能再详细一点吗?" | 在原基础上扩展,不是重写 |
| 模糊提问 | "帮我备课" | 反问:什么学科、年级、课题? |
| 不合理请求 | "帮我写一篇论文" | 礼貌拒绝或说明不在职责范围 |
| 一致性 | 再问一次同样的课题 | 两次回复质量和风格相近 |
常见问题与修复
问题一:回答太笼统
表现:内容泛泛而谈,没有具体操作建议。
修复方法:
- 在人设中添加具体要求
- 明确输出格式
- 举一个示例格式
修改前:生成一份教案
修改后:生成一份教案,包含以下部分:
1. 教学目标(知识目标、能力目标、情感目标各2条)
2. 教学重难点
3. 教学准备
4. 教学过程(导入10分钟、新授20分钟、练习10分钟、小结5分钟)
5. 板书设计
6. 作业布置(分层,A层基础题5道,B层拓展题2道)问题二:回答太长或太短
太长:
在人设中添加:"回复控制在800字以内,重点突出,不要长篇大论"太短:
在人设中添加:"每个部分都要详细展开,不要只写标题"问题三:风格不对
太正式:
在人设中添加:"语气像同事之间的交流,不要太官方"太随意:
在人设中添加:"保持专业性,使用规范的教育术语"问题四:不引用知识库内容
表现:明明上传了课标文件,回答中却没有引用。
修复方法:
- 在人设中明确:"请基于知识库中的课程标准内容回答"
- 检查知识库是否上传成功
- 检查知识库检索方式是否正确
调试记录表
建议每次调试都记录一下,方便对比:
| 日期 | 修改内容 | 测试效果 | 下次调整 |
|---|---|---|---|
| 5.20 | 初始人设 | 回答太笼统 | 增加格式要求 |
| 5.21 | 添加格式模板 | 格式对了,但太长 | 加字数限制 |
| 5.22 | 限制字数 | 长度合适,语气太正式 | 调整语气 |
迭代优化循环
测试 → 发现问题 → 修改人设/配置 → 再测试 → 验证修复 → (循环)一般经过 3-5 轮迭代,智能体就能达到比较理想的状态。
调试清单 ✅
发布前检查:
- [ ] 正常场景下能完成任务
- [ ] 模糊输入时会追问
- [ ] 不会输出不当内容
- [ ] 回复长度适中
- [ ] 回复风格符合预期
- [ ] 引用了知识库内容(如已配置)
- [ ] 插件功能正常(如已配置)
- [ ] 连续对话能记住上下文
上一章:2.4 能力编排:定制你的智能体 | 下一章:2.6 发布:分享与扩散你的智能体