外观
一句话答案
通过语义缓存、模型级联(简单任务小模型/复杂任务大模型)、Prompt 压缩和批量 API 降低 LLM 调用成本。
核心要点
多维度检验方法:
1. 功能正确性
- 编写单元测试,覆盖正常情况、边界情况、异常情况
- 如果代码是某个片段,局部运行测试,不要等到集成才发现问题
2. 代码 Review
- 人工阅读,理解代码逻辑,不能"因为是 AI 生成的就信任"
- 关注:变量命名、方法职责单一性、异常处理完整性
3. 安全性检查
- SQL 拼接(注入风险)、日志中打印敏感信息、硬编码密码/密钥
- 可使用 SonarQube 等静态分析工具扫描
4. 性能检查
- 是否有不必要的全表扫描、N+1 查询、死循环风险
- 对高频调用路径的代码要格外关注
5. 一致性检查
- 是否符合项目已有的代码风格、架构约定(如分层设计、命名规范)
- AI 不了解你的项目约定,很容易生成"能跑但不符合规范"的代码
核心原则: AI 生成的代码是"有经验程序员的草稿",不是最终答案,必须走完整的 Review 和测试流程。
文档完
复习建议:
- RAG 和 Agent 是当前面试高频,每道题都要能流畅口述 2~3 分钟
- Q1(RAG 流程)、Q13(短/长期记忆)、Q15(MCP/Skill)是必背核心题
- 结合自己的项目经历讲,能举具体例子(如"我们项目中的召回率是 85%,通过 Rerank 提升到 92%")会让面试官印象深刻
追问与易错
追问方向:
- 这个概念在你的项目中是怎么应用的?
- 和相关技术/方案相比有什么优劣?
- 如果出了问题你会怎么排查?
易错点:
- ❌ 只知道概念不知道原理——面试官会追问底层实现
- ❌ 缺乏实际使用经验——结合项目场景回答更有说服力
💡 记忆锚点
LLM成本优化四板斧"缓级压批":语义缓存(相似问题复用答案,不重复调用),模型级联(简单问题用便宜小模型,复杂问题才上大模型,像分诊),Prompt压缩(精简输入token),批量API(合并请求降低调用次数)。AI生成的代码是"老程序员的草稿",必须Review+测试+安全扫描才能用。