Skip to content
进阶

一句话答案

通过语义缓存、模型级联(简单任务小模型/复杂任务大模型)、Prompt 压缩和批量 API 降低 LLM 调用成本。

核心要点

多维度检验方法:

1. 功能正确性

  • 编写单元测试,覆盖正常情况、边界情况、异常情况
  • 如果代码是某个片段,局部运行测试,不要等到集成才发现问题

2. 代码 Review

  • 人工阅读,理解代码逻辑,不能"因为是 AI 生成的就信任"
  • 关注:变量命名、方法职责单一性、异常处理完整性

3. 安全性检查

  • SQL 拼接(注入风险)、日志中打印敏感信息、硬编码密码/密钥
  • 可使用 SonarQube 等静态分析工具扫描

4. 性能检查

  • 是否有不必要的全表扫描、N+1 查询、死循环风险
  • 对高频调用路径的代码要格外关注

5. 一致性检查

  • 是否符合项目已有的代码风格、架构约定(如分层设计、命名规范)
  • AI 不了解你的项目约定,很容易生成"能跑但不符合规范"的代码

核心原则: AI 生成的代码是"有经验程序员的草稿",不是最终答案,必须走完整的 Review 和测试流程。

文档完

复习建议:

  1. RAG 和 Agent 是当前面试高频,每道题都要能流畅口述 2~3 分钟
  2. Q1(RAG 流程)、Q13(短/长期记忆)、Q15(MCP/Skill)是必背核心题
  3. 结合自己的项目经历讲,能举具体例子(如"我们项目中的召回率是 85%,通过 Rerank 提升到 92%")会让面试官印象深刻
追问与易错

追问方向:

  • 这个概念在你的项目中是怎么应用的?
  • 和相关技术/方案相比有什么优劣?
  • 如果出了问题你会怎么排查?

易错点:

  • ❌ 只知道概念不知道原理——面试官会追问底层实现
  • ❌ 缺乏实际使用经验——结合项目场景回答更有说服力

💡 记忆锚点

LLM成本优化四板斧"缓级压批":语义缓存(相似问题复用答案,不重复调用),模型级联(简单问题用便宜小模型,复杂问题才上大模型,像分诊),Prompt压缩(精简输入token),批量API(合并请求降低调用次数)。AI生成的代码是"老程序员的草稿",必须Review+测试+安全扫描才能用。