AI应用成本优化 | Java后端面试知识库

一句话答案

通过语义缓存、模型级联（简单任务小模型/复杂任务大模型）、Prompt 压缩和批量 API 降低 LLM 调用成本。

核心要点

多维度检验方法：

1. 功能正确性

编写单元测试，覆盖正常情况、边界情况、异常情况
如果代码是某个片段，局部运行测试，不要等到集成才发现问题

2. 代码 Review

人工阅读，理解代码逻辑，不能"因为是 AI 生成的就信任"
关注：变量命名、方法职责单一性、异常处理完整性

3. 安全性检查

SQL 拼接（注入风险）、日志中打印敏感信息、硬编码密码/密钥
可使用 SonarQube 等静态分析工具扫描

4. 性能检查

是否有不必要的全表扫描、N+1 查询、死循环风险
对高频调用路径的代码要格外关注

5. 一致性检查

是否符合项目已有的代码风格、架构约定（如分层设计、命名规范）
AI 不了解你的项目约定，很容易生成"能跑但不符合规范"的代码

核心原则： AI 生成的代码是"有经验程序员的草稿"，不是最终答案，必须走完整的 Review 和测试流程。

文档完

复习建议：
RAG 和 Agent 是当前面试高频，每道题都要能流畅口述 2~3 分钟
Q1（RAG 流程）、Q13（短/长期记忆）、Q15（MCP/Skill）是必背核心题
结合自己的项目经历讲，能举具体例子（如"我们项目中的召回率是 85%，通过 Rerank 提升到 92%"）会让面试官印象深刻

追问与易错

追问方向：

这个概念在你的项目中是怎么应用的？
和相关技术/方案相比有什么优劣？
如果出了问题你会怎么排查？

易错点：

❌ 只知道概念不知道原理——面试官会追问底层实现
❌ 缺乏实际使用经验——结合项目场景回答更有说服力

💡 记忆锚点

LLM成本优化四板斧"缓级压批"：语义缓存（相似问题复用答案，不重复调用），模型级联（简单问题用便宜小模型，复杂问题才上大模型，像分诊），Prompt压缩（精简输入token），批量API（合并请求降低调用次数）。AI生成的代码是"老程序员的草稿"，必须Review+测试+安全扫描才能用。

一句话答案 ​

一句话答案