外观
AI 与 LLM
知识脉络
AI与LLM
├── LLM 基础
│ ├── Transformer 架构
│ ├── 注意力机制
│ ├── Token/Embedding/位置编码
│ └── 模型推理与部署
├── RAG
│ ├── 检索增强生成原理
│ ├── 向量数据库(Milvus/Pinecone)
│ ├── Embedding 模型选型
│ ├── 分块策略(Chunking)
│ └── 召回与重排
├── Agent
│ ├── ReAct / Plan-and-Execute
│ ├── Tool Calling
│ ├── Multi-Agent 架构
│ └── 记忆机制
├── Prompt Engineering
│ ├── 提示词设计原则
│ ├── Few-shot / CoT / ToT
│ └── 结构化输出
├── 工程化
│ ├── LangChain / LlamaIndex
│ ├── MCP 协议
│ ├── 评测与优化
│ └── 成本控制
└── 微调与训练
├── SFT / RLHF / DPO
├── LoRA / QLoRA
└── 数据工程知识点清单
| # | 题目 | 频率 | 难度 | 状态 |
|---|---|---|---|---|
| 1 | RAG架构与实现 | 极高 | 进阶 | todo |
| 2 | Agent设计模式 | 极高 | 困难 | todo |
| 3 | Transformer架构 | 高 | 困难 | todo |
| 4 | 向量数据库选型 | 高 | 进阶 | todo |
| 5 | Embedding原理与选型 | 高 | 进阶 | todo |
| 6 | Prompt工程最佳实践 | 高 | 进阶 | todo |
| 7 | MCP协议原理 | 高 | 进阶 | todo |
| 8 | LLM推理优化 | 中 | 困难 | todo |
| 9 | RAG分块与召回策略 | 高 | 进阶 | todo |
| 10 | 多Agent协作架构 | 中 | 困难 | todo |
| 11 | LangChain核心概念 | 中 | 进阶 | todo |
| 12 | 大模型幻觉与缓解 | 高 | 进阶 | todo |
| 13 | LoRA微调原理 | 中 | 困难 | todo |
| 14 | LLM评测方法 | 中 | 进阶 | todo |
| 15 | AI应用成本优化 | 中 | 进阶 | todo |
口诀速记
- RAG流程: "切分→嵌入→存储→检索→重排→生成"
- Agent: "感知→思考→行动→观察(ReAct循环)"
- Transformer: "自注意力+多头+前馈+残差+LayerNorm"
- 选型: "简单用RAG,复杂用Agent,精确用微调"
跨域关联
- 向量数据库 → Redis数据结构与底层实现(Redis - 近似最近邻)
- Agent → 设计模式-策略模式(设计模式)
- 工程化 → 微服务拆分原则(微服务)
- 部署 → Docker核心概念(DevOps)