Skip to content

AI 与 LLM

知识脉络

AI与LLM
├── LLM 基础
│   ├── Transformer 架构
│   ├── 注意力机制
│   ├── Token/Embedding/位置编码
│   └── 模型推理与部署
├── RAG
│   ├── 检索增强生成原理
│   ├── 向量数据库(Milvus/Pinecone)
│   ├── Embedding 模型选型
│   ├── 分块策略(Chunking)
│   └── 召回与重排
├── Agent
│   ├── ReAct / Plan-and-Execute
│   ├── Tool Calling
│   ├── Multi-Agent 架构
│   └── 记忆机制
├── Prompt Engineering
│   ├── 提示词设计原则
│   ├── Few-shot / CoT / ToT
│   └── 结构化输出
├── 工程化
│   ├── LangChain / LlamaIndex
│   ├── MCP 协议
│   ├── 评测与优化
│   └── 成本控制
└── 微调与训练
    ├── SFT / RLHF / DPO
    ├── LoRA / QLoRA
    └── 数据工程

知识点清单

#题目频率难度状态
1RAG架构与实现极高进阶todo
2Agent设计模式极高困难todo
3Transformer架构困难todo
4向量数据库选型进阶todo
5Embedding原理与选型进阶todo
6Prompt工程最佳实践进阶todo
7MCP协议原理进阶todo
8LLM推理优化困难todo
9RAG分块与召回策略进阶todo
10多Agent协作架构困难todo
11LangChain核心概念进阶todo
12大模型幻觉与缓解进阶todo
13LoRA微调原理困难todo
14LLM评测方法进阶todo
15AI应用成本优化进阶todo

口诀速记

  • RAG流程: "切分→嵌入→存储→检索→重排→生成"
  • Agent: "感知→思考→行动→观察(ReAct循环)"
  • Transformer: "自注意力+多头+前馈+残差+LayerNorm"
  • 选型: "简单用RAG,复杂用Agent,精确用微调"

跨域关联