README
1 分钟阅读
本文章属于专栏:AI知识
AI大模型面试宝典
全面覆盖 AI/LLM 面试核心知识点,包含八股文、技术深度和项目经验。
📚 目录结构
01-Transformer核心
- Transformer架构详解
- 注意力机制原理
- 位置编码技术
- LayerNorm & FFN
02-主流大模型
- GPT系列 (GPT-2/3/4)
- BERT及其变体
- LLaMA系列
- Qwen (通义千问)
- DeepSeek系列
- 多模态大模型 (GPT-4V, Qwen-VL, LLaVA) ⭐ 2025热点
- 长上下文技术 (RoPE外推, Ring Attention) ⭐ 2025热点
- 2025-2026技术趋势 (推理模型, MoE, Agent) ⭐ 必读
03-训练技术
- 预训练方法论
- 参数高效微调 (LoRA/QLoRA/Prefix Tuning)
- RLHF & 对齐技术
- SFT监督微调
- 数据工程
04-推理优化
- KV Cache原理与优化
- 模型量化 (INT8/INT4/GPTQ/AWQ)
- 模型剪枝与蒸馏
- 推理框架 (vLLM/TensorRT-LLM)
- FlashAttention原理
05-RAG系统
- RAG架构设计
- 向量数据库对比
- Embedding模型选择
- Chunking策略
- 检索优化 (HyDE/Rerank/多路召回)
- 评估与优化
06-Agent应用
- Function Calling机制
- Agent框架 (LangChain/AutoGPT)
- 任务规划 (ReAct/Plan-and-Execute)
- 多Agent协作
07-工程实践
- 分布式训练 (DDP/FSDP/DeepSpeed)
- 手撕代码题精选 ⭐ 面试必考
- 系统设计题精选 (RAG, Agent, 推理服务) ⭐ 高频考点
- 项目经验表达指南 (STAR法则) ⭐ 必读
- 混合精度训练
- 长文本处理
- Prompt Engineering
- 评估与安全
🎯 使用建议
- 按模块学习: 从基础的Transformer开始,逐步深入
- 重点突破: 2025热点 (推理模型、MoE、Agent) 必须掌握
- 手撕代码: 准备 Self-Attention、LoRA、KV Cache 实现
- 系统设计: 准备 RAG、Agent 系统设计方案
- 项目经验: 用 STAR 法则整理 2-3 个项目
- 持续更新: 关注最新的技术进展和面试趋势
📖 文档约定
- 高频考点: 用 🔥 标记
- 面试题: 用 Q: 标记
- 答案要点: 用 A: 标记
- 代码示例: 放在代码块中
- 图表: 用于对比和流程说明
开始学习: 01-Transformer核心