README

1 分钟阅读

本文章属于专栏:AI知识

AI大模型面试宝典

全面覆盖 AI/LLM 面试核心知识点,包含八股文、技术深度和项目经验。

📚 目录结构

01-Transformer核心

  • Transformer架构详解
  • 注意力机制原理
  • 位置编码技术
  • LayerNorm & FFN

02-主流大模型

  • GPT系列 (GPT-2/3/4)
  • BERT及其变体
  • LLaMA系列
  • Qwen (通义千问)
  • DeepSeek系列
  • 多模态大模型 (GPT-4V, Qwen-VL, LLaVA) ⭐ 2025热点
  • 长上下文技术 (RoPE外推, Ring Attention) ⭐ 2025热点
  • 2025-2026技术趋势 (推理模型, MoE, Agent) ⭐ 必读

03-训练技术

  • 预训练方法论
  • 参数高效微调 (LoRA/QLoRA/Prefix Tuning)
  • RLHF & 对齐技术
  • SFT监督微调
  • 数据工程

04-推理优化

  • KV Cache原理与优化
  • 模型量化 (INT8/INT4/GPTQ/AWQ)
  • 模型剪枝与蒸馏
  • 推理框架 (vLLM/TensorRT-LLM)
  • FlashAttention原理

05-RAG系统

  • RAG架构设计
  • 向量数据库对比
  • Embedding模型选择
  • Chunking策略
  • 检索优化 (HyDE/Rerank/多路召回)
  • 评估与优化

06-Agent应用

  • Function Calling机制
  • Agent框架 (LangChain/AutoGPT)
  • 任务规划 (ReAct/Plan-and-Execute)
  • 多Agent协作

07-工程实践

  • 分布式训练 (DDP/FSDP/DeepSpeed)
  • 手撕代码题精选 ⭐ 面试必考
  • 系统设计题精选 (RAG, Agent, 推理服务) ⭐ 高频考点
  • 项目经验表达指南 (STAR法则) ⭐ 必读
  • 混合精度训练
  • 长文本处理
  • Prompt Engineering
  • 评估与安全

🎯 使用建议

  1. 按模块学习: 从基础的Transformer开始,逐步深入
  2. 重点突破: 2025热点 (推理模型、MoE、Agent) 必须掌握
  3. 手撕代码: 准备 Self-Attention、LoRA、KV Cache 实现
  4. 系统设计: 准备 RAG、Agent 系统设计方案
  5. 项目经验: 用 STAR 法则整理 2-3 个项目
  6. 持续更新: 关注最新的技术进展和面试趋势

📖 文档约定

  • 高频考点: 用 🔥 标记
  • 面试题: 用 Q: 标记
  • 答案要点: 用 A: 标记
  • 代码示例: 放在代码块中
  • 图表: 用于对比和流程说明

开始学习: 01-Transformer核心