Minimal Blog

README

2026年05月29日1 分钟阅读

本文章属于专栏：AI知识

AI大模型面试宝典

全面覆盖 AI/LLM 面试核心知识点，包含八股文、技术深度和项目经验。

📚 目录结构

01-Transformer核心

Transformer架构详解
注意力机制原理
位置编码技术
LayerNorm & FFN

02-主流大模型

GPT系列 (GPT-2/3/4)
BERT及其变体
LLaMA系列
Qwen (通义千问)
DeepSeek系列
多模态大模型 (GPT-4V, Qwen-VL, LLaVA) ⭐ 2025热点
长上下文技术 (RoPE外推, Ring Attention) ⭐ 2025热点
2025-2026技术趋势 (推理模型, MoE, Agent) ⭐ 必读

03-训练技术

预训练方法论
参数高效微调 (LoRA/QLoRA/Prefix Tuning)
RLHF & 对齐技术
SFT监督微调
数据工程

04-推理优化

KV Cache原理与优化
模型量化 (INT8/INT4/GPTQ/AWQ)
模型剪枝与蒸馏
推理框架 (vLLM/TensorRT-LLM)
FlashAttention原理

05-RAG系统

RAG架构设计
向量数据库对比
Embedding模型选择
Chunking策略
检索优化 (HyDE/Rerank/多路召回)
评估与优化

06-Agent应用

Function Calling机制
Agent框架 (LangChain/AutoGPT)
任务规划 (ReAct/Plan-and-Execute)
多Agent协作

07-工程实践

分布式训练 (DDP/FSDP/DeepSpeed)
手撕代码题精选 ⭐ 面试必考
系统设计题精选 (RAG, Agent, 推理服务) ⭐ 高频考点
项目经验表达指南 (STAR法则) ⭐ 必读
混合精度训练
长文本处理
Prompt Engineering
评估与安全

🎯 使用建议

按模块学习: 从基础的Transformer开始，逐步深入
重点突破: 2025热点 (推理模型、MoE、Agent) 必须掌握
手撕代码: 准备 Self-Attention、LoRA、KV Cache 实现
系统设计: 准备 RAG、Agent 系统设计方案
项目经验: 用 STAR 法则整理 2-3 个项目
持续更新: 关注最新的技术进展和面试趋势

📖 文档约定

高频考点: 用 🔥 标记
面试题: 用 Q: 标记
答案要点: 用 A: 标记
代码示例: 放在代码块中
图表: 用于对比和流程说明

开始学习: 01-Transformer核心