AI职业学习路径指南 — 从入门到精通

岗位	⭐ 精通	📖 理解	👀 浅读	➖ 可不读	📚 需学习	⏱️ 总时间
🔬AI算法研究员	137	521	630	164	1288	251h15m
🏗️大模型训练/部署工程师	441	267	586	158	1294	336h5m
⚙️AI应用开发工程师	309	339	652	152	1300	293h35m
📝NLP算法工程师	189	432	572	259	1193	250h10m
👁️计算机视觉工程师	118	243	879	212	1240	193h0m

🔬

AI算法研究员

AI Research Scientist

专注于AI前沿算法研究、模型创新与理论突破。需要深厚数学功底与扎实的机器学习/深度学习理论基础，是推动AI技术边界的中坚力量。

🎯 核心职能

设计并实现新型神经网络架构与训练算法
研究大模型预训练、微调、对齐等核心技术
探索多模态融合、强化学习、图神经网络等前沿方向
发表学术论文，推动AI理论发展
将研究成果转化为可落地的技术方案

💼 典型岗位

算法研究员 · Research Scientist · AI Scientist · 研究型工程师

💰 薪资范围

40-100万/年
资深可达200万+

📊 市场需求

极高（大厂核心岗，供给稀缺）

📊 学习内容画像

共 1452 篇内容，需要学习 1288 篇（89%），预计总学习时间约 251小时15分钟

⭐ 精通

137篇 (9.4%)

≈ 68h30m

📖 理解

521篇 (35.9%)

≈ 130h15m

👀 浅读

630篇 (43.4%)

≈ 52h30m

➖ 可不读：164 篇（11.3%）— 与本岗位相关性较低的内容

🗺️ 学习路径引导

以下是为此岗位量身定制的分阶段学习路径，建议按顺序推进。每个阶段标注了预计耗时和重点内容。

1

第一阶段：数学基础（2-3周）

线性代数（全部精通）
概率论与数理统计（全部精通）
信息论基础（全部精通）
最优化理论（全部精通）
微积分（链式法则、梯度下降精通）

💡 数学是算法研究的语言，建议投入充足时间，配合习题巩固。推荐资源：《线性代数及其应用》Strang、《概率论基础教程》Ross。

2

第二阶段：编程基础 + AI概论（1-2周）

Python编程基础（理解即可，快速过）
AI发展历程与技术分类（理解）

💡 Python熟练度会极大影响研究效率。重点掌握NumPy/SciPy/PyTorch。

3

第三阶段：机器学习 + 深度学习（4-6周）

机器学习全部章节（精通经典算法）
深度学习：神经网络基础→CNN→RNN→Transformer（精通）
生成模型：GAN、VAE、扩散模型（精通）
强化学习基础（精通）

💡 这是算法研究的核心地基。建议每个算法都亲手实现一遍，理解背后的数学原理。Andrew Ng CS229 + 李宏毅ML是经典资源。

4

第四阶段：大模型原理深入（4-6周）

Transformer架构深入（精通注意力机制变体）
预训练方法（精通BERT/GPT范式）
模型架构类型（精通MoE等前沿架构）
大模型微调与对齐（精通RLHF/DPO）

💡 深入研究大模型的核心机制。建议阅读原始论文（Attention Is All You Need, GPT系列, LLaMA等），并尝试复现关键组件。

5

第五阶段：前沿方向探索（持续）

多模态大模型
图神经网络（GNN）
具身智能
推理效率革命
Agentic AI

💡 选择一个前沿方向深入，产出论文或技术博客。保持对arXiv的关注，每周精读2-3篇顶会论文。

6

第六阶段：工程素养补充（可选）

分布式训练基础
CUDA编程基础
MLOps实践

💡 理解工程实现有助于设计可落地的研究方案，但非必须精通。

🏗️

大模型训练/部署工程师

LLM Training Engineer

专注于大模型的训练、微调、压缩与部署。需要深入理解分布式训练、GPU优化、模型量化等工程化技能，是将大模型从实验室推向生产环境的关键角色。

🎯 核心职能

大规模分布式训练系统的搭建与优化
大模型微调（SFT、RLHF、DPO等）全流程
模型量化、剪枝、蒸馏等压缩技术
推理服务部署、性能优化与成本控制
持续预训练与领域适配

💼 典型岗位

大模型训练工程师 · LLM Ops · 推理优化工程师 · 分布式训练工程师

💰 薪资范围

50-120万/年
资深可达180万+

📊 市场需求

极高（2025-2026核心紧缺岗位）

📊 学习内容画像

共 1452 篇内容，需要学习 1294 篇（89%），预计总学习时间约 336小时5分钟

⭐ 精通

441篇 (30.4%)

≈ 220h30m

📖 理解

267篇 (18.4%)

≈ 66h45m

👀 浅读

586篇 (40.4%)

≈ 48h50m

➖ 可不读：158 篇（10.9%）— 与本岗位相关性较低的内容

🗺️ 学习路径引导

以下是为此岗位量身定制的分阶段学习路径，建议按顺序推进。每个阶段标注了预计耗时和重点内容。

1

第一阶段：编程基础 + 数学速通（1-2周）

Python编程基础（精通数据处理、脚本编写）
线性代数（理解矩阵运算）
最优化理论（精通梯度下降、Adam等优化器）

💡 快速过编程基础，重点掌握PyTorch和数据处理。数学聚焦优化算法。

2

第二阶段：深度学习核心（2-3周）

神经网络基础（精通）
Transformer架构（精通——这是大模型的基石）
正则化与优化技术（精通）

💡 深入理解Transformer的每一层。用PyTorch从零实现一个mini-Transformer。

3

第三阶段：大模型训练全流程（6-8周）⭐核心

数据准备：爬取、清洗、去重、tokenization（精通）
分布式训练：DP/DDP/FSDP/ZeRO/Megatron（精通）
训练优化：混合精度、flash-attention、梯度累积（精通）
预训练实践：超参调优、训练监控、故障恢复（精通）
持续预训练：领域知识注入（精通）

💡 这是大模型工程师最核心的能力区间。建议用开源框架（如LLaMA-Factory、Megatron-LM）实际训练一个小规模模型，理解每个环节。

4

第四阶段：大模型微调与对齐（3-4周）

全参数微调（理解）
PEFT/LoRA/QLoRA（精通）
指令微调/SFT（精通）
RLHF/DPO对齐（精通）
多任务微调（理解）

💡 掌握主流微调框架（HuggingFace PEFT、LLaMA-Factory）。重点理解LoRA的原理和调参技巧。

5

第五阶段：部署与推理优化（3-4周）

模型量化：INT8/INT4/GGUF/AWQ（精通）
模型压缩：剪枝、蒸馏（理解）
推理优化：KV Cache、Speculative Decoding、vLLM（精通）
推理服务部署：Triton/TGI/vLLM（精通）
边缘部署（理解）

💡 量化是降本增效的关键。建议实际部署一个7B模型，对比不同量化方案的推理速度和显存占用。

6

第六阶段：基础设施 + CUDA（3-4周）

GPU计算基础（精通）
CUDA编程（精通）
算子融合优化（精通）
性能分析与调优（精通）
算力调度系统（理解）

💡 深入CUDA是区分优秀和卓越大模型工程师的分水岭。推荐《CUDA C Programming Guide》和NVIDIA官方教程。

⚙️

AI应用开发工程师

AI Application Developer

专注于基于大模型的AI应用开发，包括RAG系统、AI Agent、Prompt工程等。需要全栈能力，既能理解模型原理，又能快速构建生产级AI产品。

🎯 核心职能

设计并开发RAG（检索增强生成）系统
构建AI Agent与多智能体协作系统
Prompt工程与优化，提升模型输出质量
集成大模型API，开发企业级AI应用
AI产品从0到1的全流程交付

💼 典型岗位

AI应用开发工程师 · AI全栈工程师 · AI产品工程师 · Prompt工程师

💰 薪资范围

35-80万/年
资深可达120万+

📊 市场需求

极高（需求量最大，入门门槛相对友好）

📊 学习内容画像

共 1452 篇内容，需要学习 1300 篇（90%），预计总学习时间约 293小时35分钟

⭐ 精通

309篇 (21.3%)

≈ 154h30m

📖 理解

339篇 (23.3%)

≈ 84h45m

👀 浅读

652篇 (44.9%)

≈ 54h20m

➖ 可不读：152 篇（10.5%）— 与本岗位相关性较低的内容

🗺️ 学习路径引导

以下是为此岗位量身定制的分阶段学习路径，建议按顺序推进。每个阶段标注了预计耗时和重点内容。

1

第一阶段：AI全景认知（1周）

AI概论全部内容（理解）
AI产业生态与职业前景（理解）

💡 快速建立AI知识全景图，理解大模型能做什么、不能做什么。这是做好AI应用的前提。

2

第二阶段：Prompt工程入门（1-2周）

Prompt基础（精通）
高级Prompt技术：Few-shot、CoT、角色扮演（精通）
Prompt模板设计（精通）
Prompt优化与评估（精通）
Vibe Coding（精通）

💡 Prompt是AI应用的入口。建议在ChatGPT/Claude中大量实践，建立Prompt直觉。推荐Anthropic的Prompt Engineering Guide。

3

第三阶段：RAG系统开发（3-4周）⭐核心

RAG基础原理（精通）
文档处理与索引（精通）
向量数据库：Chroma/Pinecone/Milvus（精通）
检索策略优化（精通）
RAG高级技术：HyDE、Re-ranking等（精通）
RAG框架实践：LangChain/LlamaIndex（精通）
GraphRAG（理解）

💡 RAG是当前AI应用的最主流范式。建议从零搭建一个完整的RAG问答系统（文档→索引→检索→生成→评估），这是面试必考项目。

4

第四阶段：AI Agent开发（3-4周）⭐核心

Agent基础概念（精通）
Agent架构设计（精通）
工具调用/Function Calling（精通）
多Agent系统（精通）
Agent框架实践：LangGraph/CrewAI/AutoGen（精通）
Agent评估与优化（精通）
MCP协议（精通）
A2A协议（理解）

💡 Agent是2025-2026年的核心趋势。建议实现一个多Agent协作系统（如自动化研究助手），理解Agent的规划-执行-反思循环。

5

第五阶段：应用工程化（2-3周）

低代码/无代码AI平台（精通）
Spring AI / LangChain4j（按语言选择精通）
实战项目：智能客服 + 知识问答（精通）
AI工作流自动化（精通）

💡 将学到的技术整合成完整产品。建议做一个有前端+后端的完整AI应用，部署上线。

6

第六阶段：深度学习补充（2-3周）

大模型原理（理解Transformer架构）
大模型微调基础（理解LoRA微调）
NLP基础（理解文本分类、NER等）

💡 补充必要的理论基础，不求深入但要能和技术团队有效沟通。理解微调的概念和适用场景。

📝

NLP算法工程师

NLP Engineer

专注于自然语言处理领域的算法研发与落地，涵盖文本分类、机器翻译、问答系统、对话系统、信息抽取等方向。需要深入理解NLP核心技术栈与最新大模型范式。

🎯 核心职能

文本理解与生成模型的研发与优化
机器翻译、文本摘要、情感分析等NLP任务
对话系统与智能客服的算法设计
知识图谱构建与信息抽取
NLP模型的生产部署与持续优化

💼 典型岗位

NLP工程师 · 对话系统工程师 · 知识图谱工程师 · 搜索算法工程师

💰 薪资范围

35-80万/年
资深可达120万+

📊 市场需求

很高（大模型时代NLP需求持续增长）

📊 学习内容画像

共 1452 篇内容，需要学习 1193 篇（82%），预计总学习时间约 250小时10分钟

⭐ 精通

189篇 (13.0%)

≈ 94h30m

📖 理解

432篇 (29.8%)

≈ 108h0m

👀 浅读

572篇 (39.4%)

≈ 47h40m

➖ 可不读：259 篇（17.8%）— 与本岗位相关性较低的内容

🗺️ 学习路径引导

以下是为此岗位量身定制的分阶段学习路径，建议按顺序推进。每个阶段标注了预计耗时和重点内容。

1

第一阶段：数学 + 编程基础（2-3周）

概率论与数理统计（精通）
信息论基础（精通）
线性代数（理解）
Python编程基础（精通）

💡 NLP与概率、信息论密不可分。熵、KL散度、贝叶斯是理解NLP模型的基础语言。

2

第二阶段：机器学习基础（2-3周）

机器学习概述（理解）
监督学习（精通分类器）
无监督学习（精通聚类、降维）
特征工程（精通文本特征）
模型评估（精通分类指标）

💡 重点掌握与文本相关的特征工程方法（TF-IDF、词袋等）和评估指标（F1、BLEU、ROUGE等）。

3

第三阶段：深度学习 + NLP基础（4-6周）

神经网络基础（精通）
RNN/LSTM/GRU（精通）
Transformer + 自注意力（精通）
NLP基础：分词、POS、NER、句法分析（精通）
词向量：Word2Vec/GloVe/FastText（精通）

💡 从RNN到Transformer的演进是理解现代NLP的必经之路。建议从零实现一个基于Transformer的文本分类器。

4

第四阶段：NLP核心任务（4-6周）⭐核心

文本分类与情感分析（精通）
机器翻译（精通Encoder-Decoder架构）
问答系统（精通）
对话系统（精通）
信息抽取（精通）

💡 每个任务方向至少完成一个完整项目。推荐使用HuggingFace的Transformers库，这是NLP的工业标准。

5

第五阶段：大模型时代的NLP（4-6周）

GPT/Claude/Gemini系列（精通Prompt用法）
大模型微调：LoRA/QLoRA（精通）
指令微调/SFT（精通）
RLHF/DPO对齐（理解）
RAG技术（精通）

💡 大模型极大改变了NLP工作方式。重点在于如何用大模型解决NLP问题，以及如何为特定领域微调模型。

6

第六阶段：进阶与应用（持续）

多模态NLP（理解）
知识图谱（理解）
AI Agent（理解）
NLP系统部署（理解）

💡 多模态和Agent是NLP的自然延伸方向。根据岗位需求选择性深入。

👁️

计算机视觉工程师

CV Engineer

专注于计算机视觉领域的算法研发与落地，涵盖图像分类、目标检测、图像分割、人脸识别、视频理解、3D视觉等方向。需要深入理解CNN、ViT等视觉模型架构。

🎯 核心职能

图像分类、目标检测、分割等经典CV任务
视频理解与行为识别
3D视觉、点云处理、NeRF等前沿方向
视觉-语言多模态模型的研发与应用
CV模型在边缘设备上的部署与优化

💼 典型岗位

CV工程师 · 视觉算法工程师 · 自动驾驶感知工程师 · AR/VR算法工程师

💰 薪资范围

35-80万/年
资深可达120万+

📊 市场需求

很高（多模态时代CV需求稳定增长）

📊 学习内容画像

共 1452 篇内容，需要学习 1240 篇（85%），预计总学习时间约 193小时0分钟

⭐ 精通

118篇 (8.1%)

≈ 59h0m

📖 理解

243篇 (16.7%)

≈ 60h45m

👀 浅读

879篇 (60.5%)

≈ 73h15m

➖ 可不读：212 篇（14.6%）— 与本岗位相关性较低的内容

🗺️ 学习路径引导

以下是为此岗位量身定制的分阶段学习路径，建议按顺序推进。每个阶段标注了预计耗时和重点内容。

1

第一阶段：数学 + 编程基础（2-3周）

线性代数（精通——CV的数学语言）
最优化理论（理解）
Python编程基础（精通）
OpenCV等图像处理库（精通）

💡 线性代数在CV中无处不在（变换、投影、特征分解）。推荐《Multiple View Geometry in Computer Vision》作为进阶参考。

2

第二阶段：图像处理 + ML基础（2-3周）

图像处理基础：滤波、边缘检测、变换（精通）
机器学习基础（理解分类和聚类）
特征工程：SIFT/HOG等手工特征（理解）

💡 传统CV方法虽然不再主导，但理解底层图像处理有助于调试模型和设计数据增强策略。

3

第三阶段：深度学习 + CNN（3-4周）⭐核心

神经网络基础（精通）
CNN：卷积、池化、感受野（精通）
经典架构：LeNet→AlexNet→VGG→ResNet→EfficientNet（精通）
正则化与优化（精通）

💡 CNN是CV的基石。建议用PyTorch实现ResNet并在CIFAR-100上训练，理解残差连接和BatchNorm的作用。

4

第四阶段：CV核心任务（4-6周）⭐核心

图像分类（精通）
目标检测：R-CNN→YOLO→DETR（精通）
图像分割：FCN→U-Net→Mask R-CNN（精通）
人脸识别（精通）
OCR文字识别（精通）

💡 每个任务方向至少完成一个Kaggle竞赛或实际项目。目标检测和分割是面试高频考点。

5

第五阶段：进阶与前沿（4-6周）

Video Understanding（理解）
3D视觉：点云、NeRF、3D重建（精通）
ViT/视觉Transformer（精通）
多模态：视觉-语言模型（精通）
生成模型：GAN/VAE/扩散模型（理解）

💡 ViT和多模态是CV的前沿方向。推荐学习CLIP、DALL-E、Stable Diffusion等技术，这些正在重塑CV领域。

6

第六阶段：部署与工程化（2-3周）

模型量化/压缩（理解）
边缘部署：TensorRT/ONNX/Core ML（精通）
CUDA编程基础（理解）

💡 CV模型经常需要部署到端侧设备。TensorRT优化和模型量化是实用的工程技能。

📊 五大岗位横向对比

AI算法研究员

📊 学习内容画像

🗺️ 学习路径引导

第一阶段：数学基础（2-3周）

第二阶段：编程基础 + AI概论（1-2周）

第三阶段：机器学习 + 深度学习（4-6周）

第四阶段：大模型原理深入（4-6周）

第五阶段：前沿方向探索（持续）

第六阶段：工程素养补充（可选）

大模型训练/部署工程师

📊 学习内容画像

🗺️ 学习路径引导

第一阶段：编程基础 + 数学速通（1-2周）

第二阶段：深度学习核心（2-3周）

第三阶段：大模型训练全流程（6-8周）⭐核心

第四阶段：大模型微调与对齐（3-4周）

第五阶段：部署与推理优化（3-4周）

第六阶段：基础设施 + CUDA（3-4周）

AI应用开发工程师

📊 学习内容画像

🗺️ 学习路径引导

第一阶段：AI全景认知（1周）

第二阶段：Prompt工程入门（1-2周）

第三阶段：RAG系统开发（3-4周）⭐核心

第四阶段：AI Agent开发（3-4周）⭐核心

第五阶段：应用工程化（2-3周）

第六阶段：深度学习补充（2-3周）

NLP算法工程师

📊 学习内容画像

🗺️ 学习路径引导

第一阶段：数学 + 编程基础（2-3周）

第二阶段：机器学习基础（2-3周）

第三阶段：深度学习 + NLP基础（4-6周）

第四阶段：NLP核心任务（4-6周）⭐核心

第五阶段：大模型时代的NLP（4-6周）

第六阶段：进阶与应用（持续）

计算机视觉工程师

📊 学习内容画像

🗺️ 学习路径引导

第一阶段：数学 + 编程基础（2-3周）

第二阶段：图像处理 + ML基础（2-3周）

第三阶段：深度学习 + CNN（3-4周）⭐核心

第四阶段：CV核心任务（4-6周）⭐核心

第五阶段：进阶与前沿（4-6周）

第六阶段：部署与工程化（2-3周）