AI职业学习路径指南

面向5大AI核心岗位,基于1452篇系统化AI课程内容,为你量身定制从入门到精通的学习路径。精准定位每篇内容的掌握程度,让学习不再盲目。

5
核心岗位
1,452
篇系统化内容
6
阶段学习路径
4
掌握层级

📊 五大岗位横向对比

基于1452篇课程内容,每个岗位对应不同掌握层级的文章数量与预估学习时间

岗位 ⭐ 精通 📖 理解 👀 浅读 ➖ 可不读 📚 需学习 ⏱️ 总时间
🔬AI算法研究员 137 521 630 164 1288 251h15m
🏗️大模型训练/部署工程师 441 267 586 158 1294 336h5m
⚙️AI应用开发工程师 309 339 652 152 1300 293h35m
📝NLP算法工程师 189 432 572 259 1193 250h10m
👁️计算机视觉工程师 118 243 879 212 1240 193h0m

时间估算标准:精通 ≈ 30min/篇,理解 ≈ 15min/篇,浅读 ≈ 5min/篇。实际时间因个人基础而异。

🔬

AI算法研究员

AI Research Scientist

专注于AI前沿算法研究、模型创新与理论突破。需要深厚数学功底与扎实的机器学习/深度学习理论基础,是推动AI技术边界的中坚力量。

🎯 核心职能
  • 设计并实现新型神经网络架构与训练算法
  • 研究大模型预训练、微调、对齐等核心技术
  • 探索多模态融合、强化学习、图神经网络等前沿方向
  • 发表学术论文,推动AI理论发展
  • 将研究成果转化为可落地的技术方案
💼 典型岗位
算法研究员 · Research Scientist · AI Scientist · 研究型工程师
💰 薪资范围
40-100万/年
资深可达200万+
📊 市场需求
极高(大厂核心岗,供给稀缺)

📊 学习内容画像

共 1452 篇内容,需要学习 1288 篇(89%),预计总学习时间约 251小时15分钟

⭐ 精通
137篇 (9.4%)
≈ 68h30m
📖 理解
521篇 (35.9%)
≈ 130h15m
👀 浅读
630篇 (43.4%)
≈ 52h30m
➖ 可不读:164 篇(11.3%)— 与本岗位相关性较低的内容

🗺️ 学习路径引导

以下是为此岗位量身定制的分阶段学习路径,建议按顺序推进。每个阶段标注了预计耗时和重点内容。

1

第一阶段:数学基础(2-3周)

  • 线性代数(全部精通)
  • 概率论与数理统计(全部精通)
  • 信息论基础(全部精通)
  • 最优化理论(全部精通)
  • 微积分(链式法则、梯度下降精通)
💡 数学是算法研究的语言,建议投入充足时间,配合习题巩固。推荐资源:《线性代数及其应用》Strang、《概率论基础教程》Ross。
2

第二阶段:编程基础 + AI概论(1-2周)

  • Python编程基础(理解即可,快速过)
  • AI发展历程与技术分类(理解)
💡 Python熟练度会极大影响研究效率。重点掌握NumPy/SciPy/PyTorch。
3

第三阶段:机器学习 + 深度学习(4-6周)

  • 机器学习全部章节(精通经典算法)
  • 深度学习:神经网络基础→CNN→RNN→Transformer(精通)
  • 生成模型:GAN、VAE、扩散模型(精通)
  • 强化学习基础(精通)
💡 这是算法研究的核心地基。建议每个算法都亲手实现一遍,理解背后的数学原理。Andrew Ng CS229 + 李宏毅ML是经典资源。
4

第四阶段:大模型原理深入(4-6周)

  • Transformer架构深入(精通注意力机制变体)
  • 预训练方法(精通BERT/GPT范式)
  • 模型架构类型(精通MoE等前沿架构)
  • 大模型微调与对齐(精通RLHF/DPO)
💡 深入研究大模型的核心机制。建议阅读原始论文(Attention Is All You Need, GPT系列, LLaMA等),并尝试复现关键组件。
5

第五阶段:前沿方向探索(持续)

  • 多模态大模型
  • 图神经网络(GNN)
  • 具身智能
  • 推理效率革命
  • Agentic AI
💡 选择一个前沿方向深入,产出论文或技术博客。保持对arXiv的关注,每周精读2-3篇顶会论文。
6

第六阶段:工程素养补充(可选)

  • 分布式训练基础
  • CUDA编程基础
  • MLOps实践
💡 理解工程实现有助于设计可落地的研究方案,但非必须精通。
🏗️

大模型训练/部署工程师

LLM Training Engineer

专注于大模型的训练、微调、压缩与部署。需要深入理解分布式训练、GPU优化、模型量化等工程化技能,是将大模型从实验室推向生产环境的关键角色。

🎯 核心职能
  • 大规模分布式训练系统的搭建与优化
  • 大模型微调(SFT、RLHF、DPO等)全流程
  • 模型量化、剪枝、蒸馏等压缩技术
  • 推理服务部署、性能优化与成本控制
  • 持续预训练与领域适配
💼 典型岗位
大模型训练工程师 · LLM Ops · 推理优化工程师 · 分布式训练工程师
💰 薪资范围
50-120万/年
资深可达180万+
📊 市场需求
极高(2025-2026核心紧缺岗位)

📊 学习内容画像

共 1452 篇内容,需要学习 1294 篇(89%),预计总学习时间约 336小时5分钟

⭐ 精通
441篇 (30.4%)
≈ 220h30m
📖 理解
267篇 (18.4%)
≈ 66h45m
👀 浅读
586篇 (40.4%)
≈ 48h50m
➖ 可不读:158 篇(10.9%)— 与本岗位相关性较低的内容

🗺️ 学习路径引导

以下是为此岗位量身定制的分阶段学习路径,建议按顺序推进。每个阶段标注了预计耗时和重点内容。

1

第一阶段:编程基础 + 数学速通(1-2周)

  • Python编程基础(精通数据处理、脚本编写)
  • 线性代数(理解矩阵运算)
  • 最优化理论(精通梯度下降、Adam等优化器)
💡 快速过编程基础,重点掌握PyTorch和数据处理。数学聚焦优化算法。
2

第二阶段:深度学习核心(2-3周)

  • 神经网络基础(精通)
  • Transformer架构(精通——这是大模型的基石)
  • 正则化与优化技术(精通)
💡 深入理解Transformer的每一层。用PyTorch从零实现一个mini-Transformer。
3

第三阶段:大模型训练全流程(6-8周)⭐核心

  • 数据准备:爬取、清洗、去重、tokenization(精通)
  • 分布式训练:DP/DDP/FSDP/ZeRO/Megatron(精通)
  • 训练优化:混合精度、flash-attention、梯度累积(精通)
  • 预训练实践:超参调优、训练监控、故障恢复(精通)
  • 持续预训练:领域知识注入(精通)
💡 这是大模型工程师最核心的能力区间。建议用开源框架(如LLaMA-Factory、Megatron-LM)实际训练一个小规模模型,理解每个环节。
4

第四阶段:大模型微调与对齐(3-4周)

  • 全参数微调(理解)
  • PEFT/LoRA/QLoRA(精通)
  • 指令微调/SFT(精通)
  • RLHF/DPO对齐(精通)
  • 多任务微调(理解)
💡 掌握主流微调框架(HuggingFace PEFT、LLaMA-Factory)。重点理解LoRA的原理和调参技巧。
5

第五阶段:部署与推理优化(3-4周)

  • 模型量化:INT8/INT4/GGUF/AWQ(精通)
  • 模型压缩:剪枝、蒸馏(理解)
  • 推理优化:KV Cache、Speculative Decoding、vLLM(精通)
  • 推理服务部署:Triton/TGI/vLLM(精通)
  • 边缘部署(理解)
💡 量化是降本增效的关键。建议实际部署一个7B模型,对比不同量化方案的推理速度和显存占用。
6

第六阶段:基础设施 + CUDA(3-4周)

  • GPU计算基础(精通)
  • CUDA编程(精通)
  • 算子融合优化(精通)
  • 性能分析与调优(精通)
  • 算力调度系统(理解)
💡 深入CUDA是区分优秀和卓越大模型工程师的分水岭。推荐《CUDA C Programming Guide》和NVIDIA官方教程。
⚙️

AI应用开发工程师

AI Application Developer

专注于基于大模型的AI应用开发,包括RAG系统、AI Agent、Prompt工程等。需要全栈能力,既能理解模型原理,又能快速构建生产级AI产品。

🎯 核心职能
  • 设计并开发RAG(检索增强生成)系统
  • 构建AI Agent与多智能体协作系统
  • Prompt工程与优化,提升模型输出质量
  • 集成大模型API,开发企业级AI应用
  • AI产品从0到1的全流程交付
💼 典型岗位
AI应用开发工程师 · AI全栈工程师 · AI产品工程师 · Prompt工程师
💰 薪资范围
35-80万/年
资深可达120万+
📊 市场需求
极高(需求量最大,入门门槛相对友好)

📊 学习内容画像

共 1452 篇内容,需要学习 1300 篇(90%),预计总学习时间约 293小时35分钟

⭐ 精通
309篇 (21.3%)
≈ 154h30m
📖 理解
339篇 (23.3%)
≈ 84h45m
👀 浅读
652篇 (44.9%)
≈ 54h20m
➖ 可不读:152 篇(10.5%)— 与本岗位相关性较低的内容

🗺️ 学习路径引导

以下是为此岗位量身定制的分阶段学习路径,建议按顺序推进。每个阶段标注了预计耗时和重点内容。

1

第一阶段:AI全景认知(1周)

  • AI概论全部内容(理解)
  • AI产业生态与职业前景(理解)
💡 快速建立AI知识全景图,理解大模型能做什么、不能做什么。这是做好AI应用的前提。
2

第二阶段:Prompt工程入门(1-2周)

  • Prompt基础(精通)
  • 高级Prompt技术:Few-shot、CoT、角色扮演(精通)
  • Prompt模板设计(精通)
  • Prompt优化与评估(精通)
  • Vibe Coding(精通)
💡 Prompt是AI应用的入口。建议在ChatGPT/Claude中大量实践,建立Prompt直觉。推荐Anthropic的Prompt Engineering Guide。
3

第三阶段:RAG系统开发(3-4周)⭐核心

  • RAG基础原理(精通)
  • 文档处理与索引(精通)
  • 向量数据库:Chroma/Pinecone/Milvus(精通)
  • 检索策略优化(精通)
  • RAG高级技术:HyDE、Re-ranking等(精通)
  • RAG框架实践:LangChain/LlamaIndex(精通)
  • GraphRAG(理解)
💡 RAG是当前AI应用的最主流范式。建议从零搭建一个完整的RAG问答系统(文档→索引→检索→生成→评估),这是面试必考项目。
4

第四阶段:AI Agent开发(3-4周)⭐核心

  • Agent基础概念(精通)
  • Agent架构设计(精通)
  • 工具调用/Function Calling(精通)
  • 多Agent系统(精通)
  • Agent框架实践:LangGraph/CrewAI/AutoGen(精通)
  • Agent评估与优化(精通)
  • MCP协议(精通)
  • A2A协议(理解)
💡 Agent是2025-2026年的核心趋势。建议实现一个多Agent协作系统(如自动化研究助手),理解Agent的规划-执行-反思循环。
5

第五阶段:应用工程化(2-3周)

  • 低代码/无代码AI平台(精通)
  • Spring AI / LangChain4j(按语言选择精通)
  • 实战项目:智能客服 + 知识问答(精通)
  • AI工作流自动化(精通)
💡 将学到的技术整合成完整产品。建议做一个有前端+后端的完整AI应用,部署上线。
6

第六阶段:深度学习补充(2-3周)

  • 大模型原理(理解Transformer架构)
  • 大模型微调基础(理解LoRA微调)
  • NLP基础(理解文本分类、NER等)
💡 补充必要的理论基础,不求深入但要能和技术团队有效沟通。理解微调的概念和适用场景。
📝

NLP算法工程师

NLP Engineer

专注于自然语言处理领域的算法研发与落地,涵盖文本分类、机器翻译、问答系统、对话系统、信息抽取等方向。需要深入理解NLP核心技术栈与最新大模型范式。

🎯 核心职能
  • 文本理解与生成模型的研发与优化
  • 机器翻译、文本摘要、情感分析等NLP任务
  • 对话系统与智能客服的算法设计
  • 知识图谱构建与信息抽取
  • NLP模型的生产部署与持续优化
💼 典型岗位
NLP工程师 · 对话系统工程师 · 知识图谱工程师 · 搜索算法工程师
💰 薪资范围
35-80万/年
资深可达120万+
📊 市场需求
很高(大模型时代NLP需求持续增长)

📊 学习内容画像

共 1452 篇内容,需要学习 1193 篇(82%),预计总学习时间约 250小时10分钟

⭐ 精通
189篇 (13.0%)
≈ 94h30m
📖 理解
432篇 (29.8%)
≈ 108h0m
👀 浅读
572篇 (39.4%)
≈ 47h40m
➖ 可不读:259 篇(17.8%)— 与本岗位相关性较低的内容

🗺️ 学习路径引导

以下是为此岗位量身定制的分阶段学习路径,建议按顺序推进。每个阶段标注了预计耗时和重点内容。

1

第一阶段:数学 + 编程基础(2-3周)

  • 概率论与数理统计(精通)
  • 信息论基础(精通)
  • 线性代数(理解)
  • Python编程基础(精通)
💡 NLP与概率、信息论密不可分。熵、KL散度、贝叶斯是理解NLP模型的基础语言。
2

第二阶段:机器学习基础(2-3周)

  • 机器学习概述(理解)
  • 监督学习(精通分类器)
  • 无监督学习(精通聚类、降维)
  • 特征工程(精通文本特征)
  • 模型评估(精通分类指标)
💡 重点掌握与文本相关的特征工程方法(TF-IDF、词袋等)和评估指标(F1、BLEU、ROUGE等)。
3

第三阶段:深度学习 + NLP基础(4-6周)

  • 神经网络基础(精通)
  • RNN/LSTM/GRU(精通)
  • Transformer + 自注意力(精通)
  • NLP基础:分词、POS、NER、句法分析(精通)
  • 词向量:Word2Vec/GloVe/FastText(精通)
💡 从RNN到Transformer的演进是理解现代NLP的必经之路。建议从零实现一个基于Transformer的文本分类器。
4

第四阶段:NLP核心任务(4-6周)⭐核心

  • 文本分类与情感分析(精通)
  • 机器翻译(精通Encoder-Decoder架构)
  • 问答系统(精通)
  • 对话系统(精通)
  • 信息抽取(精通)
💡 每个任务方向至少完成一个完整项目。推荐使用HuggingFace的Transformers库,这是NLP的工业标准。
5

第五阶段:大模型时代的NLP(4-6周)

  • GPT/Claude/Gemini系列(精通Prompt用法)
  • 大模型微调:LoRA/QLoRA(精通)
  • 指令微调/SFT(精通)
  • RLHF/DPO对齐(理解)
  • RAG技术(精通)
💡 大模型极大改变了NLP工作方式。重点在于如何用大模型解决NLP问题,以及如何为特定领域微调模型。
6

第六阶段:进阶与应用(持续)

  • 多模态NLP(理解)
  • 知识图谱(理解)
  • AI Agent(理解)
  • NLP系统部署(理解)
💡 多模态和Agent是NLP的自然延伸方向。根据岗位需求选择性深入。
👁️

计算机视觉工程师

CV Engineer

专注于计算机视觉领域的算法研发与落地,涵盖图像分类、目标检测、图像分割、人脸识别、视频理解、3D视觉等方向。需要深入理解CNN、ViT等视觉模型架构。

🎯 核心职能
  • 图像分类、目标检测、分割等经典CV任务
  • 视频理解与行为识别
  • 3D视觉、点云处理、NeRF等前沿方向
  • 视觉-语言多模态模型的研发与应用
  • CV模型在边缘设备上的部署与优化
💼 典型岗位
CV工程师 · 视觉算法工程师 · 自动驾驶感知工程师 · AR/VR算法工程师
💰 薪资范围
35-80万/年
资深可达120万+
📊 市场需求
很高(多模态时代CV需求稳定增长)

📊 学习内容画像

共 1452 篇内容,需要学习 1240 篇(85%),预计总学习时间约 193小时0分钟

⭐ 精通
118篇 (8.1%)
≈ 59h0m
📖 理解
243篇 (16.7%)
≈ 60h45m
👀 浅读
879篇 (60.5%)
≈ 73h15m
➖ 可不读:212 篇(14.6%)— 与本岗位相关性较低的内容

🗺️ 学习路径引导

以下是为此岗位量身定制的分阶段学习路径,建议按顺序推进。每个阶段标注了预计耗时和重点内容。

1

第一阶段:数学 + 编程基础(2-3周)

  • 线性代数(精通——CV的数学语言)
  • 最优化理论(理解)
  • Python编程基础(精通)
  • OpenCV等图像处理库(精通)
💡 线性代数在CV中无处不在(变换、投影、特征分解)。推荐《Multiple View Geometry in Computer Vision》作为进阶参考。
2

第二阶段:图像处理 + ML基础(2-3周)

  • 图像处理基础:滤波、边缘检测、变换(精通)
  • 机器学习基础(理解分类和聚类)
  • 特征工程:SIFT/HOG等手工特征(理解)
💡 传统CV方法虽然不再主导,但理解底层图像处理有助于调试模型和设计数据增强策略。
3

第三阶段:深度学习 + CNN(3-4周)⭐核心

  • 神经网络基础(精通)
  • CNN:卷积、池化、感受野(精通)
  • 经典架构:LeNet→AlexNet→VGG→ResNet→EfficientNet(精通)
  • 正则化与优化(精通)
💡 CNN是CV的基石。建议用PyTorch实现ResNet并在CIFAR-100上训练,理解残差连接和BatchNorm的作用。
4

第四阶段:CV核心任务(4-6周)⭐核心

  • 图像分类(精通)
  • 目标检测:R-CNN→YOLO→DETR(精通)
  • 图像分割:FCN→U-Net→Mask R-CNN(精通)
  • 人脸识别(精通)
  • OCR文字识别(精通)
💡 每个任务方向至少完成一个Kaggle竞赛或实际项目。目标检测和分割是面试高频考点。
5

第五阶段:进阶与前沿(4-6周)

  • Video Understanding(理解)
  • 3D视觉:点云、NeRF、3D重建(精通)
  • ViT/视觉Transformer(精通)
  • 多模态:视觉-语言模型(精通)
  • 生成模型:GAN/VAE/扩散模型(理解)
💡 ViT和多模态是CV的前沿方向。推荐学习CLIP、DALL-E、Stable Diffusion等技术,这些正在重塑CV领域。
6

第六阶段:部署与工程化(2-3周)

  • 模型量化/压缩(理解)
  • 边缘部署:TensorRT/ONNX/Core ML(精通)
  • CUDA编程基础(理解)
💡 CV模型经常需要部署到端侧设备。TensorRT优化和模型量化是实用的工程技能。