描述
课程介绍
DeepSeek-R1 的成功不仅为大模型的发展提供了新的方向,也为未来人工智能的研究和应用奠定了坚实基础。近期围绕 DeepSeek-R1 的讨论也越来越多,于是我们开设了这门前沿课程,希望能帮你拨开迷雾,更深入地了解大模型前沿知识,学习到 DeepSeek-R1 的核心技术,以及众多 DeepSeek-R1 开源项目的复现思路。
课程涵盖以下话题:
- 推理类模型是如何炼成的?
- DeepSeek-R1 类模型擅长做哪些事?
- 蒸馏 DeepSeek-R1 进行微调复现的思路是怎样的?
- 如何理解 DeepSeek-R1-zero 中的核心技术(GRPO、奖励策略)?
- OpenAI 推出的 Deep Research 如何应用?
- DeepSeek-R1、Deep Research 有哪些值得关注学习的开源项目?
PS:课程形式为视频课,不提供课件。
课程目录
订阅须知
- 订阅成功后,推荐通过“极客时间”App 端、Web 端学习。
- 本课程为虚拟商品,交付形式为视频,一经订阅,概不退款。