DeepSeek最新动态:R2/V4双模型即将发布,坚持开源路线推动AGI发展
根据最新公开信息,DeepSeek 近期有以下重要动向和计划:
1. 即将发布 R2 和 V4 新模型
R2 模型 :
- 原计划在 2025年8月12-15日 (七夕前后)发布,但由于“关键对齐实验未收敛”,发布时间可能推迟至 8月底或9月初 。
- 采用 8×22B MoE(混合专家)架构 ,总参数量达 1.35T (其中密集参数部分110B)。
- 引入 异步自洽投票(ASCV) 机制,可提升复杂推理任务(如AIME风格难题)的准确率3-4个百分点,但会增加首Token延迟40ms。
- 继续保持 MIT 开源许可证 ,并计划在模型发布后2-3周公开训练方法(包括1.2M条RL对话数据和ASCV伪代码)。
V4 模型 :
- 预计最早在 2025年10月 发布,可能与R2“双节同发”。
- 并非追求更大规模,而是优化“通用推理能力”,内部目标为 “单模型通过中国高考720+分” 。
- 将提供 16B/64B/200B 三个蒸馏版本,其中16B版本可在单张RTX 4090(24GB显存)上实现 35 tok/s 的推理速度。
- 首次支持 “文-图-音频-视频”四模态 ,但视频处理能力目前仅限 4fps、8秒片段 ,初期可能仅作技术展示。
- 采用 “延迟开源”策略 ,先发布论文和可执行Demo,90天后才放出完整权重,以延长安全评估窗口。
2. API 与商业化策略
- 价格调整 :R2 和 V4 的 API 定价将比 R1-0528 降低 15-20% ,并测试 “批量Token包月” 和 “夜间闲时折扣” 等新计费模式。
- 函数调用优化 :R2 正式版将默认开放 Function Calling ,并支持在推理阶段调用外部工具(当前R1-0528版本不允许)。
3. 硬件与算力投入
- 近期向某国产GPU厂商采购 800张64GB HBM3e显卡 (非英伟达),疑似用于V4的后期对齐实验。
- 租用新的 InfiniBand 200G集群 ,但目前仅用于小规模强化学习(RL)实验,表明V4尚未进入大规模预训练阶段。
4. 开源与生态影响
- DeepSeek 坚持 开源免费 策略,成为全球首个免费开源大模型的公司,推动中国AI生态发展。
- 尽管官方App下载量下降(Q2暴跌72.2%),但 第三方平台使用量激增 ,许多开发者基于其开源模型优化服务体验。
- 360创始人 周鸿祎 在2025中国互联网大会上盛赞DeepSeek的开源模式,认为其可能打破美国AI技术垄断。
5. 创始人梁文锋的战略方向
- 梁文锋 “志不在App流量” ,而是专注于 AGI(通用人工智能) 底层技术研发。
- 官方App体验问题(如响应慢)未优先优化,用户转向更高效的第三方服务。
DeepSeek 近期重心在于 R2 和 V4 新模型的研发 ,同时强化开源生态,而非短期商业变现。尽管官方App流量下滑,但其技术仍被广泛采用,长期来看可能对中国AI产业产生深远影响。