2025年07月25日木木子 0 评论数 5 点赞

DeepSeek最新动态：R2/V4双模型即将发布，坚持开源路线推动AGI发展

根据最新公开信息，DeepSeek 近期有以下重要动向和计划：

1. 即将发布 R2 和 V4 新模型

R2 模型：

- 原计划在 2025年8月12-15日（七夕前后）发布，但由于“关键对齐实验未收敛”，发布时间可能推迟至 8月底或9月初。

- 采用 8×22B MoE（混合专家）架构，总参数量达 1.35T （其中密集参数部分110B）。

- 引入异步自洽投票（ASCV）机制，可提升复杂推理任务（如AIME风格难题）的准确率3-4个百分点，但会增加首Token延迟40ms。

- 继续保持 MIT 开源许可证，并计划在模型发布后2-3周公开训练方法（包括1.2M条RL对话数据和ASCV伪代码）。

V4 模型：

- 预计最早在 2025年10月发布，可能与R2“双节同发”。

- 并非追求更大规模，而是优化“通用推理能力”，内部目标为 “单模型通过中国高考720+分” 。

- 将提供 16B/64B/200B 三个蒸馏版本，其中16B版本可在单张RTX 4090（24GB显存）上实现 35 tok/s 的推理速度。

- 首次支持 “文-图-音频-视频”四模态，但视频处理能力目前仅限 4fps、8秒片段，初期可能仅作技术展示。

- 采用 “延迟开源”策略，先发布论文和可执行Demo，90天后才放出完整权重，以延长安全评估窗口。

2. API 与商业化策略

- 价格调整：R2 和 V4 的 API 定价将比 R1-0528 降低 15-20% ，并测试 “批量Token包月” 和 “夜间闲时折扣” 等新计费模式。

- 函数调用优化：R2 正式版将默认开放 Function Calling ，并支持在推理阶段调用外部工具（当前R1-0528版本不允许）。

3. 硬件与算力投入

- 近期向某国产GPU厂商采购 800张64GB HBM3e显卡（非英伟达），疑似用于V4的后期对齐实验。

- 租用新的 InfiniBand 200G集群，但目前仅用于小规模强化学习（RL）实验，表明V4尚未进入大规模预训练阶段。

4. 开源与生态影响

- DeepSeek 坚持开源免费策略，成为全球首个免费开源大模型的公司，推动中国AI生态发展。

- 尽管官方App下载量下降（Q2暴跌72.2%），但第三方平台使用量激增，许多开发者基于其开源模型优化服务体验。

- 360创始人周鸿祎在2025中国互联网大会上盛赞DeepSeek的开源模式，认为其可能打破美国AI技术垄断。

5. 创始人梁文锋的战略方向

- 梁文锋 “志不在App流量” ，而是专注于 AGI（通用人工智能）底层技术研发。

- 官方App体验问题（如响应慢）未优先优化，用户转向更高效的第三方服务。

DeepSeek 近期重心在于 R2 和 V4 新模型的研发，同时强化开源生态，而非短期商业变现。尽管官方App流量下滑，但其技术仍被广泛采用，长期来看可能对中国AI产业产生深远影响。

标签: 应用/职场人

码农之家

DeepSeek最新动态：R2/V4双模型即将发布，坚持开源路线推动AGI发展

1. 即将发布 R2 和 V4 新模型

R2 模型：

V4 模型：

2. API 与商业化策略

3. 硬件与算力投入

4. 开源与生态影响

5. 创始人梁文锋的战略方向

木木子

0 评论数

了解我们

扫描打开官方网站

寻求帮助

关注微信运营团队

产品展示

合作伙伴

码农之家

DeepSeek最新动态：R2/V4双模型即将发布，坚持开源路线推动AGI发展

1. 即将发布 R2 和 V4 新模型

R2 模型 ：

V4 模型 ：

2. API 与商业化策略

3. 硬件与算力投入

4. 开源与生态影响

5. 创始人梁文锋的战略方向

木木子

0 评论数

了解我们

扫描打开官方网站

寻求帮助

关注微信运营团队

产品展示

合作伙伴

R2 模型：

V4 模型：