码农之家

专注优质代码开发,为软件行业发展贡献力量

DeepSeek最新动态:R2/V4双模型即将发布,坚持开源路线推动AGI发展

根据最新公开信息,DeepSeek 近期有以下重要动向和计划:


1. 即将发布 R2 和 V4 新模型

    R2 模型 : 

          - 原计划在  2025年8月12-15日 (七夕前后)发布,但由于“关键对齐实验未收敛”,发布时间可能推迟至  8月底或9月初 。  

          - 采用  8×22B MoE(混合专家)架构 ,总参数量达  1.35T (其中密集参数部分110B)。  

          - 引入  异步自洽投票(ASCV)  机制,可提升复杂推理任务(如AIME风格难题)的准确率3-4个百分点,但会增加首Token延迟40ms。  

          - 继续保持  MIT 开源许可证 ,并计划在模型发布后2-3周公开训练方法(包括1.2M条RL对话数据和ASCV伪代码)。  


    V4 模型 :  

          - 预计最早在  2025年10月  发布,可能与R2“双节同发”。  

          - 并非追求更大规模,而是优化“通用推理能力”,内部目标为  “单模型通过中国高考720+分” 。  

          - 将提供  16B/64B/200B  三个蒸馏版本,其中16B版本可在单张RTX 4090(24GB显存)上实现  35 tok/s  的推理速度。  

          - 首次支持  “文-图-音频-视频”四模态 ,但视频处理能力目前仅限  4fps、8秒片段 ,初期可能仅作技术展示。  

          - 采用  “延迟开源”策略 ,先发布论文和可执行Demo,90天后才放出完整权重,以延长安全评估窗口。  

2. API 与商业化策略 

        -  价格调整 :R2 和 V4 的 API 定价将比 R1-0528 降低  15-20% ,并测试  “批量Token包月”  和  “夜间闲时折扣”  等新计费模式。  

        -  函数调用优化 :R2 正式版将默认开放  Function Calling ,并支持在推理阶段调用外部工具(当前R1-0528版本不允许)。  

3. 硬件与算力投入 

        - 近期向某国产GPU厂商采购  800张64GB HBM3e显卡 (非英伟达),疑似用于V4的后期对齐实验。  

        - 租用新的  InfiniBand 200G集群 ,但目前仅用于小规模强化学习(RL)实验,表明V4尚未进入大规模预训练阶段。  

4. 开源与生态影响 

        - DeepSeek 坚持  开源免费  策略,成为全球首个免费开源大模型的公司,推动中国AI生态发展。  

        - 尽管官方App下载量下降(Q2暴跌72.2%),但  第三方平台使用量激增 ,许多开发者基于其开源模型优化服务体验。  

        - 360创始人  周鸿祎  在2025中国互联网大会上盛赞DeepSeek的开源模式,认为其可能打破美国AI技术垄断。  

5. 创始人梁文锋的战略方向 

        - 梁文锋  “志不在App流量” ,而是专注于  AGI(通用人工智能)  底层技术研发。  

        - 官方App体验问题(如响应慢)未优先优化,用户转向更高效的第三方服务。  


        DeepSeek 近期重心在于  R2 和 V4 新模型的研发 ,同时强化开源生态,而非短期商业变现。尽管官方App流量下滑,但其技术仍被广泛采用,长期来看可能对中国AI产业产生深远影响。

木木子

0 评论数