DeepSeek-V3.1正式发布:思考时间变短,但API调用价格涨了|界面新闻 · 科技

作者:龙城生活 更新时间:2025-08-27 18:51 发布时间:6天前 浏览:20
温馨提示:当前页面由第三方提供! 龙城便民网自营家电报修号码:400-833-0103
导读: 界面新闻记者 | 宋佳楠 DeepSeek用户没能等到传闻中的R2模型,但V3.1版先来了。 8月21日,界面新闻从DeepSeek**公众号获悉,其最新大语言模型DeepSeek-V3.1正式发布。此时距离DeepSeek-V3-0324推出已过去5个月时间。 据Deep...

界面新闻记者 | 宋佳楠

DeepSeek用户没能等到传闻中的R2模型,但V3.1版先来了。

8月21日,界面新闻从DeepSeek**公众号获悉,其最新大语言模型DeepSeek-V3.1正式发布。此时距离DeepSeek-V3-0324推出已过去5个月时间。

据DeepSeek介绍,新升级版本的变化主要体现在三个方面:混合推理架构、更高的思考效率、更强的Agent(智能体)能力。如果仅从命名来看,DeepSeek-V3.1更像是前一代DeepSeek-V3模型的小版本迭代。

DeepSeek-V3.1实现了一个模型同时支持思考模式与非思考模式。它就像一个拥有两种工作模式的超级大脑,当面对简单问题时,能以非思考模式快速给出答案。而在处理复杂问题时,可切换到思考模式,给出更具深度和逻辑的解答。用户可通过**App或网页端的“深度思考”按钮切换这两种模式。

**数据显示,与DeepSeek-R1-0528相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短时间内给出答案,且经过思维链压缩训练,token(大模型文本处理的最小单位)消耗量可减少20%至50%,各项任务的平均表现与R1-0528持平。R1-0528是DeepSeek于今年5月发布的旗舰推理模型DeepSeek R1的升级版本。

R1-0528与V3.1-Think的token消耗量对比图

同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324,能够在输出长度明显减少的情况下保持相同的模型性能。

通过Post-Training(后训练,大语言模型训练流程中的关键阶段)优化,新模型在工具使用与编程、搜索等智能体任务中的表现大幅提升。在代码修复和命令行终端任务测试中,DeepSeek-V3.1相较以往模型进步明显。

社区第三方测试数据显示,在Aider多语言编程基准测试中,V3.1取得了71.6%的高分,超越了Anthropic的Claude 4 Opus等多个知名模型,且完成一次编程任务的成本仅为1.01美元,成本效益优势显著。

随着V3.1发布,DeepSeek也同步调整了API接口调用价格,并取消夜间优惠。自北京时间2025年9月6日凌晨起,输入价格方面,缓存命中时为0.5元/百万tokens,缓存未命中时则涨至4元/百万tokens(此前V3为2元/百万tokens);输出价格调整为12元/百万tokens(此前V3为8元/百万tokens)。

DeepSeek-V3.1 API调用价格

值得注意的是,DeepSeek还在评论区中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。DeepSeek官微在置顶留言里表示,UE8M0 FP8是针对即将发布的下一代国产芯片设计。

此前有第三方数据显示,DeepSeek用户使用率和**流量回落。据第一财经报道,360集团创始人周鸿祎对此表示,DeepSeek**流量下降是因为DeepSeek没有花心思,但现在很多第三方云服务上都有DeepSeek的服务,用了DeepSeek的大模型流量一直很高。在中国,许多公司包括360智能体的基座模型等都使用DeepSeek来改,相当于很多公司的“武器装备”都是DeepSeek提供的。

DeepSeek(深度求索)是2023年成立于杭州的人工智能公司,由幻方量化孵化。创始团队由梁文锋领衔,成员来自顶尖高校与国际机构技术专家。

截至目前,DeepSeek推出了DeepSeek-V3、DeepSeek-R1等模型,具备混合专家架构(MoE)、多头潜在注意力(MLA)等技术优势,在数学推理、代码生成等任务上表现出色,且训练和推理成本较低。其部分模型采用MIT许可开源(一种广泛使用的开源软件许可证),已在金融、医疗等领域落地应用。


  • 5月23日投资早报|比亚迪4月欧洲纯电车销量首次击败特斯拉,宏创控股拟635.18亿元购买宏拓实业100%股权,三一重工向港交所递交上市申请|界面新闻 · 证券
  • 威视捷智能锁全国各售后服务点热线号码
  • 简奈保险柜售后电话《今日头条》24小时在线服务
  • 天天爬楼梯会锻炼身体吗(天天爬楼梯锻炼好吗)
  • 锻炼身体前喝水好不好(锻炼前喝水好吗)
  • 哑铃可以每天都锻炼身体(哑铃可以每天练中间不休息吗)
  •  通化市周末去哪玩的简单介绍
  • 望花区周末去哪玩(望花区周末去哪玩比较好)
  • 麦盖提县周末去哪玩(麦盖提县周边哪里好玩)
  • 锻炼身体后吃巧克力(健身完后吃巧克力)
  • 汽车早报|比亚迪针对部分车型推出限时一口价政策 日产将关闭阿根廷皮卡生产线|界面新闻 · 汽车
  • 动感单车锻炼身体哪里(动感单车锻炼什么部位)
  • 划船锻炼身体哪个部位(划船锻炼什么)
  • 橙子锻炼身体(橙子有助减肥吗)
  • 抬臀锻炼身体什么部位(抬臀练腹式瑜伽动作怎么练)
  • 如转载请注明出处:龙城生活,如有疑问,请联系(商务微信:jdwx1123)。
    本文地址:https://lzxxw.com/post/255277.html

  • 2011年卢比汇率(卢比历年汇率)
  • 开心燃气灶售后服务电话-开心燃气灶全国400号码
  • 创识科技(300941.SZ):目前没有星闪技术具体什么情况
  • LGKJ油烟机24小时服务电话-LGKJ油烟机服务电话号码
  • 中国银行日币对人民币汇率(中国银行日币换人民币汇率)
  • 2011年卢比汇率(卢比历年汇率)