DeepSeek-V3.2-Exp模型开源发布重磅消息
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
9月26日,宇树科技创始人、CEO王兴兴在第四届全球数字贸易博览会上发言称,宇树科技机器人算法今年已经历几次迭代,预计下半年将发布身高1.8米的人形机器人。 王兴兴表示,今年上半年国内机器人行业发展火热,中国智能机器人相关企业平均增长率达50%到100%。前段时间宇树科技再次更新了算法,使机器...
宏观要闻 六部门发文加大力度支持符合条件的优质数创企业上市融资 国家发展改革委等六部门日前联合印发《关于加强数字经济创新型企业培育的若干措施》。其中提出,鼓励金融机构结合数创企业投融资需求,按照市场化原则提供金融服务。强化创投资金引导,优化完善国有创业投资考核评价机制,探索将培育数字经济...
界面新闻记者 | 周芳颖界面新闻编辑 | 楼婍沁 法国欧莱雅集团最新发布的2025财年半年报传递出一好一坏两个信号。 好消息是,中国市场在经历连续五个季度的低迷后首次重回增长轨道,成为带动北亚地区回暖的关键引擎。坏消息则是,受旅游零售持续疲软拖累,北亚整体业绩仍同比下滑1.1%,成为欧莱...
习近平听取新疆维吾尔自治区党委和政府工作汇报 新华社消息,率中央代表团出席新疆维吾尔自治区成立70周年庆祝活动的中共中央总书记、国家主席、中央军委主席习近平,24日听取新疆维吾尔自治区党委和政府工作汇报。他强调,新疆要完整准确全面贯彻新时代党的治疆方略,坚持稳中求进工作总基调,统筹发展和安全,...
美国总统特朗普于美东时间9月25日在社交平台连发多条帖文,宣布从10月1日起对一批进口商品加征关税,包括品牌药品、重型卡车、厨房橱柜、浴室洗手台及相关建材、软垫家具。 具体来看,进入该国的“任何品牌或专利药品”将被征收100%的关税,但不适用于在美国当地建造制药厂的公司,涉及已动工或正在建设项...
界面新闻记者 | 肖芳界面新闻编辑 | 文姝琪 “稳定的流量对创作者是一把双刃剑。如果你的粉丝花更多时间看你的内容,就意味着他成为其他人粉丝的可能性就会变小,也意味着所有人获得新粉丝的可能性在变小。” 抖音生态策略负责人贾贝贝在抖音2025创作者大会的演讲中指出抖音内容生态新老创作者诉求...