DeepSeek-V3.2-Exp模型开源发布重磅消息
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
界面新闻记者 | 肖芳界面新闻编辑 | 文姝琪 从去年就在寻找新故事的爱奇艺,又看中了线下娱乐业。 在2025爱奇艺iJOY秋季悦享会上,爱奇艺创始人、首席执行官龚宇在演讲中明确,线下业务未来将是爱奇艺的核心...
9月8日,越秀房产信托基金(00405.HK)发布公告,披露有关约34.33亿元出售越秀金融大厦50%权益情况。 公告称,于9月8日订立股权转让协议,拟向关联方广州越秀发展集团有限公司出售广州越秀金融大厦50%权益,此后,将余下的50%权益转让予内部重组方(即越秀房产基金的非全资附属公司)。...
WTI原油期货价格收涨1.14%,报65.72美元/桶。...
界面新闻记者 | 黄华界面新闻编辑 | 谢欣 据港交所6月17日披露,岸迈生物向港交所递交上市申请,中信证券和招银国际为联席保荐人。 官网资料显示,岸迈生物成立于2015年,产品集中在临床阶段,企业创始人为吴辰冰。在自主创业之前,吴辰冰还在华东理工大学担任过讲师,在哈佛医学院从事过免疫学...
界面新闻记者 | 王婷婷 城市更新领域,上海一直走在全国前列。 9月24日,界面新闻从首届城市更新发展大会上获悉,南昌大楼、钟和公寓、淮海坊一期、上生·新所、新天地广场、世界会客厅、上海展览中心、杨浦滨江公共空间等42个城市更新优质项目正式发布。 据界面新闻了解,这42个项目涉及城...
上期所原油期货夜盘收涨1.21%,报495元/桶。沪金主力合约收涨0.88%,报863元/克,沪银主力合约收涨3.90%,报10936元/千克。...