当前位置:首页 > 生活常识 > 正文内容

科大讯飞推出同传大模型与AI降噪系统,重塑翻译耳机体验

toodd3小时前生活常识2

科技巨头们,往往对翻译产品存在执念。

Windows 11 搭载了“实时字幕”选项,谷歌打造的AR眼镜能将传译内容投射到镜片之上,而几乎所有智能手机,都会内置一款名为“翻译”的原生App。科技公司对于开发翻译产品的共识,都指向了人类打破语言藩篱的古老梦想。

实现这一科技愿景的过程中,还有一家科技公司无法被绕开,不论是讯飞翻译机、讯飞翻译SaaS还是讯飞翻译app,即便之于普通用户,包括同传翻译在内的智能语音技术,早已令科大讯飞声名在外。

拥有这份用户认知不难理解。作为中国人工智能国家队,讯飞同传已累计服务全球50多个国家和地区;讯飞翻译机已触达超百万用户,翻译次数高达10亿次;而根据国际咨询机构IDC的权威数据,科大讯飞在AI翻译速度、效果、专业度、拟人度、产品应用成熟度、商业化规模、研发投入及用户推荐度8大核心维度中排名第一。

这些软硬件产品都折射出科大讯飞一条清晰的技术脉络:致力于打破全球对话壁垒。

因此,当10月14日科大讯飞推出“讯飞AI翻译耳机”时,迅速引起了行业和用户的广泛关注。

包括谷歌AR眼镜在内,“确保翻译的准确与速度”始终是尚未解决的核心痛点,而市面上的硬件翻译产品,也都还未摆脱“你一句我一言”使用困境。面对这些行业难题,在接受界面新闻采访时,科大讯飞翻译耳机产品线总经理林会杰给出了“相比竞品,我们的优势非常明显”的笃定回答。

讯飞AI翻译耳机究竟给出了怎样的差异化体验?而对行业而言,更重要的意义在于,面对“无语言障碍沟通”的古老愿景,我们需要了解顶尖科技公司们已行至何处。

翻译耳机,始于降噪

相比头戴、TWS耳机,翻译耳机对于收音提出了更严苛的要求,若无法保证输入足够清晰,翻译的准确性自然就无从谈起。落到实际使用场景中,翻译类硬件产品往往还要面临地铁、会场、户外等嘈杂场景,清晰收音的难度再次加强。

面对收音的核心痛点,讯飞AI翻译耳机搭载了一套“多感融合AI降噪系统”:拆解来看,作为一款开放式耳机,其配备了“气导+骨传导”麦克风,相比行业仅搭载气导麦克风的常规做法,骨传导麦克风加入后,支持通过用户说话时的骨骼振动来拾取声音,以此避免空气传播中的噪音干扰,同时还有两枚气导麦克风捕捉环境音和语音细节;借助ENC降噪算法,最终讯飞AI翻译耳机能融合空气与骨骼振动的两路传播音源,最大程度确保拾取人声时足够干净。

从产品哲学来讲,技术应用远非终点,只有对于细节不断打磨,方能决定产品体验的最终上限。例如,骨传导结构对于振动反馈极为敏感,因此耳机本身的振动一定程度会干扰收音效果,针对这个并不突出的问题,讯飞AI翻译耳机还特别定制了“骨传导回声降噪技术”,确保骨导麦克风完全收集到有效声音信号。还有一处细节是,讯飞AI翻译耳机采用了麦克风延长杆设计,以30度指向佩戴者,从而形成最佳拾音角度。

正如科大讯飞翻译耳机产品线总经理林会杰所言,从行业首创的多感融合AI降噪系统再到骨传导回声降噪等技术,我们的最终目的都是确保人声足够清晰。

“收音”看似不难,但不得不承认,真正做到“足够清晰”却在行业内所见寥寥,换言之,在同传的前置环节,凭借更全面的技术方案以及细节打磨,讯飞AI翻译耳机已经最大程度保证了信号源的清晰无误,为后续翻译工作做好了充足准备。

AI时代下,翻译耳机的更优解

收音的痛点被解决后,产品的最终效果就取决于翻译能力,其水准高低,核心就是对于翻译“快速与准确性”的经典权衡。

端到端语音同传大模型,即直接将语音信号一次性转换为目标语言,过程中不再需要“语音识别”、“文本翻译”等多步骤串联,将传统工作流革新为了“语音到语音”的解决方案。

因此当翻译链路被大幅简化后,再辅以蓝牙6.0低延迟以及专属同传服务集群缩短“排队”时间,讯飞AI翻译耳机的中英同传首响播报延迟低至2秒,大幅领先行业平均水准。翻译类硬件产品的延迟问题,在讯飞AI翻译耳机上得到了妥善解决,这亦是当下大模型改变传统产品体验的又一例证。

而针对翻译场景,端到端同传大模型的作用还不止于此。

同传过程中的核心难题是,逐字翻译能保证速度却语义零散,而逐句传译胜在连贯性,却又需要更长的等待时间,讯飞的端到端同传大模型再次给出了不同的使用体验。

原理上,讯飞同传大模型基于“意群”展开翻译。所谓“意群”,即“词”与“句”之间的翻译黄金单位,通过“意群”的切分,既能避免逐字翻译的生硬,也能保证核心意思不出现差错,是保证译文准确与流畅之间的最佳平衡点。

并且值得留意的是,讯飞最新的端到端同传大模型,已将主观体验提升至4.6分(满分5分),并在中英同传场景下新增“声音复刻”功能,仅需用户一句话,便可用自己的声音播报翻译结果。

最终落实到用户体验,讯飞AI翻译耳机离“双向实时翻译”再近一步,其摆脱了“你一句我一句”的机械式翻译场景,佩戴耳机的过程中,支持对话随时打断与回应,最大程度保证了用户之间的自然对话。换言之,同传大模型的复杂原理最终至简为了无感的跨语言对话。

具体到参数,讯飞AI翻译耳机共支持60种语言同传互译,并内置10万+专业词库,其中包括医疗、制造、金融、法律等高壁垒行业场景,因此不论是专业还是日常对话,都是讯飞AI翻译耳机的目标使用场景。

自研软硬件,讯飞AI翻译耳机的另一产品哲学

尤为关键的是,从硬件再到其背后大模型,讯飞AI翻译耳机均采用了全栈自研模式,相比市面上依托于第三方大模型的翻译类硬件产品,全栈自研模式是这款产品的另一关键产品力。

林会杰特别提到,针对骨传导等特殊信号,通用模型识别效果有限,而讯飞借助自研大模型,实现了与前端硬件的深度适配,确保了降噪后语音数据的高精度识别。

实现自研软硬件的协同适配,往往也是顶级科技公司的通用做法,苹果的iPhone即是典范:其自研A系列芯片与iOS系统构成了“软硬一体”的闭环生态,确保了系统资源的高效调度。相比之下,安卓阵营的芯片来源分散,其操作系统与多种硬件平台之间的适配就存在了更高的壁垒。

此外,借助软硬件的自研模式,讯飞AI翻译耳机能对用户反馈与需求作出快速迭代,并后续通过云端OTA不断完善耳机产品力,这也是使用第三方模型无法完成的体验。并且不容忽视的是,在使用翻译耳机的过程中,用户所产生的语音数据不会外传给第三方模型,在数据隐私保护上自研方案同样更具优势。

因此正如林会杰所言,“讯飞想要交付给用户的,不单单是具备大模型翻译能力的产品,更是一款拥有持续稳定体验、支持不断优化迭代的智能AI耳机产品。”

一款全面的“多语言耳畔智能体”

当产品配备强大的翻译能力后,其设计核心,即在于通过具体功能将此能力最大化。

讯飞AI翻译耳机支持通话场景,可实现跨洲际对话与多任务并行;而在面对面场景下,双方可各佩戴一只耳机并自动进行无按键、实时翻译;线上同传功能则兼具双语转译与录音复盘选项;旁听同传则可凭借5-8米定向拾音去适配会场需求。一句话概括,在强大传译能力的加持下,讯飞AI翻译耳机几乎覆盖了所有日常以及专业的同传场景。

翻译之外,这款耳机也拥有一系列AI功能,做到了“耳畔智能体”的产品定位。目前,讯飞AI翻译耳机已上线AI播客功能,支持用户上传文档或文章链接,耳机能够以风趣的聊天语气播报文章内容,而当用户语音唤出“小飞”时,耳机即可实现口语陪练、资讯查询等多元服务。

而回归到耳机本身,讯飞AI翻译耳机采用钛丝支撑与黄金重心设计,单耳仅重11.5g,经过实测,即便长时间佩戴后也能保证舒适与稳定性,外加动态音效调节、以及最长42小时的续航时间,因此即便作为日常开放式耳机佩戴,讯飞的这款AI翻译耳机也给出了不俗表现。

在界面新闻与林会杰的沟通中,其坦言,讯飞对于翻译耳机的终极构想是“更准、更快、更自然”,在自研多感融合降噪系统、端到端同传大模型以及AI等技术的加持下,这款全新的AI翻译耳机,就是讯飞实现无感自然、随听随译这一愿景的最新答案。

更深远意义在于,讯飞AI翻译耳机也不仅仅是那个最新答案,同样亦是一把由技术构筑的钥匙,承载着顶级科技公司对于“无界未来”的期许,相信终有一天,这把钥匙会打开那扇阻隔文明交流的古老大门。

扫描二维码推送至手机访问。

版权声明:本文由猪猪博客发布,如需转载请注明出处。

本文链接:https://yunweigou.cn/87929.html

分享给朋友:

“科大讯飞推出同传大模型与AI降噪系统,重塑翻译耳机体验” 的相关文章

博瑞医药,筹划发行H股股票并在香港联交所主板上市

博瑞医药,筹划发行H股股票并在香港联交所主板上市

博瑞医药9月26日公告,公司拟发行H股股票并在香港联合交易所有限公司主板上市,以加快国际化战略及海外业务布局,增强境外融资能力,提高资本实力和综合竞争力。公司将选择适当时机和发行窗口完成本次发行上市,并需取得相关政府机构、监管机构、证券交易所的批准、核准或备案。目前,公司正积极与相关中介机构进行商讨...

科技早报 | 雷军称与苹果的竞争是漫长而痛苦的过程;黑神话首家线下店试营业

科技早报 | 雷军称与苹果的竞争是漫长而痛苦的过程;黑神话首家线下店试营业

雷军:与苹果的竞争是漫长而痛苦的过程 小米集团董事长、CEO雷军在9月25日接受媒体采访时谈及了对苹果公司的看法。雷军认为,与苹果的竞争可能是一个漫长而痛苦的过程,还是要全心全意向苹果学习,一步一步地把每一个细节做好,“我们提的全面对标,不仅仅是配置和参数,而是在科技引领、体验等方面,要对标苹...

独家被指挂羊头卖狗肉!野人先生创始人回应产品现做实为预制质疑

独家被指挂羊头卖狗肉!野人先生创始人回应产品现做实为预制质疑

界面新闻记者 | 赵晓娟界面新闻编辑 | 牙韩翔 当冰淇淋品牌野人先生不断在各地商场扩店和投放广告时,它在宣传中声称的“当天现做”也遭到了质疑。 在社交平台上,界面新闻看到消费者拍到野人先生门店里的冷冻奶浆原料包,使用保质期长达6个月。有评论认为野人先生为“预制冰淇淋”,所谓“现制”仅是...

戴家凯重返广发银行董事会,任职资格曾悬而未决

戴家凯重返广发银行董事会,任职资格曾悬而未决

界面新闻记者 | 曾令俊 中信信托副总经理戴家凯重返广发银行董事会。 9月25日,广发银行发布的公告显示,该行于9月23日召开的2025年第三次临时股东大会审议通过了《关于选举戴家凯先生为广发银行股份有限公司...

商务部部长王文涛主持召开在美中资企业圆桌会;美国宣布对欧盟征收15%汽车关税

商务部部长王文涛主持召开在美中资企业圆桌会;美国宣布对欧盟征收15%汽车关税

习近平听取新疆维吾尔自治区党委和政府工作汇报 新华社消息,率中央代表团出席新疆维吾尔自治区成立70周年庆祝活动的中共中央总书记、国家主席、中央军委主席习近平,24日听取新疆维吾尔自治区党委和政府工作汇报。他强调,新疆要完整准确全面贯彻新时代党的治疆方略,坚持稳中求进工作总基调,统筹发展和安全,...

汽车早报|零跑汽车回应成失信被执行人 理想i6正式开启交付

汽车早报|零跑汽车回应成失信被执行人 理想i6正式开启交付

中国科协主席万钢:实现L3、L4级别的自动驾驶,需要智慧的道路和云计算技术平台的支撑 据中证金牛座,9月27日,在2025世界新能源汽车大会上,中国科协主席、世界新能源汽车大会主席万钢表示:“要实现L3(有条件自动驾驶)、L4(高度自动驾驶)级别的自动驾驶,需要智慧的道路和云计算技术平台的支撑...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。