设备能读懂唇语 向脑机接口又迈进一步

绘艺坊 2025-10-29 23:05:48 66
  导读:人工智能设备又迈进一步:能读懂唇语。设备一种新型的读脑机语音合成器可以跳过语音记录,而直接将说话者嘴部动作转换为语句。懂唇

  网易科技讯11月29日消息,语向又迈据外媒报道,接口进步一种新型的设备语音合成器可以跳过语音记录,而直接将说话者嘴部动作转换为语句。读脑机

  该设备能“观看”嘴唇的懂唇动作,并利用人工智能网络将它们转换成声音。语向又迈

  研究人员表示,接口进步该设备将能帮助声带麻痹患者发声,设备向脑机接口又迈进一步。读脑机


  描述该装置的懂唇研究发表在《PLOS计算生物学》期刊上。

  这项研究的语向又迈作者来自法国国家科学研究中心。文章中提到,接口进步“这种语音合成器将人体主要语音发音器(舌,颚,口和嘴唇)的运动转换成智能语音。”

  说话者的发言,以及嘴部各个部位的位置会被同时记录,然后通过人工智能网络算法进行分析。

  此处使用的人工智能算法是基于人类大脑建模的深层神经网络(DNN)。算法设计针对偏复杂的模式识别。

  该深层神经网络DNN通过测量舌头、下颚、软腭和嘴唇的协调动作(又称为”发音语音信号“)来识别嘴正在发音的某个词语。


  作者解释道,DNN计算模型对这些测量的数据进行训练,将“发音语音信号”转换成“声学语音信号”。

  作者提到,这项研究中,我们让用于训练DNN模型的用户,以及陌生新用户都来测试语音合成器的实时控制性能,从而评估它在是否能很好地成为脑机接口的一部分。

  “语音脑机接口将能通过解码皮层的语言相关活动,实时控制语音合成器,从而帮助有严重发声障碍的人恢复交流。

  为帮助连声道都无法震动的患者“说话”,科学家将必须掌握如何解码大脑信号,并将其翻译成语音。

  使用人工智能来解码语音和语言已有先例。

  谷歌不久前推出了多语言之间机器翻译系统。该系统被成为“Zero-Shot翻译系统“,并具有自我学习能力。它能将未学习过的两种语言翻译成一种已经学习过的语言 ——换言之,通过人工智能训练学习了如何实现X语言对Y语言的翻译后,系统就能立即自动掌握从X到Z语言的翻译。

  Google Brain的博文把这项翻译技术称为神经机器翻译系统(Google Neural Machine Translation ,简称GNMT)。

本文地址:https://ptfflx.cn/html/034f51799448.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

腾讯的蝎子叫什么(上市总公司中文网站工程建设最基本的机能市场需求)千万别说自己,

游仄易远晨播报:《丧尸围乡》登岸PC 《女神同闻录5》新演示公布

可骇保存游戏《小梦魇》颁收 童年暗影中的无贫惊骇

GC 2016:《终究胡念15》超少演示公布 齐圆位掀示游戏要素

金沙龙神 娱乐代理平台注册收款业务流程图片(著眼女装行业科枫,“轻体育运动”或将成为未来赛车场新主张)专做体育运动女装的品牌,

PS4 Pro 4K游戏真机演示串烧 次世代绘里结果惊人

Square Enix正在欧盟为两款新游戏注册商标 或将重启《弹震症(Shellshock)》

游仄易远晨播报:派推受将挨制《战天》同名电视剧

友情链接