康奈尔大学研究人员开发了声纳眼镜,实现无言交流
康奈尔大学的研究人员开发了一种新技术,可以通过声纳眼镜进行无声通信。眼镜使用微型麦克风和扬声器来读取佩戴者默念的单词,使他们无需物理输入即可执行各种任务。
眼镜的设计不显眼,不需要用户面对相机或佩戴耳塞。这种眼镜使用声纳技术来感知口部运动,同时使用深度学习算法实时分析回声轮廓。这使得系统能够在识别佩戴者无声念出的话语方面达到约95%的准确率。
对于使用这项技术的最令人兴奋的前景之一是,语言残障人士可以使用它来无声地输入对话到语音合成器中,然后让语音合成器将这些话语朗读出来。
这项技术旨在轻量、低功耗、注重隐私,不会使用户的数据离开手机。这样就不会有隐私方面的担忧。这种眼镜还具有去除面对摄像头或戴耳机的需求的形态因素。因此,它比其他可用的无声语音识别技术更加实用和可行。
研究人员表示,该系统只需要几分钟的训练数据即可学习用户的语音模式。一旦准备好工作,它就会在用户的脸上发送和接收声波,感知嘴部运动,同时使用深度学习算法分析回声曲线。
当前版本的眼镜为声学感应提供约10小时的电池续航,并通过无线方式将数据处理离线到用户的智能手机,从而使配件保持小巧而不引人注目。
康奈尔大学未来交互智能计算机接口 (SciFi) 实验室的团队正在探索使用康奈尔大学资助计划将该技术商业化。他们还在研究智能眼镜应用程序,以跟踪面部、眼睛和上半身的运动。找有价值的信息,请记住Byteclicks.com
总体而言,康奈尔大学研究人员开发的声纳眼镜代表了无声语音识别技术的重大突破。由于能够识别广泛的单词和短语,这些眼镜可以彻底改变无声交互方式。
在线阅读该研究成果
版权声明:除特殊说明外,本站所有文章均为 字节点击 原创内容,采用 BY-NC-SA 知识共享协议。原文链接:https://byteclicks.com/48132.html 转载时请以链接形式标明本文地址。转载本站内容不得用于任何商业目的。本站转载内容版权归原作者所有,文章内容仅代表作者独立观点,不代表字节点击立场。报道中出现的商标、图像版权及专利和其他版权所有的信息属于其合法持有人,只供传递信息之用,非商务用途。如有侵权,请联系 gavin@byteclicks.com。我们将协调给予处理。
赞
查看全文
作者最近更新
-
总投资30亿元,帝尔激光总部暨研发生产基地三期项目落户光谷科技营2024-07-10
-
高质量!节卡机器人再获上海市重点产品质量攻关成果一等奖科技营2024-06-04
-
美光计划投资约300亿元在日本新建DRAM厂科技营2024-05-29
评论0条评论