手语也能有声音?谷歌AI:我可以!
2022-07-23 19:09:06 来源:
【网易智能讯9月3日消息】谷歌表示,它的人工智能技术让智能手机能够解读和“朗读”手语。
这家科技巨头还没有开发出自己的应用程序,但已经发布了算法,它希望开发者可以利用这些算法开发出自己的应用程序。
在此之前,这类软件只能在个人电脑上使用。
来自听力受损社区的活动人士对该举表示欢迎,但他们表示,这项技术可能会难以完全掌握部分对话内容。
在人工智能博客上,谷歌的两位研究工程师瓦伦丁·巴扎列夫斯基(Valentin Bazarevsky)和Fan Zhang称,这项免费公开的技术旨在成为“理解手语的基础”。它是与图像软件公司MediaPipe合作打造而成的。
“我们很期待开发者会产生什么样的点子。就我们而言,我们将继续展开我们的研究,以使得这一技术变得更加强大,进一步稳定对手语手势的跟踪,增加我们可以可靠地检测到的手势的数量。”谷歌的发言人向媒体表示。
谷歌坦言这是第一步。活动人士指出,仅仅依靠手势生成语音的应用程序,可能会忽略掉任何的面部表情或做手势的速度,而这些因素可能会影响对实际手语意思的理解。
此外,该技术不会将任何存在于局部地区的地域性因素纳入考虑。
该算法可以跟踪两只手
听力损失行动(Action on Hearing Loss)的技术经理杰塞尔·维什努拉姆(Jesal Vishnuram)说道,这项计划在听到耳聋者的“声音”上是一个良好的开端,但还需要配套其它的一些功能。
他说,“站在耳聋者的角度来看,开发一种软件将文本或音频自动翻译成手语,以帮助他们的日常沟通,减少其在听觉世界中的孤独感,会更加有益。”
被遮挡的手指
过往,当这类技术试图在视频中追踪手部动作的时候,手指的弯曲和手腕的摆动会遮盖住手其他的部分,因此无法全面进行追踪。这是这类软件的早期版本的一个痛点。
而谷歌的技术则能够在手指、手掌和手背上的21个3D点位上绘制出一个图形,这样当手和手臂弯曲或两根手指接触时,就能更容易理解手势。
美国其他的大型软件供应商也开发了一些技术,来尝试在个人电脑上解读手语。去年,微软与美国国家聋人工学院展开合作,为教室配置台式电脑,然后通过实时翻译员帮助有听力障碍的学生。
在一篇博客中,学生们描述了他们之前错过了一些教授说过的话,因为他们在上课时无法同时查看人工手语翻译和教授在黑板上写的东西,得在二者之间来回转移注意力。
但是通过让电脑桌面显示所有要查看的信息,这一问题便得到解决。
在世界的其他地方,创新者们也已经创造了他们自己的本土技术。
肯尼亚的一名25岁的开发人员研制出了一副触觉手套,它可以给一款Android应用程序翻译手语,然后该应用程序会将对应的文本朗读出来。该款手套是罗伊·阿莱拉(Roy Allela)专门为他听力受损的侄女打造的,他的这一发明最近获得了美国机械工程师协会的奖项。(乐邦)
数字赋能全生命周期减碳施耐德电气2022年创新峰会开幕在即
(原标题:数字赋能全生命周期减碳 施耐德电气2022年创新峰会开幕在即) 当前,气候变化仍在加剧,加速减碳、实现可持续发展已成为
2022-07-23 16:42
施耐德电气王洁:双碳时代运行逻辑已变,企业亟需打造可持续影响
(原标题:施耐德电气王洁:双碳时代运行逻辑已变,企业亟需打造可持续影响力) 自双碳目标提出之后,减碳已逐渐成为社会各界的发展
2022-07-23 15:39
树榜样斩获佳绩-百度福建邵剑楠顺利通过2018年智学院培训
(原标题:树榜样斩获佳绩-百度福建邵剑楠顺利通过2018年百度云智学院培训) 强信念全力以赴,树榜样斩获佳绩 --百度福建营销中心技
2022-07-23 06:21
顶象发布《验证码“适老化”白皮书》助力数字金融适老化
(原标题:顶象发布《验证码适老化白皮书》助力数字金融适老化) 验证码作为人机交互界面经常出现的关键要素,是身份核验、防范风险
2022-07-23 05:20
Ios15.6续航怎么样耗电吗ios15.6续航能力评测
近日ios15。6终于来了,本次更新距离上次发布隔了65天,这次更新的话主要修复了设备仍有储存空间可用时,可能一直会显示储存空间已满的问
2022-07-22 14:15
耗费HR80%精力的低效工作,薪事力几分钟就能搞定!
(原标题:耗费HR80%精力的低效工作,薪事力几分钟就能搞定!) HR的日常是什么样子?刷简历、办入职、办离职、签合同、办社保、算考勤
2022-07-22 07:03