您现在的位置:主页 > 新闻动态 >

神经网络能解读唇语?LipNet让AI监控技术更先进_博鱼体育官网入口

时期:2022-07-17 00:44 点击数:
本文摘要:据Theregister报导,牛津大学、谷歌旗下AI公司DeepMind以及加拿大高级研究所向机器学习学术大会(ICLR2017)递交的论文称之为,它们研发的神经网络LipNet可以理解唇语的秘密,AI监控技术将显得更为先进设备。 研究人员称之为,通过分析视频中某人讲话的时空视觉特征,LipNet可以破解其正在说什么,比人类专业的唇语理解专家更加能干,准确率高达93.4%。 这是首个打破非常简单词汇分类的AI模型,可以用于句子级序列展开预测。

博鱼体育官网入口

据Theregister报导,牛津大学、谷歌旗下AI公司DeepMind以及加拿大高级研究所向机器学习学术大会(ICLR2017)递交的论文称之为,它们研发的神经网络LipNet可以理解唇语的秘密,AI监控技术将显得更为先进设备。  研究人员称之为,通过分析视频中某人讲话的时空视觉特征,LipNet可以破解其正在说什么,比人类专业的唇语理解专家更加能干,准确率高达93.4%。

这是首个打破非常简单词汇分类的AI模型,可以用于句子级序列展开预测。  理解唇语是非常复杂的工作,即使对于损失了听力的人来说,其平均值准确率也仅有为52.3%。

研究人员称之为:机器破解唇语有极大的应用于潜力,可被用作提高助听器、公共空间默写、掩饰对话、在喧闹环境中语音辨识、生物识别以及处置电影默片等。  但是对于那些担忧中央监控系统加载其秘密对话内容的人来说,还不用深感惊恐。研究人员否认,十分准确的唇语破解十分少见。

大多数情况都是受限的词汇被串联成句子,而且它们往往没任何意义。  研究人员利用网格语料库(GRIDcorpus)训练和测试LipNet。

博鱼体育

这个语料库中有一系列音频和视频,还包括34名演讲者每人谈的1000句话。这些句子都有非常简单的语法结构,还包括指令(4)+颜色(4)+介词(4)+字母(25)+数字(10)+副词(4)。

  括号中的数字代表每个类别可选单词的数量,这意味著它们共计可以构成6.4万个句子。由于许多文件早已遗失或损毁,现在还有13名演讲者讲出的32829个句子。  LipNet必须许多训练,才能超过如今的精准程度。


本文关键词:神经网络,能,解读,唇语,LipNet,让,监控,技术,更,博鱼体育app官方入口

本文来源:博鱼体育-www.dstuye.com



Copyright © 2001-2021 www.dstuye.com. 博鱼体育科技 版权所有 备案号:ICP备19956479号-4