当前位置:首页 > 健康科普

AI进入无障碍时代:手语识别翻译的应用意味着什么?
本文摘要:相信在人们的印象中,AI是属于多数的技术部门。

相信在人们的印象中,AI是属于多数的技术部门。大多数意思是,第一意味着数据量大,容易积累,限于AI非常依赖大量数据的特性,第二意味着场景普遍应用,需要的重复使用成本容易,限于AI开发的高门槛投入。现在我们周围经常出现的脸部识别、语音交流等,只是符合这些特征。

但是,这并不意味着属于少数派的AI是空白的。现在,最好把目光投向需要支持少数与多数区别的技术发展。

例如,服务于听力障碍者的手语识别是典型的例子。你我不懂的手语,为什么AI也难背?手语是用手势比量动作,根据手势的变化模拟形象和音节所包含的一定意义和语言,是听力障碍者独特的交流方式。但是,这种交流方式可以让听力障碍者之间交流,也可以让解读手语的普通人交流,但是不能满足听力障碍者和普通大众之间的交流市场需求。

此后,在一些社会公共空间中,如政务场景或服务业场景,听力障碍者可能会遇到一些不便。AI正好成了解决办法。

我们在一些软件中,已经开始应用于AI的手势识别能力,照片时看起来比心启动时的AR效果。这种对手势的狩猎,是不是可以和手势的语义相对应,构建对手语的翻译和分解?这个逻辑是正确的,从逻辑正确到不现实的应用,还有不短的路要走。首先,手语的传达有一定的特殊性,开展狩猎并不容易。我们在划手势这种不道德上,本来就没有意义上的正确性,而且手语的语言传达非常相似,而且手语的传达一般以句子为单位,语言和语言之前有显着的间隙。

beat365首页

在过去的手势识别中,使用前置照相机进行狩猎基本上是不现实的。因此,许多科学技术和团队提出的解决方案是外部设施,如中国科技大学和微软公司将基于Kinect的手语翻译成系统,加利福尼亚大学多次发售的手语识别手套等。但是,这些外部设备是便携性低还是成本低,推进起来相当困难。

同时,手语传达在一定程度上也具有国别性和地域性,在模型通用性上并不困难。手语有文法手语和自然手语两个概念,文法手语是标准化的普通话,自然手语就像方言一样,在国别、地方、城市之间有很大差异。

这也导致了手语数据的收集、显示不是成本高、工作量大的事情。例如,亚马逊多次明确提出,重建智能扬声器Alex可以翻译非常简单的信号。但是,由于大规模的训练数据集不足,目前该功能无法识别非常简单的美国手语,停留在实验室阶段。

手语破题没有秘密,AI产业很难探索平权,但科技企业们和学界在手语AI方面取得了很大成果。例如,腾讯优图实验室发售的优图AI手语翻译机、恋人奇艺发售的AI手语播音员等,手语AI的应用取得了很大进展。手语AI的突破可以分为两种渠道,一种是手语AI本身技术的进展,另一种是应用于场景的突破。手语AI技术本身可分为识别模型和数据集两种解决问题的途径。

在数据集中,像优图一样,通过与社会相关的机构和听力障碍者的认识,可以自己识别数据集,根据对方语言传达的地方性差异,扩大传达习惯和速度的多样性。关于识别模型,业内也有通过2D卷神经网和3D卷神经网分别提取手势中静态和动态的信息的新算法构建概念,通过综合处理提高视频识别效果,完全摆脱其他传感器的束缚。

同时,对于对手语言传达的整个句子的简化现象,在视频框架的最后再次加入语言信息的挖掘,对特征提取器明确提出的信息进行检查,进一步确认手势对语言传达的界限,不仅可以提高识别精度,还可以提高自然手语中地区传达的总结能力。在此基础上,算法模型还可以引进上下理解能力,以便面对更简单的手语识别翻译成市场需求。但是,为了提高技术,在场景末端的应用仍然不被允许。

例如,手语识别可能依赖强大的计算能力,短时间内便携化、消费化困难。但是,通过与政府的合作,可以将手语识别转移到公共服务场景中。

或者像恋人的奇艺一样,从手语分解来看,在某种程度上也能协助听力障碍者。但是,我们很难找到,只要合并技术就能找到,手语AI获得的变革,不是因为在某个基础科学上突然取得了难以置信的突破,而是更多的企业和学者在研究开发和数据积累上投入了多年,而是因为过去手语料库不足换句话说,企业和学者们在少数派的AI技术中投入了完全符合多数AI技术的能源和财力。对AI产业来说,这无疑是平权精神。以人为本,以技术为善:我们为什么更积极地引领技术洋流?腾讯优图在手语AI方面的投入,只不过是AI产业中势头强劲的洋流方向。

几天前,在福州的数字中国峰会上,马化腾首次提到科学技术善良的概念,明确提出我们相信科学技术需要给人带来利益的人应该重视科学技术,防止欺诈,防止恶劣利用的科学技术应该想解决问题自身发展带来的社会问题。没有独特的偶然,李飞飞回到斯坦福后,成立了HAI研究所(以人为本斯坦福人工智能研究所),从今年开始兼任所长。HAI的研究目标是推进AI技术向造福人类的方向发展,预测AI对人类生活的贯彻影响。科技巨头和学术界的旗帜之所以着眼于同一个方向,是因为人们已经开始逐渐找到AI、5G、产业数字化等技术力量的势头,已经到了领导和制约的地步。

正如上述所说,科技企业在这一波技术发展过程中发挥了相当大的促进作用,而逐利自然是企业的本能和本能,因此企业不会首次投身于适合很多人、场景普遍、研发成本低的技术。虽然这种不道德本身没有厚度,但是AI等新技术给予的效率提高过于明显,对于不能继续终端新技术的领域和集团的断裂和边缘化,是很多人思考的问题。

例如,随着英汉日法俄罗斯等主流语言的机械翻译能力大幅度加强,那些语料库不富裕,应用于人数少的语言不技术能力而被更加边缘化吗?在某种程度上,当公共事务被语音交互、图像识别等人工智能技术取代时,听力障碍和视力障碍群体在提供服务时会遇到更多困难吗?类似的情况只是在2018年底,联合国发表了英国政府数字化成果的报告,数据显示在英格兰,2010年以来无家可归者减少了60%,确保住宅等待名单下有120万人,救济贫困者的食品银行需求量急速增加了约4倍。因为很多贫困者不知道如何在网上申请贫困补助金,也不能在家里连接网络,最后在贫困中越来越深。

大多数情况下,即使没有恶意的技术,也有可能无法预测南北。我们应该更积极地引领科学技术。最后,根据2017年北京听力协会的预测数据,我国听力障碍者的数量约为7200万人。

世界卫生组织发表的最近的数据显示,世界上约有4亿6600万人患有残疾性听力损失。-让我们看看。这个世界上所谓的多数和少数派本来就是相对的概念,不存在黑白独特的区别。特别是对于AI这种擅长模仿人类能力的技术来说,不存在可以分解妨碍各组交流的空气墙壁,而不是使这种趋势越来越激烈。

我们利用技术创造美好世界的目标,既然不能丢下任何人,就不能丢下任何人。幸运的是,从服务于听力障碍者的手语识别翻译,我们已经可以看到这种倾向的南北——善于计算的大脑不是AI唯一的模拟对象,也不是人类的热心。我们相信在学术界和大公司的领导下,将来会有更多的企业关注无障碍的AI技术的发展,大大超过了各种隔膜的障碍。恋人绝望,但也有反响。

AI绝望,但也有回响。


本文关键词:beat365官网,beat365首页

本文来源:beat365官网-www.labcogen.com