当前位置:首页 > 企业新闻

beat365首页_科大讯飞胡郁:再过四到五年时间,机器语音识别就能达到人类水准
本文摘要:按:这是科技大学通信飞轮值社长胡郁在2016网易科技未来峰会上公开发表的人工智能以语音和语言为入口的认知革命的演说。

按:这是科技大学通信飞轮值社长胡郁在2016网易科技未来峰会上公开发表的人工智能以语音和语言为入口的认知革命的演说。(公共编号:)整理,有删除。刚才王建老师说,未来的世界是生命科学技术的时代,我非常同意。将来人类的命运由我们自己控制,我们可以改建自己。

人类也想扮演上帝的角色。人类所以需要在地球上统治整个世界,是因为我们有智能,现在在一定程度上自己有智能,有必要构筑新的智能。在现在的世界里,各种各样的智能层出不穷,智能这个词被滥用了一段时间。

beat365首页

智能应该向什么方向发展,智能应该给我们带来什么?今天我们想带着这个疑问和大家一起探索。今年3月有着名的AlphaGo战争李世石,到目前为止很多人都预测,包括我自己在内,我当时的预测是机器人必须战胜人类。为什么呢?只是,如果在研究界有名的话,机器人在智能方面战胜人类是最擅长的方法,不是人类思考的方法。

我们本来讨论的时候下围棋是一项非常高尚的运动,并不是每个人都能下棋,但是机器明显不是这样想要的。在这场比赛结束时,凤凰卫视《一虎一座谈》要求我和古力九段和柯洁九段讨论AlphaGo和李世石对战的情况,柯洁九段在《一虎一座谈》中钦佩(按:比赛前他多次敲打即使阿法犬战胜了李世石,也输不了)。

AlphaGo为什么要战胜人类,显然不是人类擅长的方法,而是机器擅长的方法,AlphaGo需要同时计算每个棋下的几十步甚至几百步的可能性,AlphaGo需要忘记三千万种方法的对局但是,人工智能在所有方面都需要打破人类吗?我也不一定。因为我们看到棋手几乎是信息半透明的公开发表游戏论,就像以前的棋一样,机器占有相当大的优势。许多人会问,人工智能反映在什么方面?我们告诉人类有农业革命、工业革命和当前谈论的信息革命,但许多人可能不告诉他们,人类只在统治者地球的过程中经历了漫长的历史发展。有一本书《人类简史》。

这本书上写道,人类在地球上已经出现了200万到300万年,这些人类在世界各地,是我们谈论的猿人、欧洲原始人、中国山顶洞人、元谋人和蓝因人,但经过历史学家和基因工作者的研究,7万年前,智人从非洲回顾杀死了其他猿人,现在黑人白人、棕色人种、黄种人都是智人的子孙。在这个过程中,智人突然醒来,人的智能在经过两三百万年的发展中突然大步前进,是什么让他们跑到这里的?历史学家称他们为理解革命。他们发现这些人和其他猿人仅次于的不同,他们的语言非常丰富,有对话,产生文字,产生文字后有一些好处:第一个好处,可以更好地描述周围的自然世界。

例如,河边有狮子,告诉狮子长大,身体是否生病,处于什么状态。更重要的是,因为有语言,有语音,所以可以说明团队和团队的关系。如果没有语言,现在动物群中的黑猩猩,一个团队只有50头以上,50头以上不能管理,但是智者有语言,所以他们可以组织成千上万的团队。第二个好处是,有了语言,我们可以叙述我们共同想象的内容,一些虚构的概念,公司和梦想都是从现在开始的。

所以,现在历史学家最重要的观点之一是人类的认知革命将人类的智能带回新的高度。机器擅长的运算智能,但是说到感觉智能,机器只是比我们差得多。这也是科技大学现在贯彻的以语音和语言为入口的计算机认知革命。

我们继续实施的超脑计划是通过传感器和算法来感知世界,理解自然的人类世界,作为我们人工智能最重要的突破点。如何构筑这一突破,我们有两种不同的方法,一种与我们的大脑科学非常相关,我们可以分析大脑的所有神经元结构和其工作机理,甚至可以根据大脑的整个工作机理重建和大脑完全相同的机制,这是一种想法,但是这种想法时间很长我们在鸟类飞行中使用了飞机,但是我们没有建造鸟类。因为我们在告诉鸟类飞行中的空气动力学。

我们在研究大脑,但不是把大脑复印完毕,而是寻找大脑中的智力动力学,进一步优化自学算法。从另一个角度来看,用网络思维解决问题,改解决问题并改进我们的人工智能,我们应该感谢三个方面的进展:第一,人工神经网络,这个人工神经网络就像我刚刚说的那样,只教给大脑一些非常简单的机理,没有大脑那么简单,但是我们已经可以很好地工作了。此外,我们可以通过互联网和移动互联网获得大量的数据。

更重要的是,我们有数千万的算法来回用户,这些产品不断地从后台使用用户的习惯,我们可以大大优化网络的效果。正因为有这三者的委托,我们取得了很好的结果。的确,人工智能的框架应该是什么样的呢?另一个例子是人脑皮层在工作过程中分为两个层次:一个叫感觉层次,我们谈论的视觉、听力和触觉,另一个层次是理解层次,我们看到猫,听到猫的叫声,或者碰到猫的毛皮,人脑中有概念,这些概念构成了我们语言中的单词和词汇因此,在通信飞来的超脑中,感觉智能在识别我们听到的、看到的、触觉到的东西的同时,将识别结果降低到理解智能的水平,构成概念空间的应对和推理小说,在过去的5年里,我们将深刻的自学网络应用于刚才我们谈到的感觉和理解(工作人员播放了三个声音段落)这是声音段落,第一个是睡觉,第二个是休息室,但是休息室,但是听到原始段落后不会告诉(按:像大脑自动矫正畸形一样)。

原来这句话是西游记的大闹天宫。人的大脑是怎样工作的呢?人脑需要记住短时间或中间或宽时间的记忆,通过反复的方法识别声音,现在最新的反复神经网络需要模拟我们在大脑方面的感觉,这个过程非常复杂,我不会逐一说明。

但是,光的反复太多,光的存储记忆太多,现在最近的一种方法是用我们说话的图像的方法识别声音,声音进入耳朵时,我们耳朵里的纤毛不会根据其长度和声音的频率展开共振,分析共振的频率就能得到语谱图,这个图形的信息非常丰富如果我们的识别系统需要阅读这些图,整个性能的稳定性将不会大大提高。如果你是盲人,你的耳朵就不会特别灵活。因为借了我们视神经方面的神经系统和细胞,所以可以借出能力。我们应用于新的卷积神经网络,它本来是为了实现图像,处理我们的语音图像,我们得到了惊人的结果。

与最近的反复神经网络相比,用卷积神经网络,也就是说用识别图像的方法,我们还可以得到48%的提高。现在我们的声音不仅可以听到,还可以看到。因为这样的结果,我们不会看得更多。在我们的各种输入方法中,在我们的语音搜索中,在我们的各种语音交互系统中,语音识别的错误率每年在30%的水平上升。

我相信再过四五年,我们最后的语音识别系统几乎和人的感觉一样。在感官方面,我们的语音识别技术大幅度提高,但在理解方面,必须完成一些非常核心的任务。

语言解读和深层、科学知识的说明和推理小说,以及自律自学,构筑这些技术需要两个层次。第一,解决问题的自然语言叙述问题,在此基础上解决问题的语言解释和深层,以及我们谈论的科学知识的说明和推理小说的各个方面。

刚才我们提到了大脑皮层中对概念的反应。那是图,不同语言之间的概念有空间。

例如,大家好,传统的传达,每个语言代表空间,我们把每个语言的频繁出现视为1,不频繁出现的地方视为0。这是传统表现语言的方法,语言和语言之间,或者距离完全相同,或者不同。现在我们用倒数的空间来表现单词,每个单词、每个单词都可以用单词卷积的方法,用倒数的数字,等于空间的坐标系统,可以计算每两个单词之间的距离。

我们凝聚所有的语言,可以看到新浪、网易、腾讯等结果,可以看到吕布、张飞、关羽、诸葛亮,他们相似。用医学方法测量的话,脑皮层中存储的词语的方向也不会很相似。利用这种方法,我们建立了表现语言空间概念的传达系统,在这种传达系统下,我们可以进一步分析语言水平、句子水平和章节水平,他们在各个水平的连接和计算的距离。有了这个,我们来看看实际的发展。

他们能做什么?首先,让我们看看语言的解释和深度。首先,让我们来看看翻译。在翻译方面,我们告诉他们要进行语言锻炼,因为不同的语言是不同的。

beat365官网

此时,人们大脑中最重要的概念和关注模型之一。例如,我们在看图片,海边有一个灯塔。

当我们看到它时,我们的注意力集中在灯塔上,而不是其他方面。这张图很有趣。上图是男司机开车时仔细观察各种各样的东西,下图是女司机,她的想法狭窄。

如果我们来看文字的话,这两天正好是欧洲杯,我们的注意力只是集中在那些文字中有信息量的地方,这关注度模型,其方法是自动找到我们最关注的输入量,应对我们最后的结果。让我们看看基于机器翻译的实际例子:每个人都告诉他们,在不同的语言之间,他们的机器翻译,如许多谓语、主语和宾语,他们的方向是不同的,不会倒置,顺序也不会再发生许多变化。

原本,这些变化非常复杂。通过我们现在谈论的神经网络,我们可以看到以下几点,输出我是谁、谁和我。

他们的方向是不同的,但是使用attention这个神经网络,他们可以自动找到相应的关系。使用新的神经网络翻译成系统,比传统系统提高得不多。让我们看看下一个明确的例子。

我们最近告诉科技大学在教育方面做了很多工作。我们希望机器人能帮助我们的老师进行答案测试。例如,我们写了作文。

这篇作文,机器人也希望得分,得出评价。让我们看看这个例子。右边的94分是这篇文章的分数,右边有评论。

此外,从这篇文章中,我们可以看到它使用了排名,并使用了一些句子。我们怎样才能让机器理解这些?机器的关注度如何自动落在这些重要地方?只是非常简单,右边是范文,刚才我们说了,应该用倒数的空间回答,利用这些范文和作文之间的向量,利用我们的关注度模型,自动找不到相对访问的地方,现在我们的结果是中考和中考的作文评价,中文和英语都有很好的效果最后,让我们看读者解读问题。我们看了一段话,月牙的影子在水中摇晃鸭子,以为是鱼,急忙游泳,现在的主题是我抠掉鸭子,机器看完这段话后,自动堆积这个地方应该堆积什么,利用我们现在的系统,我们不会把文章和问题展开attention的计划,鸭子也经常出现在其他地方,可以计算出各地方的热力(关注度)的情况,然后发现鸭子的关注度最低现在读者的解读能超过6岁孩子的水平,大家不要轻视6岁孩子,6岁孩子的常识解读能超过一个水平,6岁以后主要学习各种科学知识,这与我们理解的是,2岁、3岁、4岁构成个人最重要的自学能力,这方面是最完全一致的。

6岁儿童常识的自学能力超过后,我们相信我们会教他小学、中学、高中的科学。知识之后,最后可以考上大学。原始文章允许禁止发布。下一篇文章发表了注意事项。


本文关键词:beat365官网,beat365首页

本文来源:beat365官网-www.labcogen.com