算法将成为人工智能时代的“科技原力”

10月25日,“TEDx漕河泾——科技的原力”主题演讲在上海举行,腾讯公司副总裁姚星在演讲中回顾了中国互联网20年经历的三个阶段,并且展望了人工智能行业的发展趋势。“算法,将成为人工智能时代的‘科技原力’”,姚星说。

过往的20年,是互联网飞速发展,并渗透到我们经济生活的每一个方面的20年。姚星将其划分为三个阶段:窄带时代、宽带时代和移动互联网时代。

诞生于1998年的Google,首页最初是一个极为简洁的搜索框,这个首页的传输大小是小于1024字节的,“因为以太网的最大传输单元MTU就是1024字节”,姚星介绍说。

与此异曲同工的是,1999年正式发布的OICQ(QQ的前身)也是窄带时代的典型产品,它极大程度上方便了用户的沟通,但客户端只有几十K大小,为了实现丢包重传、保证用户体验。QQ的开发需要修改底层的TCP/IP协议和Linux Kernel,这曾是一个重大的技术挑战,技术难题的攻克,使得QQ的单位后台处理能力达到同类产品的十倍以上。

如果说1999年QQ推出之时,适逢“窄带”的中国互联网接入寻常百姓家;那么以QQ空间为代表的社交网络空间的兴起,就是伴随着宽带网络的普及而来的。人们通过社交媒体实现的功能,从“沟通”转变为“分享”。

据姚星介绍,QQ空间的照片上传量日峰值超过5亿张,为了保障用户上传和读取照片的体验,技术团队基于硬盘裸设备,自行开发了一套文件系统(File System)。

进入21世纪的第二个十年,随着3G、4G技术和智能终端的普及,移动互联网让所有人保持24小时随时在线。诞生于2011年的微信以连接人为起点,逐步连接信息、连接商业、连接服务、连接设备,进而连接一切,成为了一个用户的生活方式。由于用户对于微信的依赖程度日益提高,腾讯的技术团队为此制定了尽可能完备的数据中心容灾方案,以保证用户的顺畅体验。

诞生于1998年的腾讯,今年的11月11日将迎来18岁生日。从QQ到QQ空间,再到微信,腾讯在互联网发展经历的窄带、宽带和移动三个阶段,均有最具代表性的产品推出,而支撑产品创新的,一直都是技术原力的驱动。

今年正是1956年Dartmouth会议上提出“人工智能”概念的60周年。姚星认为,人工智能可能会是接下来技术爆发的一个重要领域:“人工智能在过往的60年中起起落落,而随着云计算和大数据的发展,人工智能将会散发出璀璨的光芒”。

在姚星看来,当前的人工智能行业,在语音识别、图像识别等垂直领域已经获得了一些阶段性的进展,诞生了一些不错的应用。不过总体来说,人工智能的发展还处于一个比较初级的阶段。人的智能是与生俱来的,本就处于一个很高的起点。一个明显的例子就是,人对新生事物的认知只需要通过少量样本的学习就可以掌握,但目前机器学习还是基于大量样本的。

“人工智能的‘科技原力’就在于算法的突破”,姚星说,机器学习的方法在于学习深层次的特征,而不是表面的现象。这就像人类学习鸟儿的飞翔,不是仿照鸟一样粘上羽毛、插上翅膀,而是研究空气动力学和流体力学。

姚星认为,人工智能核心算法的突破将会在三个方向:创造力、归纳总结能力和举一反三能力。腾讯的人工智能实验室就致力于对“通用人工智能”的研究,提供更加便捷的智能工具,帮助每个人实现心目中的“大白”,让青少年被理解、成年人被保护、老年人被照顾。

科技的原力是什么?

“原力就是我们改变世界的力量,是每个人追寻自我主宰的梦想,是人们仰望星空的感觉”,在演讲的最后,姚星说。

以下为姚星演讲全文:

刚刚听到C++之父本贾尼的演讲让我思绪万千,作为C++的忠实粉丝和使用者,让我想到我用C++写代码的青葱年华和激情燃烧的岁月。感谢本贾尼先生发明伟大的C++语言,改变了我这一代人的工作方式。

大家好,我叫姚星,来自腾讯,在腾讯工作了12年。一个多月前集团公关部的同事告诉我,希望我可以参加TEDx,讲述一下腾讯背后的科技原力,我当时说我不知道讲什么,因为我们做的事情都很普通也很平凡。同事说这样不行,他一方面告诉我TEDx是一个很重要的presentation,另外一方面也告诉我腾讯作为一个世界级的互联网公司过往做了很多世界级的产品,但在对外的技术宣传上少之又少,我们有责任通整个行业进行我们技术上的经验和教训的交流。我一想也是,仔细想来,虽然我们的工作很平凡也很普通,但是平凡中会折射出与众不同,今天我就和大家分享一下腾讯认知的"科技的原力"。

原力是什么?按照《星球大战》电影的定义原力是"一种极大的能量"。

首先看一组数据:10000亿,100亿,4小时。10000亿是如今全球IM一天的消息总量,这是个极大的数字,如果我们把它换算成书籍的容量,它大概是1亿册,相当于中国最大的图书馆——中国国家图书馆藏书量的5倍;100亿是当今全球一天的图片分享总量,这个数字如果用数码相机一秒钟拍一种照片的速度衡量,它需要用300年才能产生100亿的照片,如果我们把这些照片连接起来,它可以绕地球50圈;4小时是现在我们平均每天上网的时长,这个时间已经超过了我们观看电视的时间。

这些数字的背后也是信息产业的3个时代,过往的20年是信息时代快速发展的20年,信息产业的发展已经超过了其他产业,它经历了3个时代:分别是窄带时代、宽带时代和移动互联网时代。

窄带时代,我们的网络传输效率比较低,主要解决的是沟通问题,人们无需再像古人那样"飞鸽传书"或者通过传统的邮件进行通信。人们可以通过internet实时的传输我们的消息,我们可以结交更广阔的朋友,无论身处天涯海角,只要能连接上internet,信息总是可以触手可及。随着基础网络设施的发展,网络传输的效率和容量越来越大,我们进入了宽带时代,在宽带时代人的诉求不再仅仅是沟通,更大的诉求是信息分享,"人人为我,我为人人",人们在朋友之间分享快乐,总结教训;人们在更广阔的互联网世界里帮助他人,或者寻求帮助;人们在熟悉的、不熟悉的,认识的、不认识的人之间传递信息,分享信息。随着3G/4G移动通信网络的发展,智能手机的普及,我们又进入到了移动互联网时代,移动互联网时代人们不再像原来那样要在指定地点,特定时间段连接信息世界,人们可以每时每刻、随时随地连接互联网世界。

信息时代的发展推动了整个互联网产业的发展,也提升了我们的生活质量和水平,每个阶段都诞生了极具有代表性的互联网产品,它们的出现改变了人们的生活方式,也深深的影响了我们这代人的生活。

QQ就是窄带时代极具代表性的产品。大家还记得那个网络传输效率较低的年代google的首页吗?google的首页为何如此简洁?google的诞生是1998年,也是身处窄带时代,如果看它的首页字节,大小是小于1024的,为什么要小于1024字节,因为以太网的MTU(也就是以太网最大传输单元)是1024,google为了让用户在一个网络包中传输完成,所以它把页面大小降到了1024以下,这是一种极致传输的表现。QQ的背后也蕴藏着诸多极致追求,早期的QQ客户端安装包是几十k的大小,是为了让用户更快下载,更方便使用。QQ后台的通讯协议是修改过TCP协议站的,之所以这样是因为QQ希望传输协议既具备TCP的丢包重传能力,又要具备UDP的高性能,这样QQ可以在保证传输信息的同时又可以维护更多的用户网络连接,在那个年代QQ的单位后台处理能力可能是其他同类产品的10倍以上。

QZone是宽带时代的杰出代表产品。2013年Facebook的公开数据显示Facebook的日上传照片数为3.5亿张,总照片存储数达2500亿。今天的QZone日上传照片峰值超过5亿,照片总量达6000亿,和Facebook同一级别!照片的存储是宽带时代极具挑战的技术难题,它不光是海量存储的问题,而且还有海量访问的问题,因为你的照片不仅仅是你自己访问,你的朋友也会来访问,它带来的性能开销是几十上百倍的。存储的难题除了性能还有成本,极致性能下的极致成本。QZone的后台存储系统是一个在物质介质上重新实现的一套存储系统,它是一个非常有挑战的技术,它对文件系统的inode索引进行重新设计,使得存储系统既能充分的使用磁盘空间,又能很好的管理照片这样的"小文件"。QZone后台存储系统迄今为止在整个后台里面也是领先的。

微信是移动互联网时代的超级APP,它不仅是一款IM,也是一款SNS平台,同时能进行内容分发,还是智慧城市的入口;它不仅能发消息、分享朋友圈,它还能打车、吃饭买单、购物、交水电费,甚至预约看病挂号。超级APP肩负着超级责任,有数据显示,Amazon的AWS服务宕机持续时间超过40s,上面的服务像Slack、Netfilx、Pinterest等多款APP会出现无法响应等问题。大家还记得去年的天津滨海新区的爆炸吗?在爆炸的中心区域就有我们Wechat的数据中心,那次的事故为什么没有影响到Wechat的稳定运营?因为很快我们把Wechat的服务切到上海、深圳的数据中心去了。因为我们深知Wechat的每次闪断不仅仅是一条消息的延迟到达,不再是查看朋友圈时的缓慢,更重要的是你吃晚饭后结账时的困境,也可能是明天无法及时看病的苦恼。Wechat的后端采用了全球分布、用户就近接入的架构,在数据的一致性,网络的可靠性做出了极多的容错、容灾设计,这种极致架构不仅能应对人祸,还能应对天灾。

信息时代的科技原力是"摩尔定律",摩尔定律提升了基础网络建设的进程,让我们的互联网产品能快速更新。

2016年是AI起源的Dartmouth会议60周年,人工智能在过往的60年发展中几经沉浮,起起落落,在今年散发出璀璨的光芒。人工智能的兴起是大数据、云计算科学进步的产物,也是人类对未来世界向往的必然。

什么是AI?AI是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。AI包括:计算机视觉、语音识别、自然语音处理等类似人类的感知、认知智能。

当下很多人认为AI就是机器学习,或者说是深度学习,这是很狭义的,机器学习是AI的核心算法,确切的说AI和机器学习的关系是这样的:AI = A->f(x)->B,机器学习是人类智能行为的一种拟合函数。

目前的AI总体来讲还是一个非常初级的阶段,虽然我们在某些"感知"智能上有些突破,比如我们在计算机视觉上的人脸识别能力,语音识别上的速记能力等垂直领域已经接近或者超过人的平均智能水平,但是这些相对于一个人的综合智能来讲都还是一个非常狭窄的。之所以这样,本质上来讲,我觉得还是算法本身还需要更高维的突破,而不是简单的演进。比如我们针对视觉的AlexNet到VGG再到现在的ResNet,每次算法的演进还只是停留在更深的神经网络、更复杂的神经网络连接的设计上,通过这样复杂的神经网络学习、更多的样本特征来更好的拟合人脑的"感知",再比如"认知"智能的自然语言处理,但是面对这种语言序列问题,尽管我们的神经网络从早期的RNN演进到LSTM,再到现在的Attention
Model,但至今为止机器还无法完全胜任这种复杂计算。

人的智能是一个非常高的起点,人是经过数十亿年的生物进化,即便是新生儿,从他一出生开始他的智能起点就非常高,比如出生不久人就知道这个时间是3维的,如果我们把东西藏在某个大型物体后面,人的本能就能知道。这是一个非常高的智能起点。人认识新生物也只需要少量样本就能学会,但目前的机器学习并不能做到这样,我们无论设计多么领先的神经网络模型,都需要重新训练数据样本,并且需要大量数据训练样本的训练拟合。但目前的本身的机器学习方法我认为是正确的,因为我们学习的不在是表面现象而是深层次的特征。这就犹如人类学习鸟儿飞翔不是仿照鸟一样粘上羽毛,来振翅飞翔一样,本质上的飞翔原理是空气动力学和流体动力学。

AI的核心算法如何突破?如果类比人,我想需要在3个方面进行突破。1、创造力;2、归纳总结能力;3、举一反三能力;如果它们对应到机器学习就是"强化学习"、"无监督机器学习"以及"迁移机器学习"。"强化学习"已经通过deepmind在Atari和alphago上证明了巨大成功,alphago之所以厉害,是因为通过强化学习自对弈产生了大量的非人类棋局样本,通过这些样本再来进一步学习提高,未来我们需要采用"强化学习"创造更多的数据。"无监督机器学习"至今为止没有好的"聚类"算法,也就是归纳总结能力。人类能给表面非因果关系总结出很多原理,如"三点确定一个平面","惯性定律"等,这是一个很强的高维抽象能力,未来的无监督机器学习需要在这上面进行突破,通过少量的样本,站在前人基础上的归纳总结。"举一反三"也是人的一个重要的基本能力,通过学习了"下围棋",快速的推演到"下象棋",这需要"迁移机器学习"在模型迁移上的突破。

信息时代的科技原力是摩尔定律,AI时代的科技原力是"算法",而且这种算法是有如人类进化一样,从"单细胞"到"多细胞",再到"智能"的演进过程。

AI的未来是什么?我想AI的未来不仅仅是给我们提供更加安全、更加高效、更加便捷的智能工具,而是要帮助我们实现每个人心中的那个"大白",那个超级英雄,使得我们的小朋友更加的"被理解",他们不会由于父母的不在身边而缺少陪伴;使得我们的成年人更加的"被保护",他们不会由于危险的工作而使得自身安全得不到保障;使得我们的老年人更加的"被照顾",他们不会由于在偏远山区而得不到及时的治疗。无所不在是AI的未来。

从18世纪的第一次工业革命开始,人类的每次进步都源于科技的进步。而当今的互联网时代,从窄带到宽带,从移动互联网,再到当下的AI无不是一浪又一浪的科技变革,这种科技的进步也犹如潮汐一样一次次越来越猛烈的推动着我们进步。

我有时会问自己:是什么样的力量在推动着人类对未知领域的探索和渴望,是什么样的力量在推动着科技的进步?我想答案是"科技的原力","原力"是什么?原力就是我们改变世界的力量,原力就是每个人心中的追寻"自我主宰"梦想,原力就是人们仰望星空的感觉。而我们要做的就是在这"创造原力"的同时,保持这份"原力"的真正含义!may the force be with you!原力与你同在。谢谢大家!

时间: 10-28

算法将成为人工智能时代的“科技原力”的相关文章

人工智能时代下,Python与C/C++谁将成为人工智能核心算法选择?

据TIOBE公布的2019 年6月编程语言排行榜,Python以8.53%的涨幅排名超过去年同期C++排名,位列第3名,仅次于Java和C.python一路逆袭,甚至有人断言未来Python将成为人工智能的核心算法.那作为机器学习底层框架和支持库的C/C++就没有市场了吗?其实也不尽然! 互联网产品日渐饱和,移动互联网也已进入下半场,市场已经从巅峰时代逐渐进入一个相对平稳的发展阶段,互联网人口渗透率已经超过了50%.人工智能掀起了新的一波世界科技浪潮,互联网巨头公司BAT.近年来崛起的人工智能企

Martin Wainwright:用统计机器学习算法,加速人工智能的普及

(上图为美国加州大学伯克利分校的教授Martin Wainwright) Martin Wainwright是国际著名的统计学和计算科学专家,作为美国加州大学伯克利分校的教授,他既任教于该校的统计学系也任教于该校的电子工程与计算科学(EE&CS)系,由此而具备了横跨数学与计算科学两个领域的独特观点与优势. 在2017年7月15日由顺丰科技.钛媒体和杉数科技共同举办的"AI与智慧物流圆桌论坛"上,Martin介绍了一种近两年来出现的新型统计机器学习算法Newton Sketch,

人工智能时代,是时候学点Python了

"是时候学点Python了".作为一名不怎么安分的程序员,你或许觉得,产生这样的想法并不奇怪,但学习Python却是出于自己对工作现状以及如何应对未来挑战所作出的思考.读过我以前博客的朋友,可能都知道,我推崇软件领域中的匠人精神,将软件开发也视为一种制作,并将优秀的产品归纳为功能性与美感的结合.这在过去或许是普遍适用的优秀产品准则,然而,今天当我们已经站到人工智能时代的大门前时,我却发现过去对于软件产品的理解,已显得有些狭隘且过时了.未来所有的优秀产品都应该是功能.美感与智能的有机结合

AI人工智能时代即将来临,是什么要先行一步?

在2018年"全连接大会"上,最触动人心的一刻,无疑是万物互联未来畅想:而作为万物互联的核心便是"人",而万物互联的所要发挥的极致作用也就是充分解放"人"的机械属性,而充分发挥人的不可替代的创造性价值.无论是算法.算力还是模型训练,自动化功能及应用,自动更新与人才稀缺等十大改变中的任一一项改变都基于一个基础--协同. 协同并不是同样.统一的重复,而是犹如一个新产品的整体生命周期,不同的人的角色不同,参与新产品的生命周期的节点也不同,但都是始于同一

人工智能时代该如何夺回我们的“不知情权”

导语:美国科学杂志nautil.us<鹦鹉螺>作者Christina Leuker Wouter Van Den Bos近日发表了针对人工智能时代下如何保护人类的“不知情权”的深度报道.人工智能的出现能以无法预知的方式改变了现实生活中需要在选择知道和不知道的平衡,同时让我们在决定什么时候保持不知情的问题上变得复杂,研究故意不知情的心理将有助于设计适用于人工智能的不知情权法律,不过,这一严谨的科学研究话题长期以来一直被忽略. 以下为文章全文: 柏林墙倒塌后,东德公民终于有机会阅读到斯塔西(Sta

Python将是人工智能时代的最佳编程语言

移动互联网取代PC互联网领跑在互联网时代的最前沿,Android和iOS一度成为移动互联网应用平台的两大霸主,成为移动开发者首选的两门技术,HTML5以其跨平台的优势在移动互联网应用平台占据重要位置,可以说是后来者居上.  由于技术的限制难以催生出更多的新应用,互联网+的产品日渐饱和,移动互联网从巅峰时代逐渐趋于平缓发展,下一个时代谁是主场?下一门应用技术谁来掌门? 在第三届互联网大会中百度CEO李彦宏曾表述:靠移动互联网的风口已经没有可能再出现独角兽了,因为市场已经进入了一个相对平稳的发展阶段

人工智能时代

人工智能时代,未来职场会有哪些新变化? 一.什么样的职业会受到威胁? 1. 蓝领——重复的.标准化程度高的机械性劳动.比如大部分装订装配工作.搬运都已经变成机器劳动. 2. 初级白领——规则性.协作关系简单.维度少的智力活动.比如银行柜台.高速公路收费站.出纳等. 简单来说——规则性强.协作能力低.节点少的职位会被淘汰.被淘汰并不意味着消失,但是意味着这个领域的投入产出比会极低. 二.什么职位会越来越重要? [暂时不会这么快,3年内吃透java高级开发+架构师,5年内转大数据.] 高端技术人才:

人工智能时代下,人类保持就业竞争力的5中途径

阿尔法狗打败围棋高手.百度无人驾驶在五环上路.微软小冰写出以假乱真的诗句.无人超市无人工厂出现.日本甚至推出了人工智能×××机器人,互联网巨头纷纷加速人工智能发展,×××印发<新一代人工智能发展规划>,这一切都在预示着一个新的时代到来--人工智能时代! 就像平地一声雷一样,"人工智能"这个词一夜之间所有人都在谈论它.然而,实际上它已经发展了61年.但在几十年的时间里,它都处于默默孕育的冬天.只是现在,冬天已彻底过去,人工智能的春天又回来了,并开始在各个领域崭露头角. 随着人

不懂Python,你将成为人工智能时代的新“文盲”

每个阶段,大家对"文盲"的定义都是不相同的,以前不识汉字就是文盲,后来不会说英语就是文盲.在人工智能时代的今天,当然不懂Python语言,你就是"文盲"!现在你肯定在问Why? 众所周知,中国人工智能行业正处于一个创新发展的时期,对人才的需求也在急剧增长.如今Python语言的学习已经上升到了国家战略的层面上.国家相关教育部门对于"人工智能的普及"格外重视,不仅将Python语言列入到小学.中学和高中等传统教育体系中,并借此为未来国家和社会发展奠