海量数据,博杂纷乱。人类对未来的把握和胜算,就在于数据被有效存储的同时又在一旦的需要中迅速激活。小数据时代,数据越大越有价值;大数据时代,数据越大,价值越小。人类未来对块数据远端的方向感认知就是其对大数据**方向把握的核心要义。在拯救与逍遥的哲思中,我们探索用生命科学的方法解决数据拥堵问题,以数据社会学的思维打开沉淀的数据宝藏。激活数据学就是一个在块数据的神经元调度系统下的一种减量化的数据存储和利用的数据观和方法论。无人驾驶、城市大脑和模块政府等是激活数据学*重要的应用场景,它让庞大数据资源通过计算和交互真正转化为智慧和财富。而数据驱动、计算驱动和场景驱动下云脑时代的到来,激荡着我们对于未来美好生活的所有憧憬和渴望。
本书提出的激活数据学是以充分发挥人机群体智能为核心,综合运用数据科学、生命科学和社会学提出的海量数据存储、处理的解决方案。激活数据学将颠覆传统的思维方式,为大数据领域的探索研究提供一个崭新的视角。
激活数据学对类脑计算领域的研究,将推动高效率、低功耗的高性能计算技术的发展,高性能计算技术将为人工智能的推广与应用带来新一轮的春天。激活数据学基于“块数据”的思维观,为数据跨领域的共享开放提供了新的数据观和现实可行的路径,将**人工智能突破“条数据”领域,向更广泛的领域释放价值。
大数据战略重点实验室成立于2015年4月,是贵阳市人民政府和北京市科学技术委员会共建的跨学科、专业性、国际化、开放型研究平台,是中国大数据发展新型高端智库。
大数据战略重点实验室依托北京国际城市发展研究院和贵州大学贵阳创新驱动发展战略研究院建立了大数据战略重点实验室北京研发中心和贵阳研发中心,建设了贵州省块数据理论与应用创新研究基地、贵州省城市空间决策大数据应用创新研究基地和贵州省文化大数据创新研究基地,并建立了中央党校研究基地、全国科学技术名词审定委员会研究基地、浙江大学研究基地、中国政法大学研究基地和中国(绵阳)科技城研究基地,构建了“两中心、三平台、五基地”的研究新体系和区域协同创新新格局。
大数据战略重点实验室主编的《块数据:大数据时代真正到来的标志》《块数据2.0:大数据时代的范式革命》《块数据3.0:秩序互联网与主权区块链》是大数据发展理论和实践的重大创新成果,在国内外具有较大影响。
大数据时代的解决方案
本书探讨的主题是大数据时代激活数据学的提出、运行机理及场景应用。激活数据学是以充分发挥人机群体智能为核心,综合运用数据科学、生命科学和社会科学提出的海量数据存储、处理的解决方案。激活数据学将确立一个新的观察人类智能和机器智能的视角,引导人们重新审视数据无限膨胀可能造成的人类认知障碍,重新思考维持一个健康、安全和有效的数字社会的根本办法,建立与人类智能复杂性同步的人工智能系统,开启用复杂性系统思维认识未来世界和改造未来世界之旅。
大数据时代面临的问题与挑战
在人类文明的伊始,人与人的第一声交流即意味着“连接”的开始。语言使人与人连接,并促使用于记载事物的文字、数字符号产生,这样的“连接”便产生了“数据”,并演化为人类文明最初的信息与知识。在漫长的农耕文明时代,“连接”主要以语言沟通和书面文字沟通的形式存在。进入工业文明时代,“连接”开始通过无线电台、电报、电视的形式存在,但这样的“连接”产生的信息往往是单向性且缺乏互动的。互联网时代,人和人开始通过网络进行复杂交错的互动连接。社交网站、电子邮件、搜索引擎、聊天工具……人类建立连接的方式趋于多样化、多维化,人类社会产生的数据也因而大量积累。与此同时,数据的价值
越来越受到人们的重视。数据深刻作用于政治、经济、文化等领域,带来更多的创新机会,从生产、生活到科研,一个大数据时代正在开启。
在美丽的贵州省黔南州布依族苗族自治州平塘县,被称为“中国天眼”的世界上最大的单口径射电望远镜——FAST(500 米口径球面射电望远镜)已于2016 年9 月25 日落成启用。FAST的计算速度需达到每秒200 万亿次以上,存储容量需达到10PBa 以上。这一世界级的工程将帮助人们捕捉到更多来自宇宙的信息,它的背后是“天文级”的海量数据存储和复杂的计算。随着时间的推移、科学任务的深入,以及数据的大量采集,未来对计算速度和存储容量的需求将爆炸式增长,数据量和计算量都将“大得惊人”。
数据是没有边际的,而计算力、存储力始终存在物理极限。在过去很长一段时间里,科技日新月异的发展依赖摩尔定律。当摩尔定律逐渐失效时,数据的膨胀是否将引发世界性的数字爆炸?人们寄希望于量子计算,量子计算将有可能使计算机的计算能力远远超过今天的计算机,但仍然存在很多障碍。如何长时间地保持足够多的量子比特的量子相干性,同时又能够在这个时间段之内做出足够多的具有超高精度的量子逻辑操作,提高所需量子装置的准确性,还面临许多困难。
人类作为自然界中最伟大的智能体已经进化了上百万年,人类所具有的智能是大自然赋予人类最高级的礼物。今后,人类智能仍将是人造系统模仿和研究的对象。人类未来对数据的处理,要更多地模仿人脑对数据的处理方式,人脑就是世界上最好的“量子计算机”。
目前人工智能的发展水平可以用三个维度来描述,即强度、扩展性和能力。强度是指人工智能系统的智能化程度,扩展性是指人工智能系统可以解决的问题的范围,能力是指人工智能系统所能提供的平均解决方案的质量。虽然我们已经在专用人工智能领域取得了突破性进展,但目前人工智能水平仍然停留在“有智能没智慧,有智商没情商,会计算不会算计,有专才无通才”的水平。其特点是能力单一,只能在某个特定领域内发挥作用。在人工智能2.0 时代,我们期待一个新的框架:首先,在人的逻辑层次可辩明;其次,可以处理大规模数据;最后,可以基于一小组标记数据进行学习。我们认为,将数据驱动的机器学习方法与知识引导方法相结合,将为人工智能的未来推开一扇新的大门。
探索解决之道—激活数据学
受人脑处理数据方式的启发,本书提出了一种新的处理海量数据的一般性框架——激活数据学。激活数据学从复杂理论出发,将产生智能所依赖的数据、软件硬件环境、交互规则等视作一个具有“简单性、局部性、全局性、内聚力、动态性”的开放复杂系统,智能产生的过程即开放复杂系统中各个具有局部目标和行为的自主体通过自主行为及动态环境相互作用达到整体的全局目标所涌现的群体智能,这种涌现的群体智能能够高效求解问题。
激活数据学中采用块数据模型作为数据模型。块数据把各种分散的点数据和分割的条数据汇聚在一个特定平台上并使之发生持续的聚合效应。块数据的聚合打破了传统信息不对称和物理区域、行业领域对数据流动的限制,高度关联的各类数据可以在没有任何障碍和限制的条件下自由流动、相互作用,为智能的产生创造了条件。
激活数据学的核心是将人类认知能力与计算机快速运算和海量存储的能力结合起来。一方面,提高智能系统的置信度,避免人工智能技术的局限性所造成的风险甚至危害;另一方面,建立人类参与的混合增强智能,将海量数据通过人机混合增强智能实现最佳释放。这种形态是人工智能可行的、重要的成长模式。