推进“超大云智雾”深度融合
国家超级计算天津中心主任 刘光明
超大云智雾包含五大部分内容,“超”为超级计算,用于科学计算,以及超级算力,用以支持人工智能研究;“大”为大数据;“云”为云计算、云存储和云服务;“智”为人工智能;“雾”为物联网、雾计算、边缘计算和移动互联网。这五大部分是当前信息技术的主要应用领域,相互之间既相对独立,又相互交叉渗透,相互依存。所以, 将信息技术领域的五大技术进行融合,甚至是深度融合,便会产生更大的作用和效益。信息技术和应用的技术基础是数字技术,它们所带来的经济类型为数字经济。
数字技术是电子信息技术,它是把发生在自然界的声音和图像, 人们活动产生的声音、图像和文字,以及人们从事科学研究和思考的想法、事物之间的关系等等,通过数字方式进行表示、存储和处理。数字技术具有如下主要技术特性:采用二进制的数字表示方式用以表示数字和符号(如英文字母和各种标点符号),可以表示文字、表格和数字关系;对具有连续特性的图像和语音等进行离散化处理,将每一个离散点上的物理量采用数值方法进行表示;采用电路技术中的导通和截止两种比较简单的方式表示二进制数字,实现二进制数据的存储、运算处理和传输,二进制电路工作稳定,易于实现等等。数字技术从理论研究转向实际应用,具有里程牌意义的事件是 1946 年 2月,取名为 ENIAC 的世界第一台电子管电子计算机在美国宾夕法尼亚大学的诞生,它开创了数字技术全面应用的新纪元。
数字技术与数字经济
在人类社会的发展进程中,出现了各种各样的经济形态,它们都与当时的技术水平相关,例如我们已经经历了原始经济、农业经济、工业经济,现在正处于数字经济。数字经济的技术基础是数字技术和信息化。信息化是由计算机与互联网等生产工具的革命所引起的工业经济转向信息经济的一种社会经济过程,它包括:信息技术的产业化、传统产业的信息化、基础设施的信息化和生活方式的信息化等。根据我国的国情,我国在信息技术的应用推广中提出了两化融合的指导思想,即信息产业化与产业信息化,它包括信息的生产和应用两大方面,其中,信息生产包括高新信息技术及产业,既涉及微电子、通信器材和设施、计算机软硬件、网络设备等,又涉及信息和数据的采集、处理、存储等领域。其他应用领域包括用信息技术改造和提升农业、工业、服务业等传统产业。数字技术的作用带来了整个经济环境和经济活动的根本变化。数字经济主要研究依赖数字技术的生产、分销和销售环节。数字经济的商业模式是创建了一个企业和消费者双赢的环境。数字经济的效果是信息和商务活动都数字化的全新社会政治和经济系统。
在数字经济的发展过程中,有下述三个法则和定律揭示出了它自身发展的内在规律性,它们分别是:
梅特卡夫法则:网络的价值等于其节点数的平方。所以,网络上联网的电脑越多,每台电脑的价值就越大,“增值”以指数关系增长。这就是网络规模红利。在我国,上网人数为数亿,因此,我国的数字经济市场是巨大的。
摩尔定律:计算机硅芯片的处理能力每 18 个月就翻一翻,而价格以减半数下降。该定律表明,服务于数字经济的基础设施,如超级计算机、超级算力(AI)、云计算、大数据服务平台等等,它们的性能会不断提高,价格会不断下降,也就是说,性价比会不断提高。尽管学术界和工业界都在认为摩尔定律正在失效,但是,类似 CPU 芯片的性价比不断提升的趋势是没有改变的。
达维多定律:进入市场的第一代产品能够自动获得 50% 的市场份额。所以,任何企业要想在数字市场上占有一席之地,就得勇于创新,敢为人先,做第一个勇于吃螃蟹的人,不要寄希望坐享其成、做山寨。
数字技术和数字经济的主要特性
一是泛在性、高参与度。数字经济的基础是互联网,实际上,它现在是全球互联网,原理上讲,我们个人的电脑或者手机,通过上网,就能与连接在网上的任何一台电脑(不管该电脑是在地球的哪个遥远的位置),进行信息交流和商务活动。
二是高渗透性。除了从信息技术衍生出来的信息产品,如电脑、手机、电视机等之外,信息技术与传统的产业,如机械、化工、钢铁、交通等,进行深入合作,衍生出众多机电自动化的产品和系统。我国的工业和信息化部,主要工作之一是工业化和信息化融合,简称两化融合。信息技术的高渗透性对社会发展的影响日益深刻。
三是速度型经济。信息产品日新月异,每年手机公司推出的新款手机应接不暇,一家公司新的产品推出的速度,往往决定了该公司在该类产品上的市场占有率,决定了该公司的生存和发展。
四是惯性。强者更强,弱者更弱。一旦一家公司占据了某一市场,后来者几乎没有机会翻盘。例如,腾讯的微信,要想颠覆它现在是很困难的。
五是边际效益递增性。边际成本递减,这是由于软件类或者被称为数字化的信息产品,如操作系统、数据库、工具软件、音乐和影视作品等等,都是以版权的形式发行,过去是以类似复制 CD 形式实现交付,现在直接在网上发行和交付,所以边际成本递减。一个产品, 如微软的 Windows 软件,垄断了全世界的电脑,它的一个 CD 拷贝的成本几乎可以忽略不计。正是这些特性,才有了像微软这样的巨无霸公司。
六是可持续性。由于信息产业依赖的有形资源(如土地)不多, 电能消耗适度,与石油化工钢铁等传统产业相比,它低环境污染,少生态恶化,所以是一个可持续发展的产业。
七是直接性。现在出现的 BtoC(Business to Customer) 和BtoB(Business to Business)等商业模式,取消了中间商,降低了交易成本,提高经济效益,促进了信息产业和以信息服务平台为基础的其他产业的快速发展。
在信息技术的发展历程中,如下事件具有里程碑的重大意义。1946 年,世界上第一台电子管电子计算机 ENIAC 诞生。1948年,肖克莱、巴丁和布拉坦发明了晶体三极管,代替电子管。1959 年,基尔比和诺伊斯发明了集成电路,微电子技术诞生。1969 年, 美国的阿帕网(ARPA)诞生,开启了国际互联网时代。1971 年,高锟发明光纤理论,世界首条一公里光纤问世,为高速互联网打下了坚实的技术基础。
在信息技术的发展过程中,有基础性的信息系统和延伸的信息系统,只有抓住了基础性的信息系统具有的核心技术,才能发展延伸的信息系统,才能掌握信息技术的主动权。基础性的信息系统和技术主要包括:(1)超级计算机系统,它使用最先进的信息技术,在硬件方面,包括CPU、内存、通信、存储、电路板、散热、供电等,在软件方面,包括操作系统、编译系统、并行软件、分布并行存储管理软件、应用软件等;(2)云计算系统,它使用通用技术和部件,具有普适性。延伸性的信息系统是以超级计算机系统和云计算系统为基础,延伸产生的、面向应用的信息系统,主要有如下几类:(1)大数据系统,它由云计算、海量存储、数据处理方法等构成;(2)人工智能系统,它基于超级计算、增强型 AI 超级算力、云计算、算法等构成;(3)物联网系统,它采用移动互联网、云计算、人工智能等的技术构成。
五大信息系统的基本组成和主要作用
- 超:超级计算机系统
超级计算机系统可以包含:基本型的超级计算机系统,它主要用于科学计算;增强型的超级计算机系统,它是基本型的扩展,通常称为超级算力,主要用于人工智能。由于在人工智能研究中,对数据表示的精度要求不高,计算的复杂度低于通常的科学计算(例如,解算非常复杂的方程组),所以,可以采用短字长的专用处理单元,这样可简化此类超级算力系统的构成。
超级计算机是计算机中运算速度最快、互联通信速度最快、存储速度最快的一类计算机,多用于国家高科技领域和尖端技术研究,是一个国家科研实力的体现,它对国家安全,经济和社会发展具有举足轻重的意义。1946 年 2 月 14 日,世界上第一台电子管电子计算机ENIAC 在美国宾夕法尼亚大学问世,它的用途是计算炮弹的弹道,使用了 17840 支电子管,功耗 170kW,运算速度是 5000 次 / 秒。ENIAC 的问世具有划时代的意义,它标志着电子计算机时代的到来,这就是第一代电子管计算机;第二代是晶体管计算机(1958—1964 年);第三代是集成电路计算机(1964—1970 年);现在是第四代大规模集成电路计算机(1970 年至今),最主要的技术特征是使用高性能 CPU。
超级计算机主要由三大子系统组成,具体为:
(1)计算子系统,它由高性能 CPU、高速大容量存储器和高速互连接口控制器组成;
(2)通信子系统,它由高速互联通信控制、高速互连系统网络和互联通信接口组成;(3)存储子系统,它由高可靠超大容量磁盘、存储服务器、互连接口等组成。软件包括操作系统、编译系统、并行优化软件、并行存储软件等。在硬件部件上,它是使用性能最高的 CPU、速度最快的互联通信控制器、最快最大容量的存储器、磁盘和 SSD 等部件,构建规模最大的计算机系统。所以,超级计算机无论是在硬件还是软件上,均是当时最高技术水平的。掌握了超级计算机的研制和实现技术就等于占领了信息技术的制高点,抓住了牛鼻子。
我国从 1978 年开始,由国防科技大学研制“银河 -1”超级计算机,历时五年完成研制。“银河 -1”超级计算机的研制成功标志着我国迈入了可自主研究超级计算机的世界强国的行列。从那以后,国防科技大学平均每个 5 年研制一代超级计算机,现在已经是第八代了。一个国家,一个团队,数十年做一件事,是完全能够达到世界先进或者领先水平的。由国防科技大学研制完成的天河一号超级计算机于2010 年 11 月在国际上与国外的超级计算机按照相同的评测标准,一比高下,最终获得世界高性能计算 TOP500 第一名,震惊了世界。随后,天河二号、太湖之光超级计算机先后累计获得了11 次世界第一。国家花费巨资研制超级计算机,它有何重要作用呢?超级计算机的重要作用就是为国家科技创新服务,提升国家的科技竞争力,简要地说,它的重要作用是“算天,算地,算人”。
算天,是研制大飞机、航天器和航空发动机;进行气象预报、气候模拟分析和雾霾预警预报;研究宇宙演化;研究航空和航天飞行器的空气动力学特性,使得飞行器飞得快、省燃料、更安全。
算地,是进行石油地震勘探数据处理,分析地下油藏;分析卫星遥感数据、地震对城市建筑的影响和海洋变化等。
算人,是研究生命科学、生物医药;解读生命奥秘、谱写生命华章,开展基因技术研究,进行基因分析,临床诊断、个性化诊治,新药研发;研究人脑机理,探索人脑在信息存储和处理方面的奥秘等。除了上述三大部分外,还有基础研究,主要领域包括天文、脑科学、材料基因组学、可控核聚变、玻璃地球,等等。
超级计算已经形成一个漏斗效应,具有创新研究的工作或多或少的都需要超级计算机进行计算分析工作。
- 大:大数据研发和应用平台
在自然界、人类活动和生产过程中,每时每刻都产生着大量数据,这些数据包含了这些活动中各个因素之间的复杂关系,揭示这些复杂关系,清晰地了解事物发展的趋势,提高工作效率,提供新的服务内容,可以获得更好的社会和经济收益,这就是开展大数据分析的价值所在。大数据分析和应用涵盖的领域越来越广,它包括了农业、电力、水务、金融、矿产、军事、消防、环境、遥感、医疗、建筑、运输、公共安全、工业自动化、供应链、商业、消费、能源、气象, 等等。
大数据处理平台是依据云平台和超级计算机平台的关键技术构成的,在硬件上,它主要包括数据的收集、传输、存储、处理和展示。它与云计算最大的差异是在处理软件和处理流程上。大数据的基本处理流程主要包括如下部分:(1)采集和存储。它利用定制化存储设备(SQL 和 NoSQL)来接收发自客户端(Web、APP 或者传感器等) 的数据,有的也采用传统的关系型数据库,如 MySQL 和 Oracle 等来存储每一笔事务数据。对于图像、语音等,多使用 Redis、MongoDB 等 NoSQL 数据库。这方面的难点是高并发数、负载均衡和分片等;(2)导入 / 预处理。在对海量数据进行有效分析之前,需要完成数据清洗和预处理,主要原因是被采集的数据中包含一些漏采、重复采、错误反馈等数据。处理方式为采用线性插值、标度转换、滤波、去重等方法,为后续统计、特征处理提供数据基础,面临的难点和挑战是数据量大,对于实时处理就需要考虑性能;(3)统计 / 分析。采用分布式数据库或分布式计算集群系统,通过分布式处理方法对海量数据进行统计分析,进行特征选择。采用的处理工具有 GreenPlum、 Exadata、Infobright 等,批处理统计需求可以使用 Hadoop 等。面临的难点和挑战为分析涉及的数据量大,对系统资源,特别是 I/O 会有极大的占用;(4)挖掘。它以特征选择为指导,以预测指导为目的,常用算法有聚类、回归、分类、深度学习、强化学习等。面临的难点和挑战为挖掘算法复杂,计算涉及的数据量和计算量都很大,要研究高效的分布并行方法;(5)可视化分析。将结果形象化地展示给数据分析专家或普通用户,相比较文字、表格,它更直观简单。展示并非越炫越好,重点在精确表达,数据多源,实时性要求高、数据质量要求高;(6)数据挖掘算法。可视化是给人看的,数据挖掘就是给机器看的,常用算法有分类(决策树、支持向量机、贝叶斯分类等)、聚类(K-MEANS、层次法)、关联(GSP)、预测(回归、时间序列)等大类。应用有用户数预测、订单预测、客户细分、市场细分、信用分析、欺诈预警等;(7)预测性分析。数据挖掘可以让分析员更好的理解数据,而预测性分析可以让分析员根据可视化分析和数据挖掘的结果做出一些预测性的判断。应用场景有:商品销售可以通过产品种类、位置、关联性等属性,指导产品合理摆放,方便购买;产品质量预测,通过产地、气候、工艺等大量数据,预测产品质量;(8)语义引擎。我们知道由于非结构化数据的多样性带来了数据分析新的挑战,我们需要一系列的工具去解析、提取和分析数据。语义引擎需要被设计成能够从“文档”中智能提取信息。
大数据应用举例:
炼钢高炉大数据运营分析与评估。它是基于物联网下大数据分析系统。高炉的现状是海量数据无法有效利用,高炉认知体系不统一, 数据分析与决策利用程度低,仿真建模计算环境不完善。希望通过大数据分析实现高炉大数据运营评估体系,提高高炉的冶炼效率。
消防火灾隐患评估。它是城市消防业务发展的趋势。通过数据分析和物联网等技术,将消防工作重心从灭火转移至防火。城市区域防火面临的挑战为人口密度不断增加、建筑物结构复杂、人员不安全行为频发、外界不安全因素复杂。
港口大数据分析。提供对进出港口的海运船舶和货运车辆进行分析管理,对资金流、通关、检疫、基础设施等进行管理,可以提高港口货物的吞吐率。
电子政务大数据。通过分析电子政务系统中收集的社会发展和企业运行管理数据,掌握各种资源的需求情况和市场发展情况,动态调整产业上下游的产品配套,加快经济发展。
另外还有医疗、交通、金融、商业决策等等众多大数据的应用。
- 云:云计算系统的构成和技术特性
当前,云计算已经获得了非常广泛的应用。十年前,人们追求的目标是让云计算和云服务成为类似于城市自来水和市电的公共资源, 现在看来,这个目标基本实现了。现在,政府、企业、个人已经习惯于在网上(实际就是云计算平台)找存储、计算处理和软件服务的资源了。在云计算的发展历程中有两个最为重要的里程碑事件。1983 年,太阳电脑公司(Sun Microsystems)提出“网络是电脑”(“The Network is the Computer”) 的观点;2006 年 3 月, 亚马逊公司(Amazon)推出弹性计算云(Elastic Compute Cloud;EC2)服务, 从此开启了云计算的时代。基于云计算平台的信息服务产业发展极为迅速,真让人应接不暇。
云计算,它是采用商用、通用、价格不高的服务器(性能不高, 可靠性不高)、中等性能的网络设备(百兆、千兆、万兆等)、非高可靠的存储设备(非 RAID)等,构成云计算系统,它要求有较高的性价比。云计算并不是一个全新的系统,它是分布式计算、并行计算、效用计算、网络存储、虚拟化、负载均衡、热备份冗余等传统计算机和网络技术发展融合的产物,这些技术在超级计算机中均有不同程度的使用。云平台主要由如下部分组成:网络接入部分,包括接入网络、防火墙、负载均衡;服务部分,包括网络服务、存储服务、计算处理服务和管理服务等,这一部分主要是由各类服务器组成。
云计算主要有如下三大类服务:(1)基础设施服务(IaaS),它出租计算服务器、存储服务器和网络,如云主机,云存储;(2)平台服务(PaaS),把应用服务的运行和开发环境作为一种服务,包括IaaS 中的硬件设备,还有应用服务运行的相关环境,在之上可以简化应用研发;(3)软件服务(SaaS),如企业邮箱,工程仿真设计,动漫渲染,等等。
云计算平台典型应用:
天河工业云。它是基于 2016 年 12 月国家工信部工业转型升级重大项目研制完成,是基于国家超级计算天津中心优势资源,充分整合生态伙伴构建的聚焦先进制造研发设计、工艺优化和产品运维管理的云服务平台。它可提供的云服务功能主要有:行业云、智能分析、信息整合、技术融合和开放 PAAS 等。
石油勘探数据处理云平台。它是与中石油东方物探研究院合作, 联合研发具有自主知识产权的石油地震勘探三维数据处理软件,基于天河一号组建了“天河石油物探计算中心”,主要为从事石油地震勘探数据处理的单位提供专业化的石油数据处理服务。用户可以通过网络使用石油处理软件和天河一号超级计算机。个人健康和医疗卫生云。它主要提供基因临床诊断云服务和互联网个人健康云服务。对个人的物理、生化、基因和体表数据进行收集和 24 小时实时监测和处理。采用穿戴设备、移动网络、云平台、医疗专家值班等方式。主要适应人群:术后人员、老年人、有心血管疾病的人。
动漫与影视特效超级渲染云平台。采用行业通用的渲染软件,在天河一号上构建了“天河 – 动漫与影视超级渲染云平台”,构建远程渲染提交中心,在超算中心有专业工程师为用户提供在线技术服务,用户通过网络传输制作数据和工程文件,启动渲染,在线查看渲染效果。地理信息处理云平台。它存储遥感地理信息数据,使用第三方的遥感数据处理软件,可按照用户要求提供地理信息(GIS)服务。通过专业数据库,可对重点区域的地面、建筑物、桥梁等进行沉降、形变的检测,可服务的领域包括政府决策、城市规划、环境监测、卫生防疫、社会经济统计、人口计生、公安指挥、资源管理、交通管理、物流管理和 GPS 服务等。
工程设计与仿真模拟。它可对机械产品设计中包含形状、强度、高热、高速、高压、复杂结构、多物理因素耦合的情况进行仿真分析;可支持电器产品设计,例如,IC 电路逻辑功能、IC 时序,数字与模拟电路,PCB 逻辑和时序分析等。该平台提供专门的功能设计和功能仿真软件,目的是使设计出的产品能够满足应用要求,通过模拟仿真,模拟产品实际运行的环境,验证产品的功能等。在其他应用领域,可支持先进制造装备研发、工艺仿真、智能管理等,例如环保装备,工业机器人,无人机,风电设备等。通过高性能设计仿真,加快了先进装备开发,降低了研发成本,提高了信息化集成、自动化制造和信息化管理水平,可支持实现绿色制造。
天河建筑云平台。它采用 BIM+GIS 技术,为智慧城市建设服务,服务领域为地面建筑、地下管网和轨道交通。具体服务内容包括,项目规划与设计和项目实施管理的云服务。实行建筑项目的全生命周期的管理,包括:规划、设计、造价、招标、施工过程监管、项目经费管控、验收、物业管理等。
智能交通。它包括城市出租车监管,智能交通管理和引导,城市交通拥塞情况实时通报,指导车辆绕行拥塞区域。
互联网教育。它为中小学的教学管理和学生学习服务。
4.智:人工智能研发平台
人工智能是计算机科学的一个分支,它试图了解人的智能的实质,研制能以人类智能相似的方式做出反应的智能机器。它的具体研究内容包括:机器视觉、指纹识别、人脸识别、视网膜识别、虹膜识别、掌纹识别、专家系统、自动规划、智能搜索、定理证明、博弈、自动程序设计、智能控制、机器人学、语言和图像理解,等等。专家系统是应用面最广泛的。人工智能有四个要素:算法、算力、数据、应用场景。人工智能研发环境主要由下述部分组成:机器学习、生物特征识别、知识图谱、人机交付、自然语言处理、计算机视觉等。它是依托超级计算、云计算与大数据的融合环境,为人工智能技术创新研究提供算力、算法和数据支撑环境。除了有超级算力支持外,还必须基于研究的技术成果将新的算法用于具体的场景中,如机器人、摄像头自动识别人像等,所以,还要研发嵌入式的专门支持人工智能应用的芯片和智能操作系统。例如正在研发的群体智能操作系统,它能够用于群体式的旋翼、固定翼无人机、无人车、无人潜航器和软体机器鱼等。
人工智能应用主要分布在图像识别、视频图像理解、场景识别、语音识别、人的姿态识别、自动驾驶、智能机器人,无人超市,语言实时翻译等。以医学影像筛查为例,它的作用可为:食管癌早期筛查,肺癌早期筛查,糖网智能分期识别,乳腺癌早期筛查;在医疗图像分析方面,可以进行病灶特征模型学习和识别,三维可视化重构, 借助图像识别,可分辨多达数千种医学影像特征。
- 雾:互联网、移动互联网、5G、物联网、边缘计算
未来,人类社会中最大的组织机构将是万物互联组织,尽管它是非政府性质的,但是它却是围绕分区域的功能和目的实现自治的。从产业和商业的角度来说,物联网(万物互联)将是最大的市场。在物联网时代,各种传感器分布在各个角落,例如手机和可穿戴手表, 住宅中的各种电器和可操作的家居(如门锁,窗帘等),工厂中的设备,分布在各种现场的施工设备,安装在大桥、高层建筑物和隧道上监测沉降的设备,等等,这些设备上有各种各样的传感器,如位置, 运动,心率,血压,震动,温湿度,等等。这些数量巨大的传感器通过无线网络或者 WiFi 连接到网络上,实现着万物互联。
超级计算、超级算力、云计算、大数据和人工智能研发平台多是集中式的,可想而知,那些在数量上无穷无尽的传感器将产生海量的数据,就是把这些海量数据传输到云服务平台,网络带宽和延时的压力是巨大的(如高铁的 12306),甚至是不可承受的。工业控制等应用需要毫秒级的服务响应,现在中心化的云计算平台无法满足。所以, 需要一种新的系统组织结构来满足物联网日益增长的新的需要。由此,人们提出了边缘计算+ 云计算+ 超级计算融合的模式和系统结构, 也简称为边云超结构。边缘计算组成结构和待解决的关键技术问题包括:网络、隔离技术、体系结构、边缘操作系统、算法执行框架、数据处理平台、安全和隐私等。这些都是需要我们深入研究的。
未来数字产业面临着两个巨大挑战和商机,它们是人工智能和物联网(万物互联)。让我们做好充分的技术准备拥抱新兴产业和新的巨大商机,拥抱更加美好的明天。