孙凝晖:信息高铁综合试验场

发布时间:2020-08-14分享到:
非常高兴有机会在这里汇报一下我们计算所在南京研究院这段时间做的工作,叫信息高铁的综合实验场。它的本质是一个未来计算的实验装置,我们计算所是做计算技术的。这个未来计算的实验装置需要未来网络作为支撑,才能更好的支撑应用和我们一些新的算力的实验。

我简单从大的需求开始讲起。我们知道数字经济蓬勃发展,在美国占GDP将近60%,在中国还有比较大的差距,有34%,相差20%。数字经济对实体经济带来了很多深远的影响,从支付到出行,中央也实时提出了新基建,我想,提出新基建主要的动机还是要把我们国家的数字经济20%多的差距尽快的缩小。

今天很多位院士提出了新基建需要新技术,尤其需要新的技术体系。因为我是做计算的,我是从计算的角度来看待问题。我们从计算的角度来看基础设施,可以粗略的分成三个大的阶段,第一个阶段就是只有我们计算机通过网络连接,这个基础设施的关键词就是高性能,速度要快。第二个阶段就是把人要连进来,通过手机和终端,把人和计算机连成一个二元的世界,这个时候叫高带宽,这个时候还是宽带的阶段。把物连接起来以后,这个时候它的标签要发生一些改变,我们叫它高通量。

有一个形象的比喻,今天很多位专家讲了,我们需要多种多样的交通工具,我们有了飞机、汽车,我们还需要高铁,在信息基础设施上面也如此,它们给我们提供不同的能力,有的算的快,有的算的多。

在信息基础设施上除了高性能和高带宽以外还需要高通量的标签,为什么呢?现在很多应用都有这样四个特点,高并发、强实时,到云端和算力这边也有这样的需求,另外需要全局可调,全局的负载可调,全局性能的可调度,还有第四个不安全。这四个特点的信息基础设施将算力基础设施才能应对未来的工业互联网的需求。

为什么需要高并发?为什么需要强的时延的可控?为什么需要应对高载荷?从交通运输来看,可以看出当这个载荷比较小的情况下,我们可以做到高速和准时,当这个大载荷上来以后,这个速度和通量的准时就不能全部要获得了,但是高铁给了我们一个很好的技术实现,它能够把速度通量和准时能够非常好的融合在一起,三个都可以达到,虽然不是最高,但是三个都可以获得,这个就是对大载荷非常好的一个应对技术。

我们知道高铁的调度是最强的,从这次的武汉疫情也可以看出,我们需要在大载荷下时空的调度,我们把全国的医疗队送到武汉是一个空间纬度的调度。我们可以在很短的时间内平移掉大载荷对资源的冲击。现在信息基础设施无法应对大载荷的冲击,我们的云计算、计算基础设施也无法应对。还有原生安全,刚才已经讲的非常多了。

我现在讲一下怎么样为了发展新的基础体系,构建综合实验场的计划。

在算力领域,因为刘院士有未来网络,未来网络基础设施开始建设以后,对我们研究智能测调的技术提供了非常好的平台,在算力领域有一个非常有名的项目,就是叫PlanetLab,他们大概干了20年,它的再生历史上对于分布式计算系统作用非常大,这个平台产生了对企业界影响非常大的新技术,这就可以看出一个综合实验的平台对产业和技术发展的重要性,我们在这个超算领域有一个网格,把全国的超级计算机应用网络连接起来提供算力的支撑,对我们国家高性能计算起到了非常大的促进作用。

在这个新基建和新的万物互联的时代,我们也需要新的算力的综合实验装置,这个装置和过去的ARPANET还是有明显区别的。

我们为什么叫信息高铁呢?有点蹭高铁的热度。观察中国、美国、日本在解决交通出行策略上还是有些不同的,很明显中国和日本非常依赖于轨道交通,我们国家高铁很厉害,但日本的轨道交通的运力,每年度的周转量是全世界第一的。到过日本的人都发现无论城市的轨道交通,还是城市与城市之间的新干线都非常准时,运行效率非常高。中国和日本相比,我们还有自己的特点,我们人多地少,和他们一样,但我们钱少,还需要可控。我们提供一个小的用户体验,不能花很多钱,我们有20多个点的跟美国的差距,但是我们投入,虽然说新基建多少万亿,但我们国家还是非常缺钱的,我们需要非常少的钱的投入产生尽量多的用户,并且还要质量保障。这个难度是非常难的。

我们这样的一个努力仅仅是在未来产业互联网上,算力上面一个小小的贡献。

我们希望建一个外场的和一个内场的。我们计算所在国内有最多样的算力的创新,曙光做超算和云计算,对这些资源的使用,要在大载荷的情况下,它的质量尽可能要保障,这就需要网的支持,需要算力本身的支持,然后我们在连入这些接入站,他们需要更好的支持当地的工业或者社会的服务,他们可以通过SIMI来运用远程的资源。但这是一个实验网,不是一个运营上的运营网络。

在南京麒麟区的支持下我们要建一个内场,我们把这样的新基建,这样的基础设施放在这样的楼里面,把卫星接入放进来,把工业5G,WIFI6,所有的算力资源都放进来。同时我们在做一个测调中心和运营中心,测调中心就是怎么管这个基础设施,运营就是怎么样支持这个用户的,这样我们可以做出多种多样的实验。

我们有一个规划,希望到2050年接入一个南京的高铁总站,16个接入站,通过SIMI的路由器进行接入。我们有非常多的在场景端的处理芯片,也有最多的在云端的内行的算力,大概有八到九种这样的芯片。

比如我们实验叫高通量的计算中心,它的核心技术跟高铁站非常相像,我们的实验,我们有卫星的互联网,工业5G互联网,车联网。我们有自己的物端处理系统或者物端计算系统,这个要跟场景进行结合。还必须要研制测量系统,以及运营系统。

因为你是一个实验平台,一定要有个量化评估系统,像任何一个军用靶场要有一个评估系统一样要进行一个评估。我们要实现自主装备,实现这些新的技术,实现我们这些新的应用。

有了这个平台,我们至少可以有三类的应用可以实验,一个是针对现有痛点的,高并发的,以智慧城市为代表的,一类就是未来产业,智能网联为代表的,还有一类就是安全,就是高安全应用,核心的工业制造领域,这些应用都可以在平台上进行实验。我们还有农耕,跟国家关键行业的应用,都可以在这里面进行实验。

我们这个平台就九个字,新的技术体系,高通量,我们是一个联邦制,不是一个人来投资,是联邦构成的算力的命运共同体。

我今天的汇报就到这里,谢谢各位。

 

上一篇:Nick McKeown:Programming the Network From the Top Down...
下一篇:何友:工业大数据及其应用