2030年中国的网络研究者,也能取得世界领先的成果

希望到2030年,中国网络研究人员和CERNET工作者也能取得世界领先的成绩,自豪地说“我们做到了”!

——李兴

李星,CERNET网络中心副主任,清华大学教授

互联网技术演进:IPv6将成新热点

谁更大?科学家还是工程师?

在很多领域,科学家们都发现了自然规律,工程师们了解了自然规律后,就可以根据规律实施各种项目。这样一来,科学家的作用就更加重要了。

但有一个例外,那就是互联网。因为TCP/IP网络协议是工程师设计的,相当于创造了一个新的规律。事实上,无论是牛顿还是爱因斯坦,科学家们都发现了物理空间中存在的某些规律,但真正规律的创造者其实是大自然。与物理世界相比,网络是完全不同的。在网络世界中,工程师扮演着“自然”的角色。

但工程师创造互联网似乎比在自然界更难,因为工程师是人,人们对问题的理解总是有限的。

互联网没有“设计蓝图”。自诞生以来,它一直在一步步进化,具有“设计原则”和“技术组件”两个属性。

设计原则

互联网的本质是一个没有中心的分布式系统。可以说,这就是互联网“一成不变”的设计原则。

1964年,美国的Paul Baran提出了分组交换的概念,其核心是分布式非中心拓扑。

1972年,法国人Louis Pouzin提出了基克拉泽斯网络结构。他认为,用户终端不应该相信网络是可靠的,因此网络可能是不完善的(也不能是不完善的),从而产生了互联网的主要设计原则:尽力而为,端到端。

1978 年,Vint Cerf 等互联网先驱将原来的互联网传输控制协议(TCP)的功能划分为 TCP 和 IP 两种协议,最终形成了著名的 TCP/IP 沙漏模型。

图 1 TCP/IP 沙漏模型

具体来说,互联网设计原则可以总结如下(详见RFC1958):

1.网络协议必须适应异构机器之间的互连;

2.依靠标准来选择方法;

3. 具有良好的可扩展性;

4.找到性能、成本和功能的平衡点;

5.保持简单;

6.模块化;

7.不要等待找到完美的解决方案;

8.尽量避免选项和参数;

9.严发收;

10.小心收到没有你自己请求的数据包;

11.避免循环依赖;

12.对象应该是自描述的并且必须使用 IANA 授权的编码;

13.任何协议都应使用统一的术语、注释、位和字节顺序;

14.互联网的协议只有实现了几个可以运行的程序才能成为标准。

技术组件

互联网的“构建块”是指特定的技术。由于不断的设计原则,互联网的构建块逐步发展。如果以十年为周期,在互联网的不同发展阶段,会有不同的代表技术热点。

在 1970 年代,最重要的技术是 NCP;

1980年代,最重要的技术是TCP/IP;

1990 年代是 DNS 和 BGP;

2000年代,万维网出现,最重要的技术是HTTP;

2010年代,由于斯诺登事件,加密HTTPS受到广泛关注;

现在是2021年,预计IPv6相关技术模式将成为2020年代,也就是下一个十年的热点。

主要原因是IPv6拥有丰富的地址资源。随着互联网的发展,IPv4地址枯竭,很多应用受到IPv4地址数量的限制。

根据美国国家科学基金会 2016 年的预测和比较:在 1980 年代,平均每十个人拥有一台计算机;到 2016 年,每个人平均拥有 10 台计算机,到 2051 年,平均每个人将拥有一台计算机。拥有一千台电脑。

图2 IPv6地址空间

如此大量的地址需求,给了IPv6施展才华的机会。目前,我国正在加紧推进大规模部署IPv6的国家战略。我们能否抓住这个难得的机遇,掌握未来的网络核心技术?

标准设置

信息技术发展很快,而互联网的发展相对稳定:IPv4形成于1983年,至今没有太大变化;BGP4成立于1993年,一直沿用至今,没有像BGP5这样的新版本。这不像移动通信领域的2G、3G、4G,以及现在的5G,不断更新迭代。这源于 TCP/IP 等 Internet 协议的稳定性。只有在稳定的基础上,才能不断扩大规模,实现全球联通。

互联网的稳定发展基于互联网标准的制定,一般遵循以下原则:

1.开放参与。任何个人都可以向 IETF 提交标准草案(Draft)。多方利益相关者的合法性通过对标准决策过程的多样化参与得到加强。比如业界提倡已久的“开源”,就是遵循这个原则的。

2.过程是透明的。从草案(Draft)到标准(RFC),全程记录电子邮件的收发和公开会议纪要。如果你要在互联网上做某事,它是透明的、公开的,是经得起考验的。

3.公开发布。RFC 通过 IETF 网站免费分发给全社会。流程透明度和公开披露为公众监督和问责提供了机会。

4.免费使用。标准制定者自愿放弃专利,免收知识产权费用。互操作性促进了互联网的创新和变革。从专有协议转向提供互操作性的开放互联网标准是一项重大的社会技术变革。

免费发布和无 IP 的互联网标准提供了开放性和互操作性的传统。正是这种一贯的开放规则,推动了互联网软硬件创新的快速发展。

同时,互联网标准制定的关键词包括“开放性”、“自下而上”、“自愿采用技术”、“功能互操作性”、“全球可访问性”。

还有两个关键词值得一提,那就是:“尽可能竞争”和“只在需要合作的时候才合作”。因为通过竞争制定的标准是有生命力的。

从互联网发展史来看,真正的创新需要“逆天思维”、“大战略背景”、“充足资金”、“市场经济驱动”、“精英团队”五个要素。

教育信息化网络:留有足够的创新空间

架构设计

图片[1]-2030年中国的网络研究者,也能取得世界领先的成果-老王博客

在编制《教育信息化中长期发展规划(2021-2035年)》和《教育信息化“十四五”规划》的过程中,我们完成了新一代教育信息化基础设施建设。其设计要素包括:“两个设施、三个平台、两个系统”。

图3 下一代教育信息基础设施架构

底层是基于“TCP/IP”的网络基础设施,以云服务为代表的数据服务设施在顶层。它们为上层平台提供越来越强的通信能力、计算能力和存储能力。在配套运营体系和绿色保障体系赋能下,全力支持科研平台、教学平台和创新平台三大应用平台的建设和发展。

这三个平台采用“网络切片(私网)”的设计理念。专网的特点是:统一分级管理的TCP/IP网络,统一分配IP地址,统一管理域名,保证网络内信息传输的服务质量,与公共互联网建立清晰的管理边界。

但是,私网不是封闭的,用户可以通过私网访问公网,访问相应的网络资源;同时,他们可以拥有一个独立于公共网络的“空间”,为利用网络自主创新提供了条件。

发展趋势

网络发展,特别是教育网络信息化的发展,预计将呈现以下趋势:

一是专网与公网融合。疫情期间,在家中大规模的“停课不停学”,让我们对教育网的内涵有了更深入的思考。未来,民办教育网络应无处不在,私网与公网融合是大势所趋。

网络和数据融合。未来,网络基础设施与数据服务设施的互动将得到加强。

现实与虚拟的融合。当前的热点“数字孪生”是以数字化的方式对物理实体进行虚拟仿真。

此外,教研相结合,科研与创新相结合。这与教育信息基础设施架构中提到的科研平台、教学平台和创新平台是一致的。

最后,还有科学与人文的融合、历史与未来的融合、学校与社会的融合、中国与世界的融合等趋势。尽管我国当前面临严峻复杂的国际变化,但考虑到“构建人类命运共同体”的政策方针,教育网络全球化仍不可逆转。

指标

在疫情防控的实际应用中,我们总结了新一代网络基础设施需要具备的三个特点:

1.“服务质量可测试性”,包括实时应用支持、自动调度等;

2.“安全风险可控”,既能合规,又能发展;

3.“应用进化的可行性”,即为进化和快速迭代留出足够的空间。

新一代教育信息化中的网络基础设施有以下指标:

1.访问质量优于公网,尤其是对科学数据库、教育科研信息相关资源的访问;

2.体现教育网络的特殊性,拥有公网无法访问的信息资源;

3.超高性能信息传输,包括高性能计算(HPC)等;

4.一个开放的创新环境,包括创新项目、教育网络(大学)、开源信息共享等,必须为大学校园的创新提供空间。

教育信息化应用:遵循三个原则

从某种意义上说,教育信息化比网络化更难。供需不对称可能是系统开发中最大的问题。

中国有句古话叫“知难而行”,用户往往无法描述信息系统的真实需求。用户真正想要什么?系统的开发者能理解他的需求吗?

对于信息系统的开发和生产,我的三个原则是:历史记录、演化空间、学习曲线。每个标准都需要一个问题的答案。

历史记录

10年,100年后,1000年,10000年……未来的考古现在是什么样子?

在考古学和人类文明史上,都有“缺失环节”这样的描述。例如,鸟类被认为是从恐龙进化而来的,但几乎没有发现化石。在这个进化过程中,曾经发生的环节已经消失,不留痕迹。

人类进入计算机时代后,随着存储设备和软件版本的升级,许多历史记录无法再读取或运行,“失联”现象更加普遍。这意味着,互联网上现有的所有内容都有可能成为“缺失的一环”,很难想象未来的考古学家会如何应对这种情况。

在学校信息化中,这种情况随处可见。比如学校网页,我们还能找到过去某个时间的网页情况吗?很多学校可能找不到。做好教育信息化应用工作,必须重视史料,不愧为史实。

IETF的RFC、HTML、TeX、UNIX等都是很好的信息系统设计案例,重点是保存历史记录。由此,我们总结出应用系统的框架设计思想:把最常见的任务简化,让不太常见的任务不那么麻烦。很多时候,人们花了很多时间却没有抓住重点,因为他们想取悦所有人。但关键是,我们不能取悦所有人,我们只能分清谁最重要;设计仅占 80%;赋予内容创作者最大的权力;默认是聪明的。

如果信息系统的设计面临矛盾,那么应该遵循这样的优先顺序:用户第一,文档作者第二,程序员第三,标准第四,理论完善第五。在任何时候,用户的优先级都是最高的。

真正好的信息系统必须由顶尖人才编写。在一流大学中,信息系统的用户是一流的学者和学生。如何为他们提供有用的信息系统?如何打造用户喜爱的产品?

答案是:从制作整洁的产品开始;确保你想使用它;设置默认值,不限制用户;尽可能使用自己的软件。

微信创始人张小龙说的我很赞同。他说:如果解决方案很复杂,那么问题一定是错的。对于一个真正好的应用程序,解决方案必须优雅而简单。

进化空间

有没有不符合当前主流的研究空间?在大家都不乐观的情况下,是否可以专注于一项研究?

以IPv6过渡技术实践为例。2017年底,中共中央办公厅、国务院办公厅发布了《推进互联网协议第六版(IPv6)大规模部署)行动计划》,提出大规模部署IPv6的国家战略。

然而,IPv6过渡技术实践之路并非一帆风顺。当时,纯IPv6网络和IPv4/IPv6转换的技术路线还没有得到充分认可。无论是来自IETF的技术建议,还是各国政府的政策,都是双栈模式。

有趣的是,2020 年,美国管理和预算办公室 (OMB) 发布了 IPv6 部署和使用指南。虽然该指南比中国的IPv6大规模部署行动计划晚了很多,但明确指出未来双栈模式将难以维护,需要向纯IPv6网络迁移。现在回想起来,纯IPv6是未来的必然趋势。CERNET从一开始就面对各种批评,一直坚持建设纯IPv6网络。这一步无疑是正确的。

这表明互联网技术的发展速度超出了任何政府所能控制的范围。这也给我们带来了启示:一方面,做研究和战略时要有前瞻性的眼光;另一方面,要跟上网络技术的发展,要有自主创新的空间。

学习曲线

需要重新学习另一种技能而不是新的知识和智慧?

我们需要思考的是,在信息系统和软件的迭代更新中,为了达到同样的目的,用户是否需要浪费时间学习另一种“技能”,还是真的在学习新知识和新智慧?

图4 人类文明金字塔

在代表人类文明的金字塔中,自下而上依次是“数据”、“信息”、“知识”、“智慧”。目前用计算机网络这个名词对计算机网络的基本概念总结,教育信息化处理数据和处理信息没有问题,但能处理知识和智慧吗?还是一个问号。

掌握核心技术要注重基础研究

目前,教育网蓝图中有四个网络:CERNET、CERNET2、FITI和教育网。令人兴奋的是,这些网络中至少有三个已经实施。除了CERNET(IPv4)、CERNET2(IPv6))之外,未来互联网测试设施FITI(Future Internet Testing Infrastructure),也可以称为CERNET3,已经进入建设阶段。

与以学校为接入单位的CERNET和CERNET2相比,FITI还有一个新特点,就是可以扩展到实验室、部门、教研组,更好地实现创新。此外,教育网络建设规划正在审批中。

从互联网技术和教育信息化的发展史来看,如何掌握互联网核心技术是一个经久不衰的话题。回顾CERNET的发展,我们会明白一个道理:一定要重视基础研究,只有基础研究才能产生伟大的思想;只有基础研究才能产生大师级人物。我希望CERNET、CERNET2、FITI(CERNET3)这三个网络能够创造这样一个可以孕育伟大思想和伟大人物的环境。

在CSNET举办的纪念亚洲互联网接入35周年座谈会上,一位互联网先驱指出:

TCP/IP 和 Unix 起初都不是明显的赢家。国际对网络的需求强劲用计算机网络这个名词对计算机网络的基本概念总结,但成本、线路稀缺等阻碍了进展;此外,由于美国政府的参与,将非美国机构连接到网络需要政策审查等。

简而言之,互联网连接国际的过程并不容易,但现在回顾历史,他们可以自豪地说“然而——我们做到了!(我们做到了)”!

这也是我对中国互联网研究的期待。希望到2030年,中国网络研究人员和CERNET工作者也能取得世界领先的成绩,自豪地说“我们做到了”!

本文基于李星教授的报告《历史与未来:互联网技术与教育信息化》。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论