编者按:近两年,RISC-V 作为 IT 产业链中国产替代中的重要一环备受关注。这个基于 BSD 协议开源,基金会总部设在瑞士的开源指令集也一直被视为 X86 和 ARM 强有力的竞争对手。不过,由于起步较晚,性能与生态尚未成熟,RISC-V 以往更多地是用在物联网领域。今年,算能科技基于阿里平头哥玄铁 C910 开发了一台 64 核 RISC-V 服务器 SG2042。这一动作则拉开了 RISC-V 挺入云计算领域的序幕,2023 也被业界看做是 RISC-V 进入云计算的元年。本期开源访谈我们邀请中国电信研究院云计算技术研究中心博士崔恩放为大家介绍 RISC-V 指令集落地的相关历史与现状,今年 5 月 27 日 - 28 日,崔恩放也将担任 GOTC 2023 全球开源技术峰会讲师,带来有关 RISC-V 的深度主题演讲,与到场观众共同分享 RISC-V 云计算软件开源现状与探索工作。
嘉宾介绍
崔恩放,博士,就职于中国电信研究院云计算技术研究中心,目前为 RISC-V 研究负责人,负责 RISC-V 云计算开源软件供应链建设以及 RISC-V 轻量级虚拟机研发。先后参与 3 项国家重点研发计划、1 项国家自然科学基金项目、1 项北京市科委项目等。近年来发表 SCI 论文 4 篇,EI 论文 7 篇,中文核心 1 篇,授权专利 6 项等。曾担任 IEEE EUC 2022 会议 Workshop Co-organizer、IEEE Infocom 2023 会议 Workshop TPC Member。
OSCHINA:先和大家介绍下您正在做的项目吧?
崔恩放:
我是来自中国电信研究院云计算研究团队的崔恩放,我们近期工作重点之一就是研究与验证以 RISC-V 为代表的先进计算技术在云计算场景中的应用。举例来说,计算虚拟化作为云计算领域的核心技术之一,目前在 x86 和 ARM 芯片方面,技术已经比较成熟。在核心技术自主掌控的大环境下,如何基于开放 RISC-V 指令集实现计算虚拟化是云计算行业的研究与验证的焦点问题。在上述的技术发展背景下,中国电信以我们研究院团队为主,联合天翼云相关团队,经过半年多的重点攻关,成功完成了基于 RISC-V 指令集的轻量级虚拟机的研发与验证。
中国电信研究院团队在 openEuler 开发者大会交流 RISC-V 轻量级虚拟机研发工作
OSCHINA:您个人最早接触到开源软件和 RISC-V 分别是在什么时候呀?
崔恩放:
我最早接触开源软件是在本科求学期间。欧美兴起的开源软件文化推动了软件领域的迅速发展和进步,我在学生时期就体验了各种各样的开源软件。硬件领域开源的进展要慢一些,但后来也参照了软件领域的开源趋势,出现了 RISC-V 开源指令集。RISC-V 自由开放的信念让我对计算硬件领域的技术发展充满了信心。借着作后也游行区常兴奋,软件的历史社中国电信近年来着力打造云计算原创技术策源地,积极探索 RISC-V 开源芯片技术的绝佳机会,我本人积极争取到了这个机会,希望能发挥自身力量,推动 RISC-V 技术在云计算产业的技术创新与产业化应用。
OSCHINA:RISC-V 在物联网领域的应用历史可以简单介绍下吗?
崔恩放:
物联网设备通常需要具有低功耗、小尺寸和低成本等特点,RISC-V 指令集开源免费、简单灵活、易于裁剪和优化,很好的满足了物联网的需求,使得物联网是 RISC-V 最早成功的场景,到今天有接近 10 多年的历史。
RISC-V 在物联网领域的应用历史可以分为三个时期:初始探索时期、快速发展时期和应用推广时期。初期探索时期大约是 2010 年至 2014 年,RISC-V 的开发工作刚刚开始,主要由加州大学伯克利分校的科学家推进,研发了学术研究性质的 RISC-V 物联网芯片。快速发展时期大约是 2014 年至 2018 年,在这个阶段,一些公司开始采用 RISC-V 架构来设计物联网设备,并将其应用于物联网的传感器数据采集、智能家居等领域。2018 年至今是应用推广时期,一些大型公司开始支持和推广 RISC-V 架构,包括西部数据、英特尔等。到如今全球 RISC-V 芯片出货量已超 100 亿,其中绝大部分用于物联网场景。
OSCHINA:从物联网走向数据中心走、云计算领域,RISC-V 自身的优势在哪?
崔恩放:
您提的这个问题非常好,这个问题也是业内经常思考的一个问题。有研究显示云计算处理了近 95% 的工作负载和计算实例,是对芯片底层技术要求最高的领域之一,如果一个指令集不能在云数据中心实现规模化应用,很难称其在云计算领域获得了成功。
不同于物联网领域,在云数据中心领域,指令集一般被期待用于解决如下三个问题:高性能问题、高效能问题和技术生态问题。这正是 RISC-V 指令集的主要技术优势。具体来说 RISC-V 的优势包含三个方面:首先,RISC-V 设计了多种用于任务加速的指令集扩展,可以实现向量计算、加解密等任务的加速,有较高的计算性能;其次,RISC-V 简洁的特性,可以降低芯片的功耗,提升效能;最后,RISC-V 在国际上已经形成了一定范围内的技术共识,有较好的技术委员会指导,有助于建立体系化、繁荣的生态。
OSCHINA:RISC-V 走向云计算已经进展到哪一步了?
崔恩放:
一般来说,芯片指令集走向云计算可以分为四个阶段。第一个阶段是指令集的设计和完善以及高性能芯片设计制造;第二个阶段是服务器等整机设备的研发;第三个阶段是应用生态适配;第四个阶段是大规模应用普及。
目前业界已经突破了高性能 RISC-V 芯片的设计制造和服务器的研发,正在积极推进云计算应用生态的适配。中国电信也积极的参与到了各个阶段,并将跟合作伙伴一起做应用适配、互认证,对 RISC-V 上云起到应用牵引作用,同合作伙伴共同将 RISC-V 云计算产业做大。
OSCHINA:行业关于 RISC-V 走向云计算的研究大概从什么时候开始的?
崔恩放:
RISC-V 国际基金会在 2021 年成立了 Datacenter/Cloud Computing SIG,开始研究将 RISC-V 应用到云计算和数据中心领域,这算是一个标志性的时间节点。RISC-V 应用到云计算主要涉及到芯片的研发和云计算软件的适配。服务器芯片是近两年开始研发的,2022 年到 2023 年国内外相继发布了数据中心高性能 RISC-V 芯片及服务器。云计算软件的适配实际上开始的比较早,像一些常用的编程语言、编译器其实在 2021 年之前就已经开始适配了,国内软件适配工作研究最早的像中科院软件所的 PLCT 实验室,2020 年就在 OpenEuler 操作系统开源社区成立了 RISC-V SIG,也在 2023 年发布了 OpenEuler RISC-V 23.03 版本。中国电信也于去年开始进行 RISC-V 上云技术的研究与验证,以打造自主可控、高效能的国家云为长远目标,推进了天翼云自研云操作系统 CTyunOS 在国内首台 RISC-V 服务器的适配,并自研了支持 RISC-V 轻量级虚拟机。
OSCHINA:您所在的这个部门决定开始做 RISC-V 相关研发的目的是什么?中国电信处于产业链上的什么角色和地位,优势在哪?
崔恩放:
中国电信作为全球最大的运营商云提供商,凭借在云网领域特有的资源禀赋优势,不仅具有极强的产业牵引作用,同时也一直致力于推动云计算技术、边缘计算技术的创新和应用。在这个过程中,RISC-V 凭借其开放性、灵活性以及成本、性能优势正在成为上述两个场景下全新的指令集架构选择。
2022 年以来,中国电信已经实现云计算核心系统技术栈的全栈自研,并且完成一云多芯的国产化适配。在上述技术积累的基础之上,2023 年开始,我们开始推动基于 RISC-V 开源指令集芯片的云化进程,在这个方面中国电信具有技术先进性。此外,中国电信可以发挥作为云计算原创技术策源地作用,承担央企责任,协同上游 RISC-V 芯片厂商联合推动 RISC-V 相关技术的发展与生态成熟。
无论在边缘云还是中心云场景,中国电信不仅具有丰富多样的应用场景,同时还有巨大的规模优势,可在自身的业务中积极探索基于 RISC-V 架构芯片和设备的采用,由此中国电信对于推动 RISC-V 生态建设、RISC-V 技术研发与应用方面都能发挥重要作用。
OSCHINA:近几年关于 RISC-V 的研究与讨论听起来还挺多的,为什么这个成熟度还没上来?
崔恩放:
当前很多人认为 RISC-V 还不够成熟,这其实对于 RISC-V 的一种误解,我们应该分场景来看待 RISC-V 成熟度的问题。RISC-V 架构的开源、低功耗特性和可扩展性能够很好的满足物联网、嵌入式设备要求的低成本、低功耗、小型化的需求,可以说在这些场景下,RISC-V 是成熟的,并且已经取得了很大的成功。在 2022 年 7 月,RISC-V 国际公司的首席执行官 Calista Redmond 表示:“估计市场上已经有 100 亿个 RISC-V 核”,如此大规模的应用就是一个很好的例证。
所谓 RISC-V 不成熟,主要还是指在面向数据中心、云计算场景的通用计算领域。这是由于多方面的原因导致的,第一,RISC-V 针对通用计算还需要进一步的优化,例如 IP 核设计、处理器架构、编译器等方面,都有待改进以提高其性能核能力。第二,通用计算意味着更复杂的软件生态,而这也是 RISC-V 亟需完善的地方。第三,RISC-V 在通用计算领域缺乏广泛的应用场景,整体还处于探索阶段。这正是中国电信正在做的 RISC-V 在云领域的探索与实践的意义,我们对于 RISC-V 还是抱有积极乐观的态度。中国电信在云计算原创技术策源地的框架下会积极探索并推动 RISC-V 云计算场景应用及关键技术的研究,加速 RISC-V 云计算场景落地应用的进程。
OSCHINA:RISC-V 指令集的构成是怎样的?
崔恩放:
RISC-V 指令集主要包括非特权指令集和特权指令集,其中,非特权指令集又包括基础指令集和扩展指令集,基础指令集就是整数计算指令集(整数加、位移等操作),扩展指令集会针对一些特定的场景提供一些指令,比如 RISC-V 针对向量计算专门提供了 V 扩展,针对加解密提供了 K 扩展。特权指令集主要提供相关指令支持操作系统及虚拟机,如针对虚拟化提供了一个 H 扩展。
OSCHINA:RISC-V 可灵活定制的特性是如何实现的?
崔恩放:
X86 和 ARM 由于历史原因,指令集多达上千页、没有模块化区分,导致很难灵活定制。RISC-V 指令集简洁,并进行了模块化区分,基础指令只有 40 多条,其它指令可模块化添加,使其具备了可灵活定制的特性。例如 RISC-V 基金会制定了向量计算、加解密、压缩等指令集扩展,用户在设计芯片时可以选择是否使用上述扩展,也可定制私有的指令集扩展,如针对通信任务加速定制编解码指令扩展等。
OSCHINA:您认为 RISC-V 可能会在接下来的两三年里扩展到什么领域或是场景下?
崔恩放:
我认为当下两三年 RISC-V 会在边缘计算和部分云计算场景中应用。边缘计算可应用的场景包括边缘数据存储、边缘 AI 等,具体形态可以是边缘盒子或者边缘服务器、边缘一体机等。云计算场景包括离线大数据分析、HPC,或者像一些冷数据存储应用可能会进行一些试点。而且近两年 RISC-V 服务器的虚拟化能力有望增强,可能会出现 RISC-V 指令集的云主机。
全球开源技术峰会(Global Open-source Technology Conference),简称 GOTC,是由开放原子开源基金会、上海浦东软件园、Linux 基金会亚太区和开源中国联合发起的,面向全球开发者的一场盛大开源技术盛宴。 5 月 27 日至 28 日,GOTC 2023 将于上海举办为期 2 天的开源行业盛会。大会将以行业展览、主题发言、专题论坛、开源市集的形式展现,与会者将一起探讨元宇宙、3D 与游戏、eBPF、Web3.0、区块链等热门技术主题,以及开源社区、AIGC、汽车软件、AI 编程、开源教育培训、云原生等热门话题,探讨开源未来,助力开源发展。
GOTC 2023 报名通道现已开启,诚邀全球各技术领域开源爱好者共襄盛举!