8月21日,2024年RISC-V中国峰会在杭州隆重召开。作为开源指令集的杰出代表,RISC-V引领了全球科技浪潮。本次峰会汇聚了来自各地的科研院所、企业和社区伙伴等3000余位专家学者,共同探讨RISC-V领域的最新进展与未来趋势。
8月22日上午,乘影开源GPGPU项目的相关报告,吸引了众多与会者的热切关注。报告分为五个部分,涵盖了从理论到实践的全面内容。
报告开始,清华大学集成电路学院的何虎老师,以“乘影开源GPGPU介绍”为主题,讲述了乘影项目的背景、发展历程以及开源生态的重要性。何虎老师从Vector处理器和GPGPU的主要区别、CPU和GPU的性能和编成模型对比,阐述了乘影开源GPGPU创新路线的可行性。并从指令集、微架构、同类GPU对比、以及当前的社区建设等深入浅出的讲解了乘影GPGPU的研发进展,使与会者对乘影GPGPU项目的核心理念和未来方向有了更清晰的认识。他还呼吁GPGPU从业者加入到乘影的大家庭中。
清华大学老师 何虎
于芳菲,清华大学集成电路学院的硕士三年级研究生,以“乘影开源通用图形处理器指令集架构介绍”为题,详细介绍了乘影GPGPU指令集架构设计方案,包括提供基本控制功能和公共数据通路的RISC-V标量指令部分,支持线程执行的RISC-V向量指令部分,以及为保证SIMT编程模型基本功能和与编译器协同提高指令效率所支持的自定义指令。同时将介绍乘影GPGPU指令集的扩展方案,并发布64位指令集设计方案。
清华大学研究生 于芳菲
沈贽,苏州国芯科技股份有限公司的CPU研发总监,带来了“基于RISC-V内核的GPGPU的工程化RTL实现”的报告。他表示通用图形处理单元(GPGPU)是高性能并行计算处理芯片的一种,由于其可编程性,易移植性,面对新兴应用具有较低的跟随成本,在高性能计算市场上比较有吸引力。目前GPGPU,或者是GPU生态及其分散,资源不集中,内卷严重,在计算指令架构层面不具有统一性和开拓性。为了解决此类问题,可以使用RISC-V指令架构作为其流计算内核的通用指令架构,以向量扩展作为其加速GPGPU计算的主要手段。报告以高性能计算应用场景切入,从理论和工程实现的角度出发,展示了乘影GPGPU RTL设计逻辑的合理性和高效性。
苏州国芯CPU研发总监 沈贽
伍华林,兆松科技CTO,以“详解开源乘影GPGPU OpenCL编译器技术栈”为主题,深入介绍基于RISC-V的乘影开源GPGPU的OpenCL编译器软件栈的实现情况,包括OpenCL编程模型和硬件如何映射,OpenCL驱动如何和OpenCL C编译器、硬件交互,内存等级和编程模型到指令集的设计和映射等SIMT编程模型上面的一系列问题和解决方案。
兆松科技CTO 伍华林
马鸣远,清华大学集成电路学院的博士一年级研究生,以“乘影GPGPU基于Chisel HDL的硬件实现最新进展”为题,介绍了支持的Chisel版本从3.5.0升级到6.4.0;开发了内存管理单元(MMU),包含两级TLB、PTW、辅助TLB存储等,同时更新了模拟内存;引入的TMA,开发了张量内存加速器(DMA engine),支持从global memory将指定规格张量异步拷贝到local memory;进一步开发了tensor core,通过在每个SM核心中加入支持m8n4k8的计算阵列,实现自定义规模的张量乘累加,阵列内的计算单元支持FP16和INT8的复用,并重新设计了线程块调度器。
清华大学研究生 马鸣远
孔荔,清华大学的软件工程师,以“乘影开源GPGPU软件工具链介绍”主题。报告指出乘影软件平台是基于OpenCL框架,实现的一个端到端的软件工具链,能够支持程序在不同设备上得到运行结果,用于辅助硬件的验证和仿真,同时兼具一套支持不同类型仿真设备的统一框架。从工具链的整体架构设计出发,详细介绍了各个组成软件,包括实现编成模型映射、API支持、metadata信息传递的pocl异构平台,具备统一接口和内存分配机制的自研驱动,以及添加自定义指令、GPGPU组件以及对接驱动接口实现的spike指令级仿真。同时介绍乘影GPGPU开源社区,涉及工具链的搭建环境、构建与使用方式、代码贡献等。
清华大学工程师 孔荔
乘影开源GPGPU项目的报告内容丰富、信息量大,不仅展示了前沿技术的最新成果,还为未来的开源生态发展提供了宝贵的启示。此次峰会的成功举办,标志着RISC-V生态系统的进一步壮大,也彰显了中国在全球科技领域的影响力和领导力。
合影