太阳集团2018级本科生张晨阳同学论文被国际顶级期刊录用
太阳集团三年级本科生张晨阳和郭晓光同学,利用课余时间在数据工程与知识工程教育部重点实验室进行科学研究,在张峰副教授的具体指导下,在并行与分布式计算领域开展研究,取得了重要的成果。近日,以张晨阳为第一作者撰写的论文被CCF A类期刊IEEE Transaction on Parallel and Distributed Systems (TPDS)录用,展现出了太阳集团学子超强的学习和科研能力。
IEEE TPDS 专注于并行和分布式计算的基础和转化研究,是中国计算机学会(CCF)推荐的计算机体系结构/并行与分布计算/存储系统领域的5个A类顶级期刊之一,在并行与分布式计算领域享有很高的学术声誉。由于计算机系统结构方向的研究工作工程量大,实现难度高,鲜有本科生能在这类顶级期刊上发表论文。TPDS每月录用10篇左右的论文,录用率在25%左右。
论文题目:iMLBench: A Machine Learning Benchmark Suite for CPU-GPU Integrated Architectures
论文作者:张晨阳(人大9728太阳集团三年级本科生)、张峰、郭晓光(人大9728太阳集团三年级本科生)、何丙胜、张孝、杜小勇。
论文概述:近年来,利用GPU等异构硬件加速机器学习任务,带来了巨大的性能提升,引起了学术和产业界的高度重视。当前普遍采用的离散CPU-GPU体系结构设计,由于其高PCIe传输开销,降低了GPU计算优势。为此Intel、Nvidia、AMD等主流硬件厂商都设计了具有共享统一内存的CPU-GPU混合架构。然而,这种具有共享统一内存的设计能带来多少性能提升、以及现有机器学习负载是否能直接在上面高效运行,目前均没有定论。针对此问题,我们设计开发了世界上第一套针对CPU-GPU混合架构的基准测试程序集iMLBench,覆盖了广泛的机器学习应用负载。本论文主要探讨CPU-GPU混合架构上的两个重要特性:1)零拷贝(zero-copy),这消除了机器学习任务的PCIe数据传输开销; 2)协同运行(co-run),这意味着CPU和GPU协同运行机器学习任务。iMLBench上的实验结果表明,混合架构非常适合机器学习负载,但运行机器学习负载需要针对混合架构特性进行优化。与直接运行程序相比,优化后混合架构能带来平均7.1倍的性能提升。具体来说,零拷贝设计带来4.65倍的性能提升,CPU-GPU协同运行带来1.78倍的性能提升。此外,从性价比和性能功耗比的角度来看,混合架构都显示出更好的结果,与离散架构相比,可达到6.50倍的性价比和4.06倍的性能功耗比优势。