您当前位置: 首页  >  新闻中心  >  菠菜导航新闻  >  正文

菠菜导航新闻

博士生高腾两篇论文被分布式并行计算国际顶级期刊TPDS和体系结构国际顶级期刊TCAD接收

发布日期:2024-09-30 发布人: 点击量:

  2021级博士研究生高腾两篇论文分别被分布式并行计算国际顶级期刊IEEE Transactions on Parallel and Distributed SystemsTPDS)和体系结构国际顶级期刊IEEE Transactions on Computer-Aided Design of Integrated Circuits And SystemTCAD)接收

  高腾为第一作者的论文《SSA: A Uniformly Recursive Bidirection-Sequence Systolic Sorter Array》被TPDS接收,作者还有高腾的指导教师黄岚教授,高尚教授,通讯作者为王康平副教授。另一篇《MCSSA: A Stream-Based Multi-Concurrency Systolic Sorting Array combining Merge Tree》被TCAD接收,第一作者为黄岚教授,第二作者为高腾,通讯作者为王康平副教授。

  近年来脉动阵列因其擅长处理计算密集型算法在矩阵运算中已有广泛应用。排序应用也属于计算密集型算法,但大多数使用专用处理器的排序算法仅基于算法的并行化设计,缺乏对专用硬件结构的考虑,包括但不限于消耗过多的 I/O 接口资源、片上存储资源和复杂的布局布线。为克服这一难题,首先提出了一种 Systolic Sorter Array(SSA),该阵列可由统一递归方程 (URE) 描述,在数据大小、位宽和类型方面高度参数化。利用这种统一递归结构,排序器可以同时对两个独立序列进行排序。研究结果表明,SSA 在吞吐量、加速比和计算频率方面都优于其他排序算法。基于该项成果,进一步的扩展了基于URE结构的多并发脉动排序阵列(MCSSA)算法,该算法基于n元组关系,具有灵活的4N/n时间复杂度。进一步改进了名为 MC-merge tree 的归并树结构,此并发树的并发性也可以灵活定义,将该算法与 SSA 结合使用,可以应对大规模排序场景。MCSSA 继承了脉动阵列架构的统一性和简洁性,在 U200 上实现了最高 73.17 倍的加速比。此外,在保持加速比优势的同时,MC-merge tree将 MCSSA 的排序规模最大扩展了 450.56 倍。研究结果表明,与其他 SOTA 算法相比,MCSSA 和 MC-merge 树具有更好的加速度、吞吐量和可扩展性优势。