教学科研

首页 > 教学科研 > 正文

信息工程学院高伟课题组在多媒体技术与开源算法领域取得重要进展

2022-07-06信息工程学院

责编:王可佳

ACM Multimedia全称ACM国际多媒体会议(ACM International Conference on Multimedia),该会议始于1993年,是多媒体领域的国际顶级会议。高伟助理教授课题组分别在点云编码快速算法、8K超高清视频实时编码硬件开源算法库、点云算法开源算法库等多媒体技术领域共有3篇论文被ACM Multimedia 2022录用(https://gaowei262.github.io/)。

论文1:“Rate-Distortion-Guided Learning Approach with Cross-Projection Information for V-PCC Fast CU Decision”主要用于加速基于视频的点云编码(V-PCC,Video-basedPointCloudCompression)中属性序列的压缩。在V-PCC中,三维动态点云序列会被投影成为二维序列(包括占用序列、几何序列和属性序列)以使用相对成熟的二维视频编码器进行数据压缩。但是,二维属性序列的压缩是非常耗时的。而且,由于V-PCC的特殊编码结构和视频内容,目前尚未存在合适的快速算法。针对此问题,该论文结合交叉投影信息提出了一种面向V-PCC全I帧编码模式的率失真指导的属性编码单元(CU, Coding Unit)快速划分算法。通过分析交叉投影信息的对于CU划分的指导效益,该论文首先提出联合占用、几何和属性信息用于CU划分决策。其次,考虑到不同CU具有不同的率失真性能以及错误预测它们的划分模式对于编码性能的影响也不尽相同,该工作设计了一种率失真指导的学习策略来降低错误预测CU划分模式所带来的编码损失。此外,该工作还设计了一个整体CU划分决策框架以适应V-PCC的特殊编码结构。最终的实验结果证明,该方法可以节省62.41%的编码时间,编码损失仅为0.27%,对于V-PCC编码标准的推广和应用具有巨大价值。该论文通讯作者为高伟助理教授,信息工程学院为第一作者单位,博士生袁航为第一作者,合作者还包括信息工程学院李革教授、密苏里大学堪萨斯城分校李竹副教授。

论文2:“OpenHardwareVC: An Open Source Library for 8K UHD Video Coding Hardware Implementation”主要用于应对具有我国自主知识产权的新一代音视频编码标准(AVS3, The Third-generationAudioVideoCodingStandard)在硬件平台上实现8K(7680Í4320)超高清实时编码的挑战。8K超高清视频在硬件平台上的实时压缩是视频编码新标准的示范性应用。然而,新一代音视频编码标准AVS3中加入的众多编码工具大大增加了编码复杂性,严重阻碍了硬件编码器的高效实现。为了打破瓶颈,该文章提出了第一个用于8K超高清视频编码硬件实现的开源软件库OpenHardwareVC。基于对AVS3软件算法的分析,此库中提供了四个主要编码阶段的硬件加速设计,包括编码单元分区、内部预测、变换和熵编码。硬件仿真结果表明,基于该库中的软件描述模块可以轻松支持8K视频每秒30帧的实时压缩。该算法库的研发对超高清视频编码的硬件设计和系统实现具有重大意义,也有利于新编码标准的推广。目前OpenHardwareVC算法库已开源在OpenI启智社区https://git.openi.org.cn/OpenHardwareVC。该论文通讯作者为高伟助理教授,信息工程学院为第一作者单位,AVS3hi 8K硬件FPGA项目组全体同学为共同作者(包括:博士生袁航、硕士生郭洋、硕士生陶履方和硕士生蔡占元等),合作者还包括信息工程学院李革教授。

论文3:“OpenPointCloud: An Open-Source Algorithm Library of Deep Learning Based Point Cloud Compression”给出了第一个基于深度学习方法的点云压缩开源算法库。该工作实现了8种无损几何点云压缩和有损几何点云压缩的方法。该文章述了这些方法在算法库中的原理及贡献,并提供了在不同的深度学习编程框架的实现代码,例如TensorFlow,Pytorch和TensorLayer。为了系统地评估所有这些方法的性能,该工作进行了全面的基准测试并根据其类别进行分析和比较,最终给出了建设性的结论。目前该算法库开源在OpenI启智社区https://git.openi.org.cn/OpenPointCloud,其对于点云深度压缩领域的发展具有重大意义。该论文通讯作者为高伟助理教授,北京大学信息工程学院与鹏城实验室联合点云开源项目团队全体师生为共同作者(包括:鹏城实验室工程师叶华,信息工程学院博士生郑慧明、硕士生伍宇阳和博士生谢良等),合作者还包括信息工程学院李革教授。

以上三项研究成果得到了科技部国家重点研发计划、国家自然科学基金、广东省自然科学基金、深圳市基础研究专项稳定支持重点项目和面上项目等支持,在算力方面得到了深圳鹏城实验室的“鹏城云脑”支持。

关闭