本网消息 近期,电气与电子信息工程学院智能信息处理与控制团队分别在Knowledge - Based Systems (中科院一区Top) 和Artificial Intelligence Review (中科院二区Top) 期刊发表《Efficient correlation information mixer for visual object tracking》和《Comprehensive Exploration of Diffusion Models in Image Generation: A Survey》的论文。两篇论文均以湖北理工学院为第一完成单位,团队成员陈航博士为第一作者,团队负责人章磊教授为通讯作者。
《Efficient correlation information mixer for visual object tracking》聚焦于视觉目标跟踪领域中的孪生跟踪框架应用。针对现有Cross-Correlation方法在目标通道语义信息和局部信息提取上的不足,研究团队提出了一种高效的相关信息混合器。通过设计信息融合网络,团队利用Depthwise Cross-Correlation和Pointwise Cross-Correlation分别提取目标的通道语义信息和局部信息,并通过相关信息混合器将两者充分融合,实现了更优的目标信息编码。这一创新显著提升了视觉目标跟踪的性能,为相关领域的算法优化提供了新的思路。
网络架构图
《Comprehensive Exploration of Diffusion Models in Image Generation: A Survey》系统综述了扩散模型在图像生成领域的最新进展及其潜在社会影响。随着深度学习技术的快速发展,扩散模型在图像生成、音频和视频合成、分子设计等领域展现出巨大潜力。然而,其广泛应用也引发了数据隐私、安全及艺术伦理等问题。本文不仅全面回顾了扩散模型的理论基础及其在图像生成子领域(如风格迁移、图像编辑、超分辨率等)的最新应用,还深入探讨了其可能带来的社会影响,包括数据泄露风险、恶意利用模型的防御策略,以及生成图像的真实性和原创性对艺术创作与版权保护的影响。这一研究为扩散模型的未来发展提供了重要的理论参考和社会伦理指导。
不同任务上扩散模型生成的图像
相关研究工作得到湖北理工学院引进人才项目(23xjz14R),2023年度矿区环境污染控制与修复湖北省重点实验室湖北理工学院·黄石大冶湖高新区大学科技园联合开放基金(23xjz08AK),湖北省教育厅科学技术研究计划指导性项目(B2023234),湖北省科技计划项目(KJRQ2023000110),国家自然科学基金(61871178),2023年度湖北理工学院-武汉南华工业设备工程有限公司联合实验室开放基金的资助。
论文链接:
https://doi.org/10.1016/j.knosys.2024.111368
https://doi.org/10.1007/s10462-025-11110-3