优秀论文&优秀青年学者报告名单出炉啦!
更新时间:2025-02-11

AEIC官网-版头.gif


为了更好地搭建学术交流平台,促进粤港澳地区各高校之间的学术交流,广州计算机学会第六届第四次理事会暨第四届(2024)粤港澳优秀研究生论文大赛,协同第四届大数据、信息与计算机网络学术会议(BDICN 2025)、第四届电子信息与通信工程学术会议(EICE 2025)在广东外语外贸大学(南校区)校办公楼成功举办。大会分别设置“优秀论文”、“优秀青年学者报告”评选。其中,论文大赛根据专家线上函评以及现场论文答辩评选,最后产生一、二、三等奖获奖者,为进一步增强评优工作透明度、推动科研学术成果转化,现将获奖名单及成果进行发布:


640 (25).png
640 (26).png
*注:最终解释权归广州计算机学会第六届第四次理事会议暨第四届(2024)粤港澳优秀研究生论文大赛组委会


学术创新类·优秀论文简介

一等奖

姓名:陈梓聪
学校:暨南大学
指导老师:王岢
论文题目:SCG: Score-based Counterfactual Generation for Interpretable Medical lmageClassification and Lesion Localization
论文简介:本论文发表在中科院一区期刊、计算机医学领域的顶级权威期刊 IEEE Transactions on Medical Imaging (TMI)。基于分数的生成模型(Score-based Generator)以其生成逼真的图像爆火之后,人们自然而然想到,或许可以使用生成模型合成医学图像数据集,以此解决医疗图像数据稀缺与数据不均衡的问题。然而,训练一个能够生成逼真医学图像的模型同样需要大量医学数据,使得问题陷入了“先有鸡还是先有蛋”这样循环困境,而且即便是充分训练的生成器,其生成的图像仍然不可能避免存在一些不符合物理规律的失真区域,过量使用这些合成图像,不仅无法提升模型性能,模型反倒有可能学到了失真区域的错误特征,导致性能劣化。
创新性:本文创新性提出了一个基于评分的反事实生成(Score-based
Counterfactual, SCG)框架,显著改进了医学领域深度神经网络在数据稀缺与分布不均衡情况之下基础任务的性能表现。主要改进点在于:高效图像生成与蒸馏训练:本文首先采用基于分数的生成模型(Score-based Generative Models, SGM)稳定地训练图像生成模型,随后通过知识蒸馏技术将SGM 生成能力迁移至运算更高效的 ProGAN,实现了高质量与高速度兼备的图像生成效果。潜在空间编码与反事实生成:SCG 在反事实生成阶段,首先将医学图像编码于潜空间,再通过嵌入向量生成反事实图像,从而有效降低了数据合成的难度,增强了生成图像的可控性和稳定性。可学习模糊块解决不确定性:引入可学习模糊块(FuzzyBlock),自适应学习生成数据中的噪声来屏蔽不符合现实物理特性的区域,有效地处理了生成图像之中的不稳定因素,提高合成数据的可用性。实验结果表明,SCG框架能够有效弥补数据不足,通过合成数据显著提升了深度学习模型对于分类与病变定位任务的性能,尤其是在可解释性病变定位任务中,相较于现有SOTA方法平均提升了3-5%的性能,个别类别在特定指标上面的增幅甚至达到了20-30%,这一成果在计算机科学领域的医学图像分类与病变定位研究中展现了突出的贡献,并被其它等高水平期刊,比如TCE, TIP引用作为比较基准。本研究为医学图像分析中的数据挑战提供了一种创新且实用的解决方案,推动了医学影像分类与病变定位任务在实际应用中的发展,具有重要的学术和临床应用价值。

姓名:陈泰佑
学校:华南理工大学
指导老师:陈伟能
论文题目:Multi-Agent Swarm Optimization with Adaptive Internal and External Learningfor Complex Consensus-Based Distributed Optimization
论文简介:近年来,分布式优化引起了广泛关注。面对黑箱和非凸分布式优化问题,演化计算的天然并行性和全局搜索能力有着巨大的潜力。然而,多智能体系统中不同节点的目标存在差异性和冲突性,如何通过高效通信来优化全局目标函数并保证系统共识性仍然面临着巨大挑战。为了解决这一问题,本文提出了一种具有自适应内部与外部学习机制的多智能体群体优化方法。首先,我们设计了基于内外部学习的新型粒子群学习机制,内部学习使得智能体能够优化其局部目标,而外部学习则使智能体能够协作并在全局目标上达成共识性。其次,为了提升共识性能力,我们为粒子进化设计了一种特殊的外部学习速度设置。我们还提供了算法系统共识性的理论分析。最后,为了提高通信效率,我们设计了一种自适应通信机制,用以动态调整通信间隔,使智能体在早期阶段能够更好地探索,在后期阶段实现系统共识性。实验研究表明,与现有的黑箱分布式优化算法相比,所提出的算法在基准函数上的共识性能稳定,解质量具有竞争力,且通信成本更低。
创新性:本文针对分布式共识优化问题中的黑箱非凸挑战,结合多智能体共识理论和粒子群优化算法,提出了多智能体系统下的新型粒子群学习机制,形成基于自适应内外部学习的多智能体粒子群协同优化算法。一方面,本算法发挥了粒子群算法在黑箱非凸优化问题上的优势,在80%的基准测试函数上优于现有分布式优化算法;另一方面,多智能体共识理论为算法提供共识保障与理论支撑,经过对粒子群动力学系统建模与分析,本文从理论上证明了算法的系统共识性,且通过实验验证了算法在不同网络规模与拓扑结构下的共识表现。
实用价值
(1)在现实应用场景方面,随着我国在“新基建”领域的布局,如 5G 网络、物联网和分布式能源系统,现实应用场景的分布式系统模型越来越复杂,对分布式优化算法提出了更好的要求和挑战。本文提出的算法有望应对现实多智能体系统中复杂黑箱非凸的分布式优化问题,我们将提出的算法在无线传感器网络中的多目标协同定位问题中测试,实验结果显示本算法的定位精度显著优于现有的分布式黑箱优化算法。
(2)在应用可靠性方面,分布式系统中多个节点的协调与一致性问题是工业界优化算法应用中的重要挑战,确保算法在面对各种不确定性时依然能够保持可靠的性能,是工业界应用的前提。本文从理论上证明了算法的共识能力,并通过实验验证了其在黑箱优化场景中的稳定共识表现。这使得该方法具备广泛应用于工业界的潜力,有望解决实际工程中复杂黑箱分布式优化问题。
(3)在应用效率性方面,随着分布式系统的规模和网络拓扑的日益复杂,如何在保证优化效果的同时减少通信开销,对于提升大规模分布式系统的应用效果和实用价值具有重要意义。本文的方法具有通信高效的特点,并通过实验验证了其在不同网络规模和拓扑结构下的适用性。这对于现实系统中的分布式协同优化任务具有重要意义,可以为国家实现“双碳”目标提供技术支持,推动绿色可持续发展。

二等奖

姓名:薛兆丰
学校:广州大学
指导老师:王子佳
论文题目:Neural Network-based Knowledge Transfer for Multitask Optimization
论文简介:在进化多任务优化中,知识迁移(KT)对于优化任务至关重要。然而,现有的 KT方法大多只能实现表面的KT,缺乏深度挖掘不同任务之间相似性或关系的能力。这种限制可能导致负迁移,从而降低KT性能。由于KT效率强烈依赖于任务间的相似性,文中提出了一种基于神经网络的KT(NNKT)方法,通过分析任务间的相似性,得到不同任务间信息预测的迁移模型,从而获得高质量的 KT。首先,NNKT收集并配对多个任务的解,训练神经网络以获得任务间的迁移模型;其次,得到的神经网络通过预测新的有前途解来迁移知识。同时,设计了一种简单的自适应策略来寻找合适的种群规模以满足进化过程中的各种搜索要求。

姓名:何梓濠
学校:暨南大学
指导老师:温金明
论文题目:Efficient Sparse Recovery with Arctangent Regularization: A Novel IterativeThresholding Algorithm
论文简介:压缩感知(Compressed Sensing, CS)是一种能够以远低于奈奎斯特采样率的观测数据重构稀疏信号的理论框架,已广泛应用于图像处理、视频重构和无线通信等领域。ℓ1-正则化是一种广泛的稀疏优化方法,但其挖掘信号稀疏性的能力十分有限。为解决这一问题,非凸正则化方法得到广泛关注。反正切函数是一种新兴的非凸稀疏正则化方法,其在稀疏信号恢复和低秩张量分解中表现出优越性能。然而,由于涉及复杂的子问题(如求解三次多项式方程的根),现有反正切正则化方法的计算复杂度较高,限制了其实际应用。为解决这一局限性,本文围绕基于反正切函数的非凸正则化问题展开研究,其主要贡献如下:
1.推导反正切正则化的闭式邻近算子:首次推导了反正切正则化的闭式邻近算子,显著降低了计算复杂度,避免了以往方法中求解三次方程或采用近似方法的误差。
2.开发高效的反正切正则化迭代阈值算法:基于新提出的闭式邻近算子,设计了一种高效的迭代阈值算法,用于求解反正切正则化问题。
3.算法收敛性能分析:证明了所提出的算法可在一定条件下,以线性速度收敛至反正切正则化问题的局部最优解。
4.实验验证:通过大量对比实验,验证了算法在成功恢复概率、支撑集恢复率、相变特性和抗噪性能等方面的优越性能。

姓名:邓伟泉
单位:西安电子科技大学广州研究院
指导老师:赵博文
论文题目:SOCI+: An Enhanced Toolkit for Secure Outsourced Computation on Integers
论文简介:本文旨在探讨云计算环境中的数据安全和隐私保护问题,并提出了一种新的安全外包计算工具包——SOCI+。随着云计算的普及,用户越来越依赖于云服务来存储和处理数据,但这也带来了数据泄露的风险。为了保护外包数据的安全性,本文提出了一种新的安全外包计算工具包SOCI+,它允许在加密数据上直接进行计算,从而保护数据的机密性。本文的创新点在于提出了SOCI+,这是一个基于(2, 2)-门限Paillier密码系统的增强版安全外包计算工具包。与前身SOCI相比,SOCI+在计算和通信开销方面进行了显著优化。本文设计了一种新颖的密码原语,即(2, 2)-门限Paillier密码系统,并支持一系列高效的整数安全算术计算协议,包括安全乘法、安全比较、安全符号位获取和安全除法等。此外,本文还结合了离线和在线计算机制,进一步优化了性能。本文的应用前景广阔,特别是在隐私保护的机器学习和移动群智感知领域。在隐私保护的机器学习中,SOCI+可以允许在加密数据上进行预测,而无需暴露原始数据,这对于保护用户隐私至关重要。在移动群智感知领域,SOCI+可以支持在用户设备上收集的数据进行安全分析,而无需将数据发送到中心服务器,从而保护用户的地理位置和行为模式等敏感信息。

姓名:张镇荃
单位:西安电子科技大学广州研究院
指导老师:黄婷
论文题目:nLKH-ACS: A Niching Lin-Kernighan-Helsgaun Based Ant Colony System for Multi-Solution Traveling Salesman Problems
论文简介:旅行商问题作为组合优化领域中的经典问题,不仅是理论研究的重要对象,也与大量实际问题如车辆路径问题和电路布局布线问题等等密切相关。一方面,旅行商问题作为NP-hard问题存在相当高的求解难度,另一方面,实际生活中往往不能仅依靠单个解来做出决策,而是需要不同的高质量解以应对各种可能发生的复杂情况,这导致了将旅行商问题应用到实际生活生产中具有严峻挑战。基于此,为了高效地给决策者提供多样化且高质量的解决方案,文章提出了用于求解大规模多解旅行商问题的算法。
文章创新性地利用小生境技术将著名的针对单一解的Lin-Kernighan-Helsgau(LKN)算法拓展到多解领域,使得拓展后的多解算法良好地保持了原来的有效性和高效性。此外,文章提出多种多样性提升策略来改进蚁群算法,使得LKH与蚁群的协同搜索过程更具多样性和稳定性,同时有效地平衡了搜索过程中的开发与探索阶段。实验表明该算法具备优越的性能,在多解旅行商数据集MSTSPs上的表现优于现有最先进的算法,并且首次在经典TSPLIB数据集的多个实例上找到多个最优解。
文章进一步将算法应用到TSP的变体(CVRP问题)上并成功找到多样性强且高质量的不同解,同时提供了算法在实际场景下的管理方法以供参考,有效验证了所提出算法的可拓展性以及广泛的现实意义。

姓名:李六武
学校:华南理工大学
指导老师:蔡毅
论文题目:Bidirectional Alignment forReferringExpressionBottom-Up andComprehension
论文简介:在本文中,我们提出了一种单阶段方法来改进指代表达理解(REC)目标是根据自然语言表达来定位指代对象,我们观察到,人类通过从细粒度到粗粒度的自底向上的方式理解指代表达,并且在图像和文本之间双向获取视觉-语言信息,受此启发,我们定义了语言粒度和视觉粒度,然而,现有的方法并未遵循人类理解指代表达的方式,基于我们的观察并为了解决现有方法的局限性,我们提出了一个自底向上和双向对齐(BBA)框架我们的方法从细粒度表示开始,逐步构建跨模态对齐,并在图像和文本之间双向获取视觉-语言信息。基于 BBA框架的结构,我们进一步提出了一种渐进式视觉属性分解方法,将视觉提议分解为多个独立的空间,以增强自底向上对齐框架,我们在五个基准数据集(RefCOC0、RefCOCO+.ReferItGame、RefCOCOg和Flick30K)上进行了实验,结果显示我们的方法相对于单阶段最先进(SOTA)方法分别提升了2.16%、4.47%、2.85%3.44% 和 2.91%,这验证了我们方法的有效性。

姓名:吕文禧
学校:中山大学
指导老师:苏勤亮
论文题目:Contamination-Resilient Anomaly Detection via Adversarial Learning onPartially-Observed Normal and Anomalous Data
论文简介:目前主流异常检测方法往往假设可以收集到大量纯净的正常样本训练检测模型,而实际应用中收集到的数据集往往可能包含部分“杂质”污染样本导致现有方法失效。本文针对这一问题,首次提出利用收集到的部分有标签的正常与异常样本,在对抗生成网络的框架下训练生成器从受污染的数据集中学习到“干净”的正常数据分布,从而抵抗污染并高效地完成异常检测任务。同时,我们还考虑到所收集的有标签样本数量可能非常稀少,导致对抗生成网络中的判别器出现严重的过拟合现象这一问题,创新性地提出了标签反转机制以有效缓解判别器的过拟合问题。我们在理论上严格证明了我们的方法在温和的条件下可以使生成器收敛于纯净的正常数据分布,提供了坚实的理论保证。我们将该方法应用于多个实际场景下的异常检测任务,(如:网络攻击检测,人体姿态检测,金融诈骗检测等),实验结果表明,当训练数据混入污染的情况下现有方法都出现大幅的性能下降而我们提出的方法仍能保持优秀的性能。这些实验结果证明了我们的方法可以有效抵抗数据集中污染数据的负面影响,扩宽了异常检测任务的应用场景,并且显著提升在实际场景中异常检测任务的性能。

姓名:徐常福
学校:北京师范大学-香港浸会大学联合国际学院
指导老师:王田
论文题目:Incorporating Startup Delay into Collaborative Edge Computing for Superior Task Efficiency
论文简介:本论文针对已有方法忽略服务启动时延的影响而导致总时延增加的问题,提出了一种将服务启动时延纳入协作移动边缘计算的在线联合服务部署和任务卸载方法,以及一种新颖的启动时延感知的在线联合服务部署和任务卸载算法。该算法对时延敏感的物联网应用执行在线联合服务部署和任务A2卸载。我们的理论分析证实了所提算法的几个关键性质,如实现了图片的竞争比率,表明相对于最优解决方案具有强大的性能。最后,通过实验证明了我们提出的方法比当前最好的方法大幅降低了任务卸载总时延且降低不少于 18.72%,同时确保了持续的长期系统稳定性。

姓名:杨宁滨
学校:广州大学
指导老师:唐春明
论文题目:RCME: A Reputation Incentive Committee Consensus-Based for MatchmakingEncryption in loT Healthcare
论文简介:本文提出了一个面向物联网医疗基于声誉激励共识委员会的匹配加密方案,它利用共识节点来消除双边密钥泄露问题,并基于设计的声誉激励机制快速提供许可证明。本文方案采用低消耗的无配对技术,在一个多方、非交互的无证书密码体系中实现轻量级匹配加密。此外,还设计了检测机制,防止未经授权用户获得数据。严格的安全性分析表明,该算法在随机预言机模型下实现了选择密文攻击的安全性。为了进一步将共识通信开销从O(n^2)降低到O(n),我们提出了一种优化的实用拜占庭容错(PBFT)共识,并采用声誉激励机制和门限加密技术来实现无偏选举。综合评估证实,本文方案在安全性和性能方面优于现有的方案。因此,本文方案是资源受限的物联网医疗设备的实用解决方案。

姓名:蒲韬
学校:中山大学
指导老师:林倞
论文题目:Spatial-Temporal Knowledge-Embedded Transformer for Video Scene GraphGeneration
论文简介:投稿论文致力于研究如何将场景中视觉关系的先验时空知识嵌入到模型中,以约束不同物体之间视觉关系的预测空间。为此,本文提出了时空知识嵌入的转换器模型,并应用于视频场景图生成问题。针对其中的视觉关系检测部分,本文利用统计方式从训练样本中获得视觉关系与物体类别的空间共现性以及不同视觉关系的时序转移关联性,并将这些知识嵌入到多头交叉注意力机制中,指导模型学习更具代表性的特征表达以及正则化预测空间。与现有方法相比,该模型可以更有效地利用场景中不同物体对之间的空间上下文信息,以及同一物体对的时序上下文信息。

姓名:党吉圣
学校:中山大学
指导老师:郑慧诚
论文题目:VideoSAM: Segment Anything in Videos
论文简介:近年来,视频分割技术在自动驾驶、视频监控和视频编辑等领域具有重要意义,其中目标跟踪与时序一致性是关键技术挑战。尽管图像级分割大模型(如 Segment Anything Model,SAM)在图像分割任务中表现优异,并具备较强的泛化能力,但其在一致性视频分割中的应用却鲜有探索,主要原因在于缺乏对时空动态的有效建模,导致视频帧间时间一致性较差和分割精度下降。为此,本文提出了一种统一的视频分割大模型—VideoSAM,通过扩展图像级基础大模型的能力,整合时空动态建模,支持多种视频分割任务。VideoSAM 引入了多分辨率时空记忆网络,将图像级分割预测结果编码并存储到时空记忆库中,以确保视频帧间的空间与时间一致性。同时,提出了多分辨率聚合读取策略,通过在多级时间窗口中聚合可靠记忆,加速网络计算,并捕获单一分辨率方法难以获取的细粒度多时间分辨率信息。实验结果表明,VideoSAM 在五种数据稀缺任务(包括大词汇量视频全景分割、开放世界视频分割、指代视频分割、半监督视频目标分割和无监督视频目标分割)中均实现了实时速度和精度的领先表现,并在 11 个数据集上超越了现有端到端方法和统一方法。尤其在低帧率稀疏视频处理方面,VideoSAM 展现了显著的鲁棒性,具有广泛的实际应用价值。VideoSAM 凭借卓越的时空一致性建模能力和多任务适应性,在自动驾驶、视频监控、影视制作、科学研究、工业检测等领域展现了广阔的应用前景。其技术可用于动态目标跟踪、异常行为检测、高效视频编辑、生物医学影像分析、无人机航拍视频处理等实际场景,尤其在低帧率视频中仍能保持精确的分割性能,满足从智能交通到虚拟现实等多样化需求。VideoSAM 为视频分割技术提供了一种高效、通用的解决方案,不仅推动了学术研究的进步,也为广泛的现实应用带来了新的可能性。


工程应用类·优秀论文简介

一等奖

姓名:毛钇骁
学校:南方医科大学
指导老师:张煜、宁振源
论文题目:Semantics and instance interactive learningfor labeling and segmentation of vertebrae in CT images
论文简介:在三维 CT 图像中,实现椎骨的自动标记与分割是一个复杂、且包含多个任务的问题。当前,常采用渐进式(即多阶段)的方法进行椎骨标记和语义分割,这通常包括两个独立的模型,忽略了不同任务之间的特征交互。尽管当前已经有研究采用多通道实例分割的方式来缓解这一问题,但其对语义信息的利用仍显不足。此外,实现准确模型的另一个挑战是如何有效区分高度相似的邻近椎骨,并建模它们的顺序属性。在本文中,我们提出了一种语义与实例交互学习(Semantics and Instance Interactive Learning,SIIL)的新范式,用于 CT 图像中椎骨的同步标记与分割。SIIL 建模语义特征学习与实例特征学习,其中前者提取脊柱的语义信息,后者区分不同的椎骨实例。两者进行特征交互,利用语义特征提高椎骨实例的可分性,利用实例特征学习椎骨的轮廓与位置信息。在此过程中,我们引入了形态学实例定位学习(Morphological Instance Localization Learning,MILL)模块,以对齐语义与实例特征并促进其交互。此外,我们设计了一个顺序对比原型学习(Ordinal Contrastive Prototype Learning,OCPL)模块,通过跨图像对比学习区分相似的邻近椎骨,并通过时序单元建模其顺序属性。在多个数据集上的广泛实验表明,我们的方法在椎骨的标记与分割任务上显著优于其他方法。我们的代码已公开,供同行参考审议。
本文主要贡献
1.我们引入了一种基于语义与实例交互学习的新范式,即SIIL,用于CT图像中椎骨的同步标记与分割。通过特征交互学习椎骨的轮廓与位置信息,并提高椎骨实例的可分性。
2.我们提出了MILL模块,以促进语义与实例特征的交互,该模块引入实例定位矩阵以过滤掉缺失的椎骨类别以减轻其干扰。
3.我们设计了OCPL模块,通过Bi-GRU建模实例特征的内在顺序关系,从而缓解邻近椎骨的高度相似性;同时,通过跨图像对比学习增强类间可分性与类内一致性。
我们进行了广泛的实验,验证了所提方法的有效性,并在三个公共数据集上取得了最佳性能。
研究成果已发表于 Medical Image Analysis (IF=10.7,Top期刊)

640 (27).png

二等奖

姓名:陈国昊
学校:华南理工大学
指导老师:谭明奎
论文题目:Cross-Device Collaborative Test-Time Adaptation
论文简介:现有深度学习依赖训练与测试数据独立同分布的假设,难以应对动态变化场景的未知数据分布偏移,易导致深度模型性能大幅下降。因此,如何在线适应测试数据,实现动态场景的稳定泛化,是深度模型在智慧城市、智慧交通等场景部署应用的关键前提。本文面向现实应用中大规模的模型部署场景,构建了面向多设备协同的高效在线适应框架,提出了重编程学习与免训练知识注入的协同适应策略,有效实现了多设备跨场景的知识累积、共享与动态利用,缓解了模型在线适应的灾难性遗忘难题,提升了动态适应的效率与性能,并使成本高昂的在线适应技术可应用于资源受限的边缘设备上。
技术路线与创新:所提方法构建了模型与知识解耦的在线适应范式。在保证通信效率与隐私安全的前提下,创新地将单设备独立的在线适应拓展到多设备协同的高效在线适应,实现了异构设备的跨场景协同在线学习,存在如下三个核心模式:
(1)无遗忘的持续学习模式:利用所提模型与知识解耦框架,构建知识库的动态知识保存机制,在各设备适应过程中逐步累积所学知识,缓解了在线适应的灾难性遗忘问题,并有效支撑了设备间的高效知识共享。对比现有在线适应技术,模型连续适应性能提升 3.5%;
(2)知识重编程的协同学习模式:提出知识重编程框架,引入了共享知识的自适应加权系数,从而将多设备的协同学习问题解耦为跨设备的知识复用与新知识的动态学习问题,并利用梯度反传加以求解。基于所提知识重编程的协同学习策略,在仅增加 2.7%额外计算开销的情况下,可将模型在线适应效率提升达 78 倍;
(3)免训练的模型适配模式:面向资源受限的边缘设备,提出仅前向计算的模型适配方法。利用跨设备的共享知识库,将模型在线优化问题转化为分布偏移检测和知识注入问题,实现了免训练的模型在线适配,在接近仅推理的计算效率下,有效将模型的域外准确率提升超 30%。相关技术具有较高灵活性与较低通信成本的特点,支持完全异步的协同学习,在 3 个设备、共计 200 万余张图像协同适应的条件下,单设备通信成本仅为 6MB。
应用前景:所提方法可广泛应用于边缘计算、物联网和分布式系统等领域,支持异构设备的跨场景协同在线学习,为大规模的模型在线适应提供高效、可扩展的解决方案,有助于提升深度模型在现实动态环境下在线适应的效率与性能。

姓名:钟育添
学校:南方医科大学
指导老师:戚力
论文题目:Spiral scanning and self-supervised image reconstruction enable ultra-sparsesampling multispectral photoacoustic tomography
论文简介:多光谱光声断层成像(PAT)是一种利用光声效应对内部组织进行无创、高对比度成像的成像模式,同时还能通过多光谱测量获得分子功能信息。然而,由多达数千个探测器组成的多光谱 PAT 系统的硬件成本和计算需求巨大。为了应对这一挑战,我们提出了一种用于多光谱 PAT的超稀疏螺旋采样策略,并将其命名为U3S-PAT。我们的策略采用了一个稀疏的环形传感器,在切换激发波长时,该传感器会同时旋转和平移。这就形成了多光谱角度交错采样的螺旋扫描模式。为了解决高度无条件的图像重建问题,我们提出了一种自监督学习方法,该方法能够引入螺旋扫描过程中共享的结构信息。我们在商用PAT系统上模拟了所提出的U3S-PAT 方法,并进行了体内动物实验来验证其性能。结果表明,即使稀疏采样率低至130,我们的U3S-PAT策略也能达到与非螺旋密集采样类似的重建和光谱解混合精度。鉴于我们的 U3S-PAT 策略能够显著缩短三维多光谱扫描所需的时间,因此有望对动态生物活动进行体积分子成像。

姓名:田惠琳
学校:中山大学
指导老师:孟静珂,郑伟诗
论文题目:Loc4Plan: Locating Before Planning for Outdoor Vision and LanguageNavigation
论文简介:本论文发表于ACM MM 2024,提出了一个名为Loc4Plan的创新性视觉语言导航框架。该框架的核心思想是"先定位,后规划",这一理念源自人类在现实场景中的导航行为。在户外视觉语言导航任务中,智能体需要理解自然语言指令并在视觉环境中找到正确的目的地。以往的研究主要关注语言与视觉输入的对应关系,却忽视了空间位置信息在导航过程中的关键作用。因此,本论文充分利用空间位置信息,创新性地引入了"街区"概念,即相邻路口之间的区域,并据此设计了街区感知空间定位模块和空间感知动作规划模块。这种设计使得智能体能够像人类一样,先确定自己在当前街区内的相对位置,再根据位置信息关联相应的导航指令并规划下一步动作。在Touchdown和map2seq这两个主流数据集的实验中,该方法显著优于现有最佳方法,特别是在未见场景中的表现提升更为显著。这项研究的重要意义在于首次系统地强调了空间定位在视觉语言导航中的关键作用,为相关研究开辟了新的方向。通过模仿人类导航行为来设计算法框架,使得模型能够在复杂的户外环境中更准确地理解和执行导航指令,这种方法不仅具有良好的理论价值,还可以灵活应用于自动驾驶、配送机器人等实际场景,具有广阔的应用前景。

姓名:莫宗鑫
学校:南方医科大学
指导老师:戚力
论文题目:lmage Reconstruction of Multispectral Sparse Sampling PhotoacousticTomography Based on Deep Algorithm Unrolling
论文简介:本文提出了一种基于深度算法展开(DAU)的稀疏采样光声层析成像(SS-PAT)图像重建方法,旨在解决传统SS-PAT成像中因探测器数量有限导致的图像重建质量下降的问题。通过将模型驱动方法与深度学习方法相结合,本文提出的DAU框架在保证重建精度的同时,能够高效地利用稀疏采样数据进行图像重建。通过引入基于 Plug-and-Play 交替方向乘子法(PnP-ADMM)的嵌套 DAU框架,进一步增强了图像重建过程中的结构先验约束,优化了重建效果。实验结果表明,所提出的方法在数值模拟、活体动物成像以及多光谱图像解混等任务中均优于现有的模型驱动方法和深度学习方法。
创新性
1. 基于深度算法展开(DAU)框架:本研究创新性地结合了模型驱动方法与深度学习方法,通过深度算法展开实现了稀疏采样光声层析成像图像的高质量重建,解决了传统方法中存在的图像重建病态问题。
2. 引入 PnP-ADMM 约束:在DAU框架中,嵌套式Plug-and-Play交替方向乘子法(PnP-ADMM)被引入以加强图像的结构先验约束,使得图像重建过程更加稳健,尤其在处理稀疏采样数据时,能够有效避免噪声干扰,提高重建精度。
3. 优异的实验结果:通过数值模拟、活体动物成像和多光谱解混实验,验证了所提出方法在图像质量和计算效率上的优势,表现出比现有技术更强的去噪和图像恢复能力。
应用前景
1. 医学成像领域:本方法的创新性使其在医学成像领域具有广泛应用前景,尤其是在小动物成像、肿瘤检测、血管成像等方面。其高效的图像重建能力将帮助医生获得更精确的诊断信息,推动早期疾病检测和治疗的进展。
2. 精准医疗与个性化治疗:通过提高光声成像系统的图像质量,所提方法为精准医疗提供了更强的技术支持。尤其在肿瘤监测、靶向药物输送等领域,可以更精确地监控药物在体内的分布和代谢过程,推动个性化治疗的发展。
3. 生物医学研究:该方法不仅适用于临床应用,也为生物医学研究提供了强有力的工具,尤其是在动物实验和疾病机制研究中,能够获得更为清晰的组织结构和功能信息。

姓名:邢漪乐
学校:香港城市大学
指导老师:张泽松
论文题目:Low-Complexity Chromatic Dispersion Compensation Using High-RadixFermat Number Transform
论文简介:随着先进技术的迅速发展,高容量、长距离和高速相干光通信系统得到了广泛应用。然而,色散补偿(Chromatic Dispersion, CD)是相干光通信系统面临的主要挑战之一,特别是其带来的高功耗问题,严重阻碍了技术的广泛部署。现有的CD均衡技术普遍采用基于快速傅里叶变换(FFT)的补偿方法,但其计算复杂度较高,占接收机总功耗的约 20%。本文通过引入基于FNT的高效变换域均衡方法,解决了现有相干光通信系统中色散补偿复杂度高、功耗大的难题,具有重要的学术价值与工程应用潜力。未来,该方法可应用于超高速、长距离光通信网络,助力实现更高效的下一代光通信系统。
创新点:针对上述问题,本文提出了一种基于费马数变换(Fermat Number Transform, FNT)的高效变换域均衡方法(DFNT-TrDE),并通过多项创新手段显著降低了CD补偿的计算复杂度,具体创新点如下:
●提出基于FNT的色散补偿新框架:
采用 FNT 结合 Diminished-1 表示,替代传统 FFT,实现了低复杂度的CD均衡。
●引入高基数(High-Radix, HR)费马数变换:
针对大长度变换,提出HR-FNT,进一步降低了计算复杂度。
通过对1D和2D圆周卷积的深入比较(包括R2和HR设计),在加法器级别量化了不同配置下的复杂度,为系统设计提供了理论依据。
●提供基数与维度选择的优化建议:
针对不同的变换长度,提出适配的基数和维度配置,有效平衡了计算复杂度与性能。
实验结果与性能优势:本文的实现结果显示,DFNT-TrDE相较于现有的基于 FFT的CD补偿方法,具有显著的复杂度优势:
●在相同误码率(BER)下:
b=8时,DFNT-TrDE相较于12比特的Split-radix FFT-FDE复杂度降低了 62%。
●在更低误码率下:
b=16时,DFNT-TrDE相较于16比特的Split-radix FFT-FDE复杂度降低了 51%。
这些结果表明,DFNT-TrDE不仅能够显著减少系统计算复杂度,还能在特定情况下获得更好的准确性。
应用前景:本文提出的 DFNT-TrDE 方法及其优化设计具有广泛的应用前景,尤其适用于下一代相干光通信系统:
●降低接收机功耗:
DFNT-TrDE大幅降低色散补偿模块的计算复杂度,从而减少接收机总功耗,为大规模部署高效相干光通信系统提供技术支撑。
●适配大规模传输系统:高基数和高维度FNT的设计使系统能够适配更大长度的变换需求,满足长距离和高容量通信系统的要求。
●硬件实现友好:FNT采用加法器和移位替代传统的乘法运算,有利于在硬件(如 FPGA/ASIC)上实现低功耗设计,进一步提升系统的能效比。

姓名:吴欣
学校:华南理工大学
指导老师:蔡毅
论文题目:Content-free Logical Modification of Large Language Model by Disentanglingand Modifying Logic Representation
论文简介:大型语言模(LLMs)在自然语言处理领域取得了显著进展。尽管经过大量数据集的训练并与人类价值观进行了对齐,LLMs 仍然可能产生存在谬误的输出,并且其输出的有效性在很大程度上依赖于内容。逻辑谬误可能导致错误信息的传播和决策过程的缺陷,因此确保LLMs 在不同语境下的逻辑一致性至关重要。本文受到认知心理学研究的启发,提出了一种逻辑控制框架(Logic Control Framework, LCF)。LCF 将 LLMs 的隐藏表示解耦为独立的内容空间和逻辑空间。在逻辑空间中,利用逻辑有效和无效的样本通过对比学习构建不同的区域。通过将逻辑表示移动到逻辑有效区域,并与未改变的内容表示融合,能够显著减少LLM 输出中的逻辑谬误,同时保持内容的连贯性。实验结果表明,在结论生成任务中,LCF使得生成的结论更加合理和准确;在谬误识别任务中,LLMs 结合 LCF 后能够更准确地识别逻辑谬误。LCF 在提高逻辑有效性和减少错误输出方面取得了显著的效果(10%-40%的提升)。该论文已发表于国际顶级人工智能学术会议(CCF-A 类推荐)AAAI 2025。

640 (28).png

创新点
1.前瞻性研究方向:论文关注自然语言生成领域的逻辑基础,聚焦自然语言处理中的逻辑推理问题,提出基于逻辑的生成模型。这是目前NLP领域较为少见的研究视角,填补了以LLM和逻辑结合的空白,尤其在面向复杂任务和高精度生成时具有较强的创新性。
2.跨学科创新:论文在自然语言生成中结合了认知心理学与逻辑学的研究成果,对LLM的内部表示进行了解耦,从而提高了机器理解和推理的能力。相较于传统的深度学习模型,具有更强的可解释性和推理透明性,这是目前NLP领域的一个前沿创新。
应用前景分析
1.实际应用价值:基于逻辑的自然语言生成方法可以提高机器翻译、智能问答、自动写作等领域的生成质量。逻辑推理能够带来更高的语义准确性和推理能力,特别是在需要深入理解和精准表达的领域(如法律、医疗、技术文档等)中,有广泛的应用潜力。
2.未来研究方向:论文的研究不仅将为大规模语言模型和符号推理系统的结合提供新的思路,也为探索人类智能与机器智能的深度融合提供了可能性。通过将逻辑推理与深度学习、大模型相结合,可以推动人工智能向更加智能、可解释且具备推理能力的方向发展,开辟出新的应用场景,也为人类与机器的协作提供了更广阔的前景。

此外,第四届大数据、信息与计算机网络学术会议(BDICN 2025)、第四届电子信息与通信工程学术会议(EICE 2025)通过论文评审以及现场口头汇报综合评选出“优秀论文”、“优秀青年学者报告”,为进一步增强评优工作的透明度,现将评优名单结果进行公示:

640 (29).png

优秀论文简介

汇报作者:邱隽森
论文作者:Sumera Hashim, 邱隽森,杨一晗,黄生祥,丁家峰,廖聪维,邓联文
学校:中南大学
指导老师:邓联文
论文题目:采用差分降噪技术的电容式触摸传感鲁棒模拟前端电路设计
论文简介:基于差分开关电容-电压(C/V)转换结构,提出了一种稳健的电容触摸屏模拟前端电路设计。该电路利用来自面板的两个伪差分信号将相邻通道的电容转换成电压信号。通过利用相邻检测通道中噪声的相似性并采用差分结构,该电路有效地消除了环境噪声,提高了信噪比(SNR)和线性度。提出的这种差分方法的SNR与传统电路相比提升了8.1 dB。
相关研究成果

640 (1).jpg
Figure 1. Fully Differential Opamp Design Structure of Proposed Circuit
640 (30).png
Figure 2. Schematic of Proposed analog front end with switched capacitance to voltage conversion technique(a), and (b) Timing Diagram with four touch sensing lines.
640 (31).png
Figure 3. Opamp Simulation Environment Setup
640 (32).png
Figure 4. (a) Gain and phase margin.(b)Noise analysis of fully differential Opamp

汇报作者:曾家鸿
论文作者:曾家鸿, 杜志国,吴志辉,林旭东,文斌
学校:华南农业大学
论文题目:A Classification method for Tealeaf disease based On MobileNetV2
论文简介:针对茶叶病害识别的传统方法费工费时,且不同种茶叶病害之间差异度较大,样本分布不均等问题,本研究为提高不同种茶叶病害识别的准确性,提出一种基于MobileNetV2的茶叶识别改进算法Tea-MobileNet。首先使用改进ECA注意力机制,加强对茶叶病害特征与纹理的信息提取;其次,提出多尺度特征融合模块,从而实现深层信息与浅层信息的融合;最后使用SoftPlus激活函数,有助于缓解在后续的训练过程中存在的梯度消失与梯度爆炸的问题。试验结果显示,该算法对茶叶病害的准确率达到了92.98%,精确率达到了93.08%,召回率达到了93.13%,F1分数达到了93.10%该算法有着优异的茶叶病害的分类有着优异的表现,为茶叶病害识别提供参考。

相关研究成果:
640 (2).jpg
Figure1. ECA Attention Mechanism Structure Picture

640 (33).png
Figure2. Multi-scale Feature Fusion Picture

640 (34).png
Figure3. Activation Function Comparison Picture

640 (35).png


优秀青年报告学者简介

汇报作者:黄芷璇
论文作者:黄芷璇, 蔡亚莉, 李小勇, 杜雪涛, 张晨
单位:中国移动通信集团设计院有限公司,北京邮电大学
论文题目:A CNN+LSTM Based Deep Learning Approach with Lagrange Interpolation for Network Intrusion Detection
论文简介:随着5G技术的发展,互联网流量急剧增长,给网络安全带来了严峻的挑战。考虑到网络流量具有时间相关性,可以将其作为识别网络攻击的基础。本文提出了一种网络流量插值与入侵检测联合框架。首先,通过利用历史网络流量数据,可以获得流量特征,从而实现对网络攻击的预防。为了在等时间间隔内获取网络特征,引入了拉格朗日插值法。其次,提出了一种结合卷积神经网络(CNN)和长短期记忆网络(LSTM)的深度学习算法,从网络流量中提取时空特征,区分正常和异常的网络活动。基于真实网络流量数据集的实验结果显示,使用CNN和LSTM进行入侵检测的准确率可以达到90%以上,表明该方案能够实现可靠的入侵检测,以防御网络攻击。
相关研究成果

640 (36).png
图1 CNN-LSTM网络架构

640 (37).png
图2 拉格朗日差值结果示意图
640 (38).png
图3 不同检测算法对比

汇报作者:林秋婷
论文作者:林秋婷,黄耀辉,谭君广,徐斌
单位:中国机械科学研究总院,机科发展科技股份有限公司
指导老师:谭君广
论文题目:Overview of Research Methods for Recognition and Localization of Logistics Pallets Based on AGV
论文简介:自动引导车(AGV)在仓储物流领域的重要性日益增加,托盘识别与定位技术是其核心功能之一。本文综述了AGV技术的发展和托盘识别定位的研究进展,深入讨论了基于传感器和基于视觉处理两种主流方向的关键技术,包括激光雷达定位、射频识别(RFID)、传统图像处理、深度学习目标检测算法、3D点云数据处理算法以及融合技术等,并对比分析了各自的优势和局限,总结技术融合的现状和挑战,展望了未来趋势。旨在为物流托盘识别与定位领域的实际应用提供指导。
相关研究成果

640 (39).png
640 (42).png
Figure 1. Classification of Mainstream Key Technologies

640 (40).png
Figure2. RFID Working Principle
640 (41).png
Figure3. Development History of Deep Learning-Based Object Detection Algorithms for Logistics pallets


AEIC官网-版尾.bmp


相关阅读
2021年11月精品学术会议一览
2021-12-13
中国航天日暨首届湾区商业航天发展高峰论坛顺利召开
2022-05-30
第七届机电控制技术与交通运输国际学术会议(ICECTT 2022),线上会议圆满落幕!
2022-05-30
第六届现代机械制造与材料工程国际学术会议(IC4ME 2021)圆满落幕!
2021-12-15
第三届机械工程与智能制造国际学术会议(MEIM 2022),会议圆满落幕!
2022-06-15
2021年智慧交通与城市工程国际学术会议圆满落幕!
2021-12-13
第六届土木建筑与结构工程国际学术会议(ICCASE 2022)圆满落幕!
2022-05-26
2021年10月精品学术会议一览
2021-12-13
“欧亚经济论坛——2021丝绸之路国际创新设计周”分论坛之一第二届智能设计国际会议”成功举办
2021-12-13
兰州交大举办2021年度国自然科学基金委-电气工程基金项目研讨会
2021-12-02
阵容强大!两场计算机领域国际会议同期顺利召开,长春理工大学、粤港澳大湾区(广东)人才港联合主办
2022-05-26
第三届IEEE地质、测绘与遥感国际学术会议  (IEEE-ICGMRS 2022)圆满落幕!
2022-05-26
第二届国际青年学者高峰论坛在西安石油大学圆满落幕
2021-10-19
2022年地理信息与遥感技术国际学术会议(GIRST 2022)顺利召开,圆满落幕!
2022-09-21
2021年9月精品学术会议一览
2021-10-08
第三届机器学习与计算机应用国际学术会议(ICMLCA 2022)圆满落幕!
2022-12-29
第二届IEEE电气工程与控制科学国际学术会议 (IC2ECS 2022) 顺利召开,会议圆满落幕!
2022-12-29
第六届交通工程与运输系统国际学术会议(ICTETS 2022)于线上顺利召开,圆满落幕!
2022-09-27
大咖云集,嘉宾汇聚!第四届电力电子与控制工程国际学术研讨会圆满落幕
2021-09-23
【河海大学主办】第三届机器人与智能制造技术国际会议(ISRIMT 2021)圆满落幕
2021-09-28