ACM MM 2025 | 从EEG信号到注意力解码：DHGCN用双超图卷积网络开创AAD新范式

在嘈杂的鸡尾酒会上，人类能轻易锁定目标对话，而传统助听器却难以做到。近年来，基于脑电图（EEG）的听觉注意力检测（AAD）技术为智能助听器带来新希望。今天要介绍的DHGCN模型，通过创新的双超图卷积网络设计，在0.1秒的短决策窗口下实现了96%的检测精度，参数数量比现有模型减少50%，为实时神经导向助听器研发奠定了关键基础。

论文信息

题目：DHGCN: Dual HyperGraph Convolutional Network for EEG-Based Auditory Attention Detection

基于脑电图的听觉注意力检测的双超图卷积网络

作者：Jian Zhou、Yingjie Xie、Cunhang Fan、Huabin Wang、Zhao Lv、Liang Tao

源码：https://github.com/nobody1219/DHGCN.git

为什么传统方法难以突破？

EEG信号蕴含着大脑处理听觉信息的秘密，但它的特殊性让建模成为难题：

时空耦合性：神经活动同时具有毫秒级时间动态和复杂空间分布特征
高阶关联性：不同脑区之间存在长距离协同作用，非简单成对关系
实时性要求：实用化设备需要在0.1-2秒内快速决策，传统模型难以兼顾速度与精度

现有方法存在明显局限：CNN难以捕捉非欧几里得空间结构，LSTM对长程时间依赖建模不足，普通图神经网络（GNN）只能处理成对关系，无法表达多节点间的高阶交互。

DHGCN的三大核心创新

双分支架构：时空特征并行学习

DHGCN最突出的设计是时间-空间双分支并行架构，彻底改变了传统模型串行处理时空特征的模式。

DHGCN总体结构图

时间分支：专注捕捉EEG信号随时间的动态变化，揭示神经活动的时序模式
空间分支：专门学习不同电极通道间的空间关联，反映大脑区域的协同工作机制
并行设计：两个分支独立运算又相互补充，避免了特征学习中的信息损耗

这种设计就像同时从两个视角观察大脑活动：一个追踪神经信号的”时间轨迹”，一个绘制脑区互动的”空间地图”。

超图建模：突破成对关系限制

为了表达EEG中复杂的高阶关系，DHGCN创新性地构建了两种超图结构：

时间超图：

将每个时间点视为节点，通过欧氏距离找到最相似的K个时间邻居
形成包含K+1个节点的超边，捕捉时间序列中的局部高阶结构
最终构建出能够表达多时间点关联的网络结构

空间超图：

把每个EEG通道作为节点，计算通道间信号相似度
为每个通道匹配最相似的K个邻居形成超边
有效建模不同脑区之间的跨区域协同关系

超图的优势在于：传统图的边只能连接两个节点，而超边可以同时连接多个节点，完美契合大脑中”多区域协同处理听觉信息”的神经机制。

轻量高效：参数减半性能反升

通过精心设计的超图卷积块（HGCB），DHGCN在大幅削减参数的同时实现了性能提升：

每个卷积块包含超图卷积层和前馈网络，配合残差连接和层归一化
0.1秒决策窗口下仅需4万可训练参数，是现有SOTA模型的50%
保持高精度的同时，可在低功耗设备上运行，满足实时应用需求

实验结果：全面超越现有方法

在两个权威数据集上的测试证明了DHGCN的优越性：

精度领先

数据集	决策窗口	现有SOTA	DHGCN	提升幅度
MM-AAD（视听）	0.1秒	92.6%	96.0%	3.6%
MM-AAD（纯音频）	0.1秒	91.5%	94.5%	3.3%
DTU	0.1秒	68.2%	72.5%	4.3%

尤其在最具挑战性的0.1秒短窗口下，DHGCN的优势更为明显，这对实时应用至关重要。

消融实验验证核心组件价值

消融实验结果

对比实验显示：

移除时间分支导致精度下降0.5%-2.8%
移除空间分支导致精度下降0.2%-0.7%
将超图替换为普通GCN/Conv1d，性能显著下降

这充分证明了双分支设计和超图建模的必要性。

效率优势显著

模型参数对比

与代表性模型相比：

比SSF-CNN少104倍参数
比MBSSFCC少2096倍参数
比DBPNet少21倍参数

这种极致的轻量化设计，使DHGCN有望部署在助听器等便携设备上。

未来展望

DHGCN的突破为听觉注意力检测开辟了新方向。未来研究可聚焦于：

进一步优化低延迟场景下的性能
探索多模态信息融合（如结合视觉线索）
提升模型在嘈杂环境中的鲁棒性

这项研究不仅推动了AAD技术的发展，其双超图建模思路也为其他脑电信号分析任务提供了宝贵借鉴。相信在不久的将来，基于此类技术的智能助听器将帮助听障人士重获清晰的”听觉焦点”。

原文链接

https://mp.weixin.qq.com/s/qVBTBCMSL_SxQXRCTI7rFA