[论文解读] Biologically Plausible Learning of Text Representation with Spiking Neural Networks
本文提出了一种生物上合理的脉冲神经网络(SNN)框架,通过无监督脉冲时间依赖可塑性(STDP)学习,实现低维脉冲基文本表征的训练。该方法将文本转化为脉冲列,训练SNN编码器以生成紧凑且具有判别性的表征,在20 newsgroups bydate数据集上达到80.19%的准确率,优于现有使用低维输出的浅层方法。
This study proposes a novel biologically plausible mechanism for generating low-dimensional spike-based text representation. First, we demonstrate how to transform documents into series of spikes spike trains which are subsequently used as input in the training process of a spiking neural network (SNN). The network is composed of biologically plausible elements, and trained according to the unsupervised Hebbian learning rule, Spike-Timing-Dependent Plasticity (STDP). After training, the SNN can be used to generate low-dimensional spike-based text representation suitable for text/document classification. Empirical results demonstrate that the generated text representation may be effectively used in text classification leading to an accuracy of $80.19\%$ on the bydate version of the 20 newsgroups data set, which is a leading result amongst approaches that rely on low-dimensional text representations.
研究动机与目标
- 开发一种基于脉冲神经网络的生物合理方法,用于学习低维脉冲基文本表征。
- 通过将高维文本数据转换为脉冲列并训练SNN编码器实现降维,以应对高维文本数据的挑战。
- 评估网络架构、抑制机制及突触剪枝对表征质量和分类性能的影响。
- 为未来在自然语言处理中构建深层SNN架构奠定基础。
提出的方法
- 使用基于词频的稀疏固定频率编码方案,将文本文档转换为脉冲列。
- 采用包含兴奋性与抑制性神经元的脉冲神经网络(SNN),通过无监督脉冲时间依赖可塑性(STDP)进行训练,以学习低维表征。
- SNN编码器生成一种紧凑的低维脉冲基输出表征,适用于下游分类任务。
- 网络采用突触权重衰减和自适应抑制机制,以稳定学习过程并提升表征质量。
- 训练后,剪除权重最低的连接以评估模型的鲁棒性与计算效率。
- 在SNN最终输出上应用线性分类器(逻辑回归)进行文档分类。
实验结果
研究问题
- RQ1基于无监督STDP学习,一种生物合理的SNN能否从原始文本输入中学习到有意义的低维脉冲基表征?
- RQ2抑制机制的引入在多大程度上影响了所学文本表征的质量?
- RQ3在不降低分类性能的前提下,突触连接可被剪除到何种程度?
- RQ4SNN编码器的规模在多大程度上影响最终文本表征的准确性?
- RQ5与现有产生低维文本表征的浅层模型相比,该方法表现如何?
主要发现
- 所提出的基于SNN的文本表征在20 newsgroups bydate数据集上实现了80.19%的分类准确率,成为使用低维输出的浅层模型中的新SOTA。
- 在评估过程中禁用抑制机制显著提升了分类性能,表明抑制可能在推理阶段阻碍表征学习。
- 剪除高达90%的最弱突触连接对准确率无负面影响,表明所学表征具有高度冗余性和鲁棒性。
- 最佳性能出现在2,200个神经元的SNN编码器与90%剪枝组合下,即使在激进剪枝后准确率仍保持在77.5%以上。
- 较小的SNN(少于1,100个神经元)在规模增加时表现出快速的准确率提升,而更大的网络则改善速度变缓,表明性能扩展存在饱和点。
- 该方法成功将输入维度从约130,000(词汇量)降低至550至2,200个神经元,展示了强大的降维能力,同时保留了判别力。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。