[论文解读] FastText.zip: Compressing text classification models
本文提出 FastText.zip,一种通过使用判别性剪枝和微调的乘积量化(PQ)方法压缩文本分类模型,实现高达 1,000 倍的模型尺寸缩减,同时保持极小的准确率损失。该方法实现了最先进的内存-准确率权衡,使模型大小低于 100kB,同时在标准基准测试中保持高性能。
Online communities can be used to promote destructive behaviours, as in pro-Eating Disorder (ED) communities. Research needs annotated data to study these phenomena. Even though many platforms have already moderated this type of content, Twitter has not, and it can still be used for research purposes. In this paper, we unveiled emojis, words, and uncommon linguistic patterns within the ED Twitter community by using the Correlation Explanation (CorEx) algorithm on unstructured and non-annotated data to retrieve the topics. Then we annotated the dataset following these topics. We analysed then the use of CorEx and Word Mover’s Distance to retrieve automatically similar new sentences and augment the annotated dataset.
研究动机与目标
- 解决在内存受限设备(如智能手机)上部署高精度文本分类器的挑战。
- 在不牺牲分类准确率的前提下,减少文本分类模型(尤其是词嵌入)的内存占用。
- 探索受哈希和量化启发的压缩技术,实现在保持性能的同时实现极端模型压缩。
- 为高效文本分类模型提供一个实用且可复现的基线,专为内存-准确率权衡进行优化。
- 扩展 fastText 库,新增一个压缩流水线,支持在真实部署中实现紧凑、快速且高精度的模型。
提出的方法
- 应用优化的乘积量化(OPQ)将词嵌入和输出嵌入压缩为紧凑编码,实现高达 1,000 倍的内存使用减少。
- 基于嵌入范数的判别性剪枝用于移除低影响特征,提升压缩效率和覆盖度。
- 引入两阶段微调策略:首先量化输入嵌入,然后微调输出分类器以恢复准确率。
- 采用幅度/方向向量参数化,实现对单位范数向量的高效量化,兼容 PQ 和基于 LSH 的方法。
- 使用分层 Softmax 和 n-gram 特征哈希,以减少词典大小的同时保持模型表达能力。
- 结合特征剪枝、量化和微调,在极端压缩下最小化准确率下降,尤其在 64KiB 和 32KiB 模型尺寸下表现优异。
实验结果
研究问题
- RQ1乘积量化能否适配于文本分类模型,实现在几乎不损失准确率的前提下实现极端压缩?
- RQ2基于嵌入范数的判别性剪枝与基于熵的剪枝相比,在覆盖度和性能方面表现如何?
- RQ3对输入和输出权重矩阵同时进行量化,对模型准确率和内存使用有何影响?
- RQ4模型尺寸能在多大程度上被缩减(例如,低于 64KiB)同时保持可接受的分类准确率?
- RQ5量化后的微调是否能有效恢复因压缩导致的性能损失?
主要发现
- FastText.zip 相较于标准 fastText,将模型尺寸最大缩减 1,000 倍,在常见基准测试中实现小于 100kB 的模型。
- 在 64KiB 时,模型准确率仅下降 0.8%;在 32KiB 时,下降 1.7%,表明对极端压缩具有强鲁棒性。
- 使用 OPQ 对输入和输出矩阵同时量化,在 FlickrTag 数据集上性能仅比完整模型低 0.2%。
- 基于范数的剪枝在覆盖度和准确率方面优于基于熵的剪枝,尤其在结合最大覆盖剪枝启发式方法时表现更优。
- 该方法实现了最先进的内存-准确率权衡,在内存效率方面优于标准 fastText 和字符级 CNN。
- 量化后的微调显著提升性能,尤其在结合剪枝时,可在极小尺寸下实现高准确率模型。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。