QUICK REVIEW

[论文解读] Deep Symbolic Regression for Recurrent Sequences

Stéphane d’Ascoli, Pierre-Alexandre Kamienny|arXiv (Cornell University)|Jan 12, 2022

Evolutionary Algorithms and Applications被引用 26

一句话总结

本文训练 Transformer 模型从序列的前几项（整数和浮点数）推断递推关系，在 OEIS 和未在词汇表中的常量上进行评估，以展示符号回归相对于纯数值外推的优势。

ABSTRACT

Symbolic regression, i.e. predicting a function from the observation of its values, is well-known to be a challenging task. In this paper, we train Transformers to infer the function or recurrence relation underlying sequences of integers or floats, a typical task in human IQ tests which has hardly been tackled in the machine learning literature. We evaluate our integer model on a subset of OEIS sequences, and show that it outperforms built-in Mathematica functions for recurrence prediction. We also demonstrate that our float model is able to yield informative approximations of out-of-vocabulary functions and constants, e.g. $\operatorname{bessel0}(x)\approx \frac{\sin(x)+\cos(x)}{\sqrt{πx}}$ and $1.644934\approx π^2/6$. An interactive demonstration of our models is provided at https://symbolicregression.metademolab.com.

研究动机与目标

激励从序列（包括整数和浮点数）中推断递推关系的挑战。
开发基于 Transformer 的模型，进行递归表达式的符号和数值回归。
创建可控递推深度和运算符集合的合成数据生成流程。
在域内和域外对比基线进行评估。
展示用学习到的词汇来近似域外常量和函数的能力。

提出的方法

使用 8 层 Transformer 编码器-解码器，512 维嵌入，将序列映射为递推表达式或下一个项序列。
使用 base-b 整数编码和 base-10 浮点符号，将序列和候选表达式表示为标记序列，并对树进行前缀（波兰）编码。
使用交叉熵损失和 Adam 优化器训练，配合热身计划和平方根反比衰减。
通过随机构造一元二元运算符树来生成训练数据，采样叶节点（常数、下标或前项），并产生长度不超过 l 的序列。
用束搜索（大小为 10）评估假设，并通过预测的递推关系再现初始项的能力进行再排序。
将符号回归（递推推断）与数值回归（直接预测下一个项）进行比较，在域内和域外数据上进行测试。

实验结果

研究问题

RQ1变压器是否能够从观测到的序列项（整数和浮点设置）推断递推关系？
RQ2在递归序列上，符号模型的外推是否比数值模型更高精度？
RQ3学得的模型对域外序列（如某些 OEIS 条目或未在词汇表中的常量和运算符）有多大泛化能力？
RQ4在此设置中，符号递推推断的局限性和失败模式是什么？
RQ5模型如何处理域内与域外序列，它们的性能受哪些因素影响（运算符数量、递推度、序列长度）？

主要发现

符号模型在域内达到高准确性，且在外推时通常比数值模型具有更高的精度。
在整数序列上，符号模型在 n_op<=5 时达到 92.7% 的准确率，数值预测为 83.6%，在指定设置中；浮点模型在 n_op<=5 时达到 74.2% 的符号准确性和 45.6% 的数值准确性。
整数 OEIS 子集评估显示，符号模型能够为若干序列检索到有效的递推关系，优于报告设置中的 Mathematica FindSequenceFunction 与 FindLinearRecurrence。
浮点模型展示了近似域外常量和函数的能力，给出渐近或精确表达式（如 Bessel j0 的渐近），以及对 pi^2/6 等常量的接近近似。
域外实验表明模型可以泛化到未见过的递推和未在词汇表中的标记，尽管难度和运算符多样性增加时性能下降。
消融分析表明，随着运算符增多、递推度提升和输入长度缩短，准确性下降，符号模型在更长的预测 horizon 上表现出更强的鲁棒性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。