QUICK REVIEW

[论文解读] Gigamachine: incremental machine learning on desktop computers

Eray Özkural|arXiv (Cornell University)|Sep 8, 2017

Numerical Methods and Algorithms被引用 2

一句话总结

本文提出 Gigamachine，一个基于 R5RS Scheme 作为通用参考机器、并使用随机上下文无关语法（SCFG）引导 Levin 搜索的桌面计算机增量机器学习原型。该系统引入了四种更新算法（其中两种已实现），通过调整生成概率、重用解决方案和发现编程惯用模式来提高学习效率，实验表明在玩具问题上搜索时间与错误率均有所降低。

ABSTRACT

We present a concrete design for Solomonoff's incremental machine learning system suitable for desktop computers. We use R5RS Scheme and its standard library with a few omissions as the reference machine. We introduce a Levin Search variant based on a stochastic Context Free Grammar together with new update algorithms that use the same grammar as a guiding probability distribution for incremental machine learning. The updates include adjusting production probabilities, re-using previous solutions, learning programming idioms and discovery of frequent subprograms. The issues of extending the a priori probability distribution and bootstrapping are discussed. We have implemented a good portion of the proposed algorithms. Experiments with toy problems show that the update algorithms work as expected.

研究动机与目标

设计一个适用于桌面环境的实用系统，以实现 Solomonoff 的增量机器学习框架。
解决在通用编程环境中高效生成程序与学习的挑战。
开发可实现从训练序列中学习的更新算法，通过重用解决方案与发现常见子程序。
评估使用高级语言（如 Scheme）在通用硬件上实现类 AGI 学习的可行性。

提出的方法

使用 R5RS Scheme 作为参考通用机器，仅省略极少语法以简化基于语法的程序生成。
采用随机上下文无关语法（SCFG）引导 Levin 搜索，为程序候选者分配先验概率。
应用最左推导并设置概率时间窗，以限制深度优先搜索，提升效率。
引入四种更新算法：生成概率调整、解决方案重用、惯用模式发现与频繁子程序检测。
采用最佳优先与内存感知的混合搜索策略，以优化搜索性能。
实现一种改进的 LSEARCH 算法，结合 SCFG 引导搜索与每次问题求解后的增量更新。

实验结果

研究问题

RQ1随机 CFG 是否能有效引导通用语言（如 Scheme）中的增量程序搜索？
RQ2如何更新生成概率以随时间提升学习效率？
RQ3先前找到的解决方案在多大程度上可被重用以加速新问题的学习？
RQ4系统能否在无显式指定的情况下发现常见编程惯用模式与子程序？
RQ5系统性能在日益复杂的训练序列中如何扩展？

主要发现

所实现的更新算法在增量问题中成功降低了搜索时间与错误率，错误率从 97% 降至 88%。
在重用先前学习的解决方案后，平方函数仅用 210 次尝试即被找到，相比初始搜索速度提升了约 100 倍。
与函数需要 8,413,333 次尝试相比，后续的或非函数仅需 4,275,820 次尝试，表明学习带来的约 30 倍速度提升。
阶乘函数虽耗时超过一天才达到第五个示例，但仍生成了部分解决方案，表明系统具备学习复杂递归模式的能力。
系统在后期问题中表现出性能提升，表明通过语法更新实现了有效的学习与适应。
重用先前解决方案显著加速了学习过程，例如 pow4 函数利用 sqr 解决方案，其求解速度甚至快于 sqr 本身。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。