Skip to main content
QUICK REVIEW

[论文解读] A survey and taxonomy of loss functions in machine learning

Lorenzo Ciampiconi, Adam Elwood|arXiv (Cornell University)|Jan 13, 2023
Machine Learning and Data Classification被引用 24
一句话总结

本文对分类、回归、排序、生成建模和基于能量的建模等领域的33种损失函数进行了综述,并提出一个将它们按任务、学习范式和基本原理进行组织的分类法。

ABSTRACT

Most state-of-the-art machine learning techniques revolve around the optimisation of loss functions. Defining appropriate loss functions is therefore critical to successfully solving problems in this field. In this survey, we present a comprehensive overview of the most widely used loss functions across key applications, including regression, classification, generative modeling, ranking, and energy-based modeling. We introduce 43 distinct loss functions, structured within an intuitive taxonomy that clarifies their theoretical foundations, properties, and optimal application contexts. This survey is intended as a resource for undergraduate, graduate, and Ph.D. students, as well as researchers seeking a deeper understanding of loss functions.

研究动机与目标

  • 提供机器学习中使用的损失函数的统一分类法。
  • 编制并正式定义33种广泛使用的损失函数。
  • 在不同任务中解释每种损失的适用性、优点和缺点。
  • 为初学者和高级从业者提供一个选择合适损失函数的参考。

提出的方法

  • 以数学方式定义损失函数,并将其聚合在一个统一框架下。
  • 提出一个分类法,将损失按任务(回归、分类、排序、生成、基于能量)以及学习范式(从有监督到无监督)和策略(概率、基于边际、基于误差)进行分类。
  • 将正则化描述为损失增强,并比较常见范数(L1 与 L2)。
  • 为回归、分类、生成建模、排序以及基于能量的损失提供正式定义和典型应用的详细章节。

实验结果

研究问题

  • RQ1在主要的机器学习任务中最常用的损失函数有哪些,以及如何进行系统化分类?
  • RQ2在不同问题情境中每种损失的理论权衡和实际考虑(优点/缺点)是什么?
  • RQ3如何用一个连贯的分类法帮助从业者为新问题选择合适的损失?
  • RQ4正则化和优化策略如何与不同的损失家族相互作用?

主要发现

  • 作者在五大任务类别中识别并组织了33个广泛使用的损失函数。
  • 他们提出一个结构化的分类法,将损失函数与任务类型、学习范式及潜在的优化策略联系起来。
  • 本文提供正式定义、理论支撑以及在何时使用每种损失的实际指南。
  • 通过损失增强的正则化(L1/L2)被系统化为适用于多种损失的通用方法。
  • 该综述强调损失设计与优化方法之间的相互作用,包括基于梯度和无导数的技术。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。