Skip to main content
QUICK REVIEW

[论文解读] Biobjective Performance Assessment with the COCO Platform

Dimo Brockhoff, Tea Tušar|arXiv (Cornell University)|May 5, 2016
Advanced Multi-Objective Optimization Algorithms参考文献 14被引用 26
一句话总结

本文在 COCO 平台中引入了一种基于超体积的质量指标的双目标性能评估框架,用于衡量算法达到预设目标超体积值所需的运行时间。通过整合多个多目标算法的非支配解,建立参考超体积,即使真实帕累托前沿未知,也能实现对双目标优化器的一致、可复现的基准测试。

ABSTRACT

This document details the rationales behind assessing the performance of numerical black-box optimizers on multi-objective problems within the COCO platform and in particular on the biobjective test suite bbob-biobj. The evaluation is based on a hypervolume of all non-dominated solutions in the archive of candidate solutions and measures the runtime until the hypervolume value succeeds prescribed target values.

研究动机与目标

  • 在 COCO 平台中开发一种标准化、可复现的双目标优化算法性能评估框架。
  • 将运行时间定义为达到预设超体积目标值所需的函数评估次数,从而实现不同算法之间的比较。
  • 通过整合多个算法的非支配解,建立参考超体积值,因为大多数 bbob-biobj 问题的真实帕累托集未知。
  • 通过存储每次算法运行的所有非支配解,支持未来对性能指标的重新计算。
  • 通过一致的指标计算,实现对多个问题实例的算法性能泛化与验证。

提出的方法

  • 所使用的质量指标是外部档案中非支配解的超体积,以劣化点作为参考点。
  • 通过仿射变换计算归一化的超体积指标,将理想点映射到 (0,0),劣化点映射到 (1,1)。
  • 性能测量的目标值定义为一组精度水平,包括负值,以允许超越参考超体积。
  • 参考超体积通过整合多个算法(包括 NSGA-II、SMS-EMOA、MOEA/D、RM-MEDA、MO-CMA-ES 和在标量化问题上的 CMA-ES)的非支配解来近似。
  • 将每次算法运行的所有非支配解存储下来,以支持未来参考集的更新和性能指标的重新计算。
  • 性能数据通过唯一标识符进行版本控制,并通过 COCO 平台的 GitHub 仓库与参考超体积值关联。

实验结果

研究问题

  • RQ1当真实帕累托前沿未知时,如何实现双目标优化算法的一致且可复现的性能评估?
  • RQ2在双目标优化中,衡量算法进展的有效且稳定的质量指标是什么?
  • RQ3应如何定义目标值,以实现不同算法之间运行时间性能的有意义比较?
  • RQ4在缺乏解析帕累托集解的情况下,如何可靠地近似参考超体积值?
  • RQ5如何在不使先前基准结果失效的前提下,集成对参考集的未来改进?

主要发现

  • COCO 平台使用外部档案的超体积指标作为双目标优化的主要质量度量,运行时间定义为达到目标值所需的函数评估次数。
  • 目标值定义为一系列精度水平,包括负值,以允许超越参考超体积,运行时间以经验累积分布函数形式报告。
  • 参考超体积由整合多个算法(包括 NSGA-II、SMS-EMOA、MOEA/D、RM-MEDA、MO-CMA-ES 和在标量化问题上的 CMA-ES)的非支配解形成的非支配参考集计算得出。
  • 通过持续整合每次算法运行的非支配解,参考集不断得到改进,从而支持未来性能指标的重新计算。
  • 性能数据已进行版本控制,并与所使用的特定参考超体积值关联,确保通过 COCO 平台 GitHub 仓库实现可复现性和可追溯性。
  • 该方法即使在真实帕累托前沿无法通过解析方式获得的情况下,也能实现对双目标优化器的一致、可扩展且可延伸的基准测试。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。