当前位置：主页 > 学术动态 >

AB-GEP：用于符号回归的对抗赌臂机基因表达式编程

点击数: 更新日期: 2022-12-06

中文题目：AB-GEP：用于符号回归的对抗赌臂机基因表达式编程

论文题目：AB-GEP: Adversarial bandit gene expression programming for symbolic regression

录用期刊：Swarm and Evolutionary Computation（JCR Q1，Top）

原文DOI：https://10.1016/j.swevo.2022.101197

录用时间：2022-10-27

作者列表：

1）鲁强，中国石油大学（北京），信息科学与工程学院

2）徐聪文，中国石油大学（北京），人工智能学院硕士19级

3）Jake Luo, University of Wisconsin, Milwaukee, College of Health Sciences, Associate Professor

4）王智广，中国石油大学（北京），信息科学与工程学院

背景与动机:

基因表达式编程 (GEP) 是解决符号回归 (SR) 问题的常用方法。然而，GEP 经常陷入局部最优。 GEP 是随机搜索结果，并可能重新访问低价值搜索空间，这会影响其性能。为了克服这两个问题，我们提出了一种使用对抗赌臂机来增强 GEP 的新算法--AB-GEP。 AB-GEP 将数学表达式空间分割成许多子空间。然后，它利用一种新的搜索空间选择方法 AvgExp3 来增强子空间之间选择与跳跃，这可以防止算法陷入局部最优。 AvgExp3 通过搜索空间中产生的奖励来动态估计子空间。动态奖励估计使 AB-GEP 更能适应奖励变化，也为AB-GEP 选择可以包含正确结果的子空间提供了方向的指导。

本研究证明 AvgExp3 是对子空间平均奖励的无偏估计，其方差低于标准 Exp3 方法。在两个基准数据集的评估表明，与GEP、SL-GEP 和 SPJ-GEP 三种传统 GEP算法相比， AB-GEP可以保持更好的种群多样性，并获得更好的结果。 AB-GEP 在 32 个基准测试中的 50% 中排名第一，而传统 GEPs 仅获得不超过 20% 的最佳结果。

图1 AB-GEP 框架

设计与实现：

AB-GEP将整个数学空间划分为多个子空间进行探索。这可以防止搜索过程陷入局部最优。原因是该算法可以通过个体跳跃过程逃离局部最优，因为个体在子空间之间跳跃可以给个体的基因型带来重大变化，并鼓励探索。此外，这些划分的子空间允许AB-GEP获取关于每个个体近似位置的信息，因为每个个体必须属于子空间。

2.1 AB-GEP

在AB-GEP中，数学表达式空间被划分为许多子空间。从这些子空间中，符号回归 (SR) 发现适合给定数据集的最佳数学表达式。在这种情况下，SR 面临与对抗多臂赌博机相同的问题——如何在不假设赌臂（子空间）奖励值分布的情况下估计每个赌臂（子空间）的期望奖励值，以及如何在子空间探索和利用之间取得平衡并最大化奖励（最好的数学表达式）。因此，对抗多臂赌博机问题和SR子空间评估问题的相似性，我们提出将对抗多臂赌博机方法与基因表达编程（GEP）相结合来解决SR问题，因此将该算法命名为 AB-GEP。

AB-GEP 遵循以下总体步骤：（1）它将数学表达式空间划分为k个子空间； (2) 初始化每个子空间的平均奖励； (3) 计算学习率； (4) AB-GEP在每一代中都利用修改后的Exp3-AvgExp3来选择一个子空间进行探索； (5) AB-GEP 使种群从当前子空间跳转到子空间ωi； (6) AB-GEP利用交叉和变异在子空间ωi中搜索（利用）； (7) AB-GEP 更新每个子空间的平均估计奖励。

2.2 选择子空间

AB-GEP根据在子空间ωi中个体的适应度值，来评估子空间ωi被选中的概率Pt。

公式（1）