当前位置: 主页 > 学术动态 >

AB-GEP:用于符号回归的对抗赌臂机基因表达式编程

点击数:   更新日期: 2022-12-06

中文题目:AB-GEP:用于符号回归的对抗赌臂机基因表达式编程

论文题目AB-GEP: Adversarial bandit gene expression programming for symbolic regression

录用期刊Swarm and Evolutionary Computation(JCR Q1,Top

原文DOIhttps://10.1016/j.swevo.2022.101197

录用时间:2022-10-27

作者列表

1)强,中国石油大学(北京),信息科学与工程学院

2)徐聪文,中国石油大学(北京),人工智能学院 硕士19

3Jake Luo, University of Wisconsin, Milwaukee, College of Health Sciences, Associate Professor

4王智广,中国石油大学(北京),信息科学与工程学院

背景与动机:

基因表达式编程 (GEP) 是解决符号回归 (SR) 问题的常用方法。然而,GEP 经常陷入局部最优。 GEP 是随机搜索结果,并可能重新访问低价值搜索空间,这会影响其性能。为了克服这两个问题,我们提出了一种使用对抗赌臂机来增强 GEP 的新算法--AB-GEP。 AB-GEP 将数学表达式空间分割成许多子空间。然后,它利用一种新的搜索空间选择方法 AvgExp3 来增强子空间之间选择与跳跃,这可以防止算法陷入局部最优。 AvgExp3 通过搜索空间中产生的奖励来动态估计子空间。动态奖励估计使 AB-GEP 更能适应奖励变化,也为AB-GEP 选择可以包含正确结果的子空间提供了方向的指导。

本研究证明 AvgExp3 是对子空间平均奖励的无偏估计,其方差低于标准 Exp3 方法。在两个基准数据集的评估表明,与GEP、SL-GEP 和 SPJ-GEP 三种传统 GEP算法相比, AB-GEP可以保持更好的种群多样性,并获得更好的结果。 AB-GEP 在 32 基准测试中的 50% 中排名第一,而传统 GEPs 仅获得不超过 20% 的最佳结果。



1 AB-GEP 框架

设计与实现:

AB-GEP将整个数学空间划分为多个子空间进行探索。这可以防止搜索过程陷入局部最优。原因是该算法可以通过个体跳跃过程逃离局部最优,因为个体在子空间之间跳跃可以给个体的基因型带来重大变化,并鼓励探索。此外,这些划分的子空间允许AB-GEP获取关于每个个体近似位置的信息,因为每个个体必须属于子空间。

2.1 AB-GEP

在AB-GEP中,数学表达式空间被划分为许多子空间。从这些子空间中,符号回归 (SR) 发现适合给定数据集的最佳数学表达式。在这种情况下,SR 面临与对抗多臂赌博机相同的问题——如何在不假设赌臂(子空间)奖励值分布的情况下估计每个赌臂(子空间)的期望奖励值,以及如何在子空间探索和利用之间取得平衡并最大化奖励(最好的数学表达式)。因此,对抗多臂赌博机问题和SR子空间评估问题的相似性,我们提出将对抗多臂赌博机方法与基因表达编程(GEP)相结合来解决SR问题,因此将该算法命名为 AB-GEP。

AB-GEP 遵循以下总体步骤:(1)它将数学表达式空间划分为k子空间; (2) 初始化每个子空间的平均奖励; (3) 计算学习率; (4) AB-GEP在每一代中都利用修改后的Exp3-AvgExp3来选择一个子空间进行探索; (5) AB-GEP 使种群从当前子空间跳转到子空间ωi; (6) AB-GEP利用交叉和变异在子空间ωi中搜索(利用); (7) AB-GEP 更新每个子空间的平均估计奖励。

2.2 选择子空间

AB-GEP根据在子空间ωi中个体的适应度值,来评估子空间ωi被选中的概率Pt

公式(1)

由于以下两个原因,AB-GEP利用AvgExp3而不是Exp3来选择子空间。一个是Exp3基于中的所有历史奖励来选择子空间ωi与Exp3不同,GEP是一种进化算法,在一轮(生成)中多次利用群体,而它只使用群体中最好的个体作为轮次奖励rt。rt根据以下的公式计算得到。

公式(2)

而公式(1)中的是学习率,其计算公式为


公式(3)

2.3 空间跳跃

在AB-GEP使用AvgExp3选择子空间后,它需要使种群从当前子空间ωj跳到ωi。为了实现从一个子空间跳到另一个子空间,AB-GEP将ωi中个体的编码替换种群中每个单独代码的头部编码。

2.4 空间利用

在种群跳到选定的子空间后,AB-GEP利用交叉和变异操作对子空间ωi进行搜索(利用)。

2.4.1 交叉

为了利用ωi,这些跳跃的个体通过交叉与ωi中最好的个体重组。尽管一个子空间中的许多连续组合可能会暂时使种群相似,但这种情况很快就会被跳出子空间的种群打破。当种群再次跳入时,种群与原始种群大不相同。因此,子空间之间的跳跃有助于算法避免陷入局部最优,并保持种群多样性。

2.4.2 变异

AB-GEP中的突变与原始GEP中的突变相似。突变可以发生在个体的头部和尾部。在头部,子空间编码之外的符号可以转换为另一个函数或终端。在尾部,符号只能更改为终端。

2.4.3 子空间评估

AB-GEP对子空间探索和利用后会对子空间进行评估,在AB-GEP中利用平均估计回报对子空间进行评估。的计算公式如下:


image016.png公式(4)

实验与结果:

3.1 据集

我们使用两个数据集、SR 基准和实际基准来评估 AB-GEP 的性能。SR 基准由来自四个规范符号回归基准的 24 SR 问题组成:Nguyen、KornsKeijzerVladislavleva

现实世界的基准包括八个现实世界的问题。与 SR 基准测试不同,现实世界的基准测试涉及更多功能。这有助于研究 AB-GEP 在高维 SR 问题中的性能。

实验所使用的数据集基准和数据集的函数及常量如表1、表2和表3所示。



表1 符号回归基准



表2 候选函数及其常数



表3 实际基准数据集

3.2 验结

2和图3所示为所有基准的适应度比较结果



图2 所有基准的适应度比较



图3 适应度比较

4所示为不同方法的种群多样性比较结果



图 4 种群多样性比较

5所示为AB-GEP 和 SPJ-GEP 在选择子空间上的比较结果。



5 AB-GEP 和 SPJ-GEP 在选择子空间上的比较

6所示为不同方法的收敛结果的比较。



6 收敛比较

作者简介:

    鲁副教授,导师。目前主要从事演化算和符号回、知识图谱与智能答、以及迹分析与挖掘等方面的研究工作。