服务热线

0459-5153333

新闻分类
【技术前沿】基于机器学习算法的管道内外检测数据对齐
来源:管网科技 | 作者:管网科技 | 发布时间: 2022-09-22 | 677 次浏览 | 分享到:
管道外检测数据和内检测数据的对齐,作为管道完整性管理中的重要一环,其主要任务是将外检测点对齐到内检测中心线上,以充分挖掘内检测和外检测数据的价值。
管道外检测数据和内检测数据的对齐,作为管道完整性管理中的重要一环,其主要任务是将外检测点对齐到内检测中心线上,以充分挖掘内检测和外检测数据的价值。

研究者以某长输管道公司管道系统中的外检测数据和内检测数据为例,从地面标识点和里程桩的关系出发,利用机器学习算法构建内检测点和外检测里程的关系模型;通过地面标识点和里程桩对管道分段,利用线性拉伸算法逐段将外检测点对齐到内检测中心线,从而实现外检测和内检测数据的对齐。


 问题描述

01

内外检测数据特征

管道外检测数据主要记录了外检测点的里程、经度、纬度、IR 降、开关电位以及电位梯度等信息。

管道内检测数据主要从内检测点里程、经度、纬度、特征类型(例如,焊缝、三通、阀门以及地面标识点)、腐蚀长度、腐蚀宽度、腐蚀深度以及腐蚀时钟位置等对管道的状态进行刻画。 

虽然检测的目标和特征不同,但是两种检测数据都记录了检测点的位置信息,例如里程和经纬度等,因此,位置成为管道内外检测数据对齐的关键特征。

02

数据对齐目标

管道内外检测数据对齐是将外检测点对齐到管道内检测中心线上,以纠正外检测点的位置, 其主要目标是最小化纠正后位置与其真实位置的差距:

式中:
H、Z 分别为外检测点及其在内检测中心线上所对应的实际位置;
g为外检测点及其在内检测中心线上所对应位置之间的映射关系,即为构建的机器学习模型;
argmin L表示对映射关系g进行优化,使得映射关系得到的值和真实值尽可能接近。
管道外检测数据对齐到内检测中心线,所面临的挑战主要包括两点:

样本量少,外检测点与其所在内检测中心线上位置的映射关系很少;

数据粗糙,由于大部分外检测点的经纬度信息缺失,外检测点及其所在内检测中心线上位置的映射关系,仅包括里程这一个维度。

 模型建立

基于机器学习算法的数据对齐模型见下图。针对内检测和外检测点映射少的问题,该模型利用机器学习算法实现映射点的扩增,然后,基于扩增后的映射点,逐段将外检测缺陷对齐到内检测中心线。

基于机器学习算法的数据对齐建模示意图

01

基于机器学习的数据增强

  • 数据预处理

由于整个管道长达数千米,检测厂商通常对管道分段检测,检测结果以检测报告的形式存储在不同的文本文档中。此外,在数据采集和存储的过程中,由于各种客观条件和人为操作不当等因素,导致检测数据存在缺失、重复、不完整、异常等情况。因此需要对数据进行清洗,方法为:

1)文本存储

对检测报告文档进行解析,得到二维表形式的数值化检测数据,对不同管道段的数据进行合并,对外检测点与其在内检测中心线的位置映射进行解析。

2)数据重复

根据专家知识对重复数据进行删除处理。

安全事故风险。

3)格式异常

检测结果数据以字符串的形式存储且小数点符号异常,解析字符并转化为标准的浮点型数据。
  • 样本构建
数据增强的任务是通过机器学习算法捕捉内检测里程差和相对应的外检测里程差的关系(如下图)。其中i表示内检测;0表示外检测;为内检测数据中的第j个地面标识点;为外检测数据中的第 k 个里程桩。

地面标识点和里程桩的映射关系示意图

对于内检测的地面标识点,提取任意两个地面标识点之间的特征信息作为输入变量。对于外检测数据,提取与输入变量对应的两个里程桩的外检测里程差,作为模型的输出变量。
输入变量和输出变量如下式所示:

式中:

L为样本个数;

m为输入变量的特征个数;

为第l段标识点之间的第m个特征;

Yl为第l段里程桩之间的里程;

X为所有段的标识点之间的所有特征;

Y 为所有段的里程桩之间的里程。

  • 模型开发

选用多元线性回归模型来学习内外检测数据点的映射关系。多元线性回归模型不仅具有较好的可解释性,还可以用于特征的筛选和分析,能够快速地拟合输入变量和输出变量之间的关系, 其计算式如下:

式中:

W 和 B 为模型参数。
在模型训练阶段,选用平方误差度量模型的预测值和真实值间的差异,从而进行反向传播优化模型参数,平方误差 Ld可由下式计算得到:

式中:

Yl 和l 分别表示第�个样本里程差的真实值和预测值。
为了快速地求解模型参数,选择随机梯度下降算法进行参数优化。
随机梯度下降算法流程图
  • 模型预测

模型预测的目标是通过训练好的算法模型预测每个内检测点所对应的外检测里程。为了提高模型预测外检测里程的准确率,使用集成学习的思想预测内检测点对应的外检测里程。

  • 方案步骤

确定了基于多元线性回归算法进行数据增强的方案。

基于机器学习算法的数据增强流程图
在模型训练中:

① 数据准备,从内外检测数据中提取地面标识点和里程桩的映射;

② 样本构建,对地面标识点和里程桩的映射数据进行处理,生成训练样本;

③ 模型训练,选用合适的优化算法,优化模型参数,直到满足停止条件;

④ 模型保存,保存训练得到的模型参数。

02

基于线性拉伸算法的内外检测数据对齐

由于检测方式、 检测设备不同及测量误差等因素,管道内外检测数据在里程上存在一定偏差,其中点 A'、 B'分别为内检测中心线上的地面标识点或标注的内检测点,点 A'位于 B'的上游;A、B分别为 A'、B'在外检测线上所对应的位置;点 x 是位于AB 段上的任意外检测点,其在内检测中心线上的位置用点 x'表示)。在实际的生产数据中,内检测点 A'B'的里程与所对应的外检测点 AB 的里程存在的一定的偏差, 利用线性拉伸算法将外检测点 x 对齐到内检测中心线的计算式为:

式中:

为外检测点 x 在内检测中心线上的里程;
L(x) 为点 x 在外检测线上的里程;L(A)、L(B)分别为外检测点 A、B 在外检测线上的里程;
L(A)、L(B)分别为外检测点 A、B在内检测中心线上的里程。

管道内检测和外检测里程偏差示意图

 案例计算

以某管道公司在中亚地区的一段天然气管道为研究对象(该管道的外检测里程范围明显大于内检测,需要通过人工方式对外检测数据进行裁剪,统一数据的里程范围)。

某天然气管道内外检测数据的基本信息表

01

基于机器学习的数据增强

选用两种评价指标评估模型的有效性,分别为平均绝对百分误差M和决定系数R2, 其计算式如下:

式中:

n为样本的数量;
yl 和 l 分别为第�个样本的真实值和模型预测值;为所有样本真实值的均值
M反映模型在数据集上预测结果的准确性,当M的取值趋近于0时,预测值与真实值越接近。
R2反映模型的拟合优度,当 R2 趋近于1时,预测结果对里程差的拟合越好。

02

数据对齐

在外检测点对齐到内检测中心线的部分结果中,红色点表示外检测点对齐到内检测中心线上的结果,对齐结果与外检测点的对应关系为蓝色的虚线。相对于蓝色点,红色点的分布与内检测中心线的变化高度吻合,所提出的方法能够准确地将外检测点对齐到内检测中心线上。

部分外检测点对齐到内检测中心线的结果

  结 论

结果表明,由机器学习算法构建的内检测点的外检测里程预测模型的平均绝对百分误差M为0.098%,小于0.10%,决定系数R2为 99%,该模型能够很好地捕捉内检测点和外检测里程的关系

相较于传统方法,该方法对管道本体特征的依赖性很小,拥有更广的应用范围。但由于客观条件的影响,里程往往存在一定的累积误差,在未来的研究中,可以通过削弱累积误差进一步提高对齐的准确性。

参考文献:

刘海鹏,万鹏,刘庆亮,张建坤,郝郁,武晓彩,姜垣良,谷思昱.基于机器学习算法的管道内外检测数据对齐[J/OL].油气储运:1-8[2021-10-25].http://kns.cnki.net/kcms/detail/13.1093.TE.20210720.1651.004.html.


ONE

转自:管网科技

声明:本网站内容大多源自互联网整理,素材、图片、版权属原作者,内容仅供学习参考,不对信息准确性,可靠性或完整性做任何保证,切勿作为商业目的使用。如有侵权,请与我们联系,我们将在第一时间删除内容。