服务热线
0459-5153333
研究者以某长输管道公司管道系统中的外检测数据和内检测数据为例,从地面标识点和里程桩的关系出发,利用机器学习算法构建内检测点和外检测里程的关系模型;通过地面标识点和里程桩对管道分段,利用线性拉伸算法逐段将外检测点对齐到内检测中心线,从而实现外检测和内检测数据的对齐。
问题描述
01
内外检测数据特征
管道外检测数据主要记录了外检测点的里程、经度、纬度、IR 降、开关电位以及电位梯度等信息。
管道内检测数据主要从内检测点里程、经度、纬度、特征类型(例如,焊缝、三通、阀门以及地面标识点)、腐蚀长度、腐蚀宽度、腐蚀深度以及腐蚀时钟位置等对管道的状态进行刻画。
虽然检测的目标和特征不同,但是两种检测数据都记录了检测点的位置信息,例如里程和经纬度等,因此,位置成为管道内外检测数据对齐的关键特征。
02
数据对齐目标
管道内外检测数据对齐是将外检测点对齐到管道内检测中心线上,以纠正外检测点的位置, 其主要目标是最小化纠正后位置与其真实位置的差距:
样本量少,外检测点与其所在内检测中心线上位置的映射关系很少;
数据粗糙,由于大部分外检测点的经纬度信息缺失,外检测点及其所在内检测中心线上位置的映射关系,仅包括里程这一个维度。
模型建立
基于机器学习算法的数据对齐建模示意图
01
基于机器学习的数据增强
数据预处理
1)文本存储
对检测报告文档进行解析,得到二维表形式的数值化检测数据,对不同管道段的数据进行合并,对外检测点与其在内检测中心线的位置映射进行解析。
2)数据重复
安全事故风险。
3)格式异常
地面标识点和里程桩的映射关系示意图
式中:
L为样本个数;
m为输入变量的特征个数;
为第l段标识点之间的第m个特征;
Yl为第l段里程桩之间的里程;
X为所有段的标识点之间的所有特征;
Y 为所有段的里程桩之间的里程。
模型开发
式中:
式中:
模型预测
模型预测的目标是通过训练好的算法模型预测每个内检测点所对应的外检测里程。为了提高模型预测外检测里程的准确率,使用集成学习的思想预测内检测点对应的外检测里程。
方案步骤
确定了基于多元线性回归算法进行数据增强的方案。
① 数据准备,从内外检测数据中提取地面标识点和里程桩的映射;
② 样本构建,对地面标识点和里程桩的映射数据进行处理,生成训练样本;
③ 模型训练,选用合适的优化算法,优化模型参数,直到满足停止条件;
02
基于线性拉伸算法的内外检测数据对齐
由于检测方式、 检测设备不同及测量误差等因素,管道内外检测数据在里程上存在一定偏差,其中点 A'、 B'分别为内检测中心线上的地面标识点或标注的内检测点,点 A'位于 B'的上游;A、B分别为 A'、B'在外检测线上所对应的位置;点 x 是位于AB 段上的任意外检测点,其在内检测中心线上的位置用点 x'表示)。在实际的生产数据中,内检测点 A'B'的里程与所对应的外检测点 AB 的里程存在的一定的偏差, 利用线性拉伸算法将外检测点 x 对齐到内检测中心线的计算式为:
式中:
案例计算
以某管道公司在中亚地区的一段天然气管道为研究对象(该管道的外检测里程范围明显大于内检测,需要通过人工方式对外检测数据进行裁剪,统一数据的里程范围)。
某天然气管道内外检测数据的基本信息表
01
基于机器学习的数据增强
选用两种评价指标评估模型的有效性,分别为平均绝对百分误差M和决定系数R2, 其计算式如下:
式中:
02
数据对齐
在外检测点对齐到内检测中心线的部分结果中,红色点表示外检测点对齐到内检测中心线上的结果,对齐结果与外检测点的对应关系为蓝色的虚线。相对于蓝色点,红色点的分布与内检测中心线的变化高度吻合,所提出的方法能够准确地将外检测点对齐到内检测中心线上。
结 论
结果表明,由机器学习算法构建的内检测点的外检测里程预测模型的平均绝对百分误差M为0.098%,小于0.10%,决定系数R2为 99%,该模型能够很好地捕捉内检测点和外检测里程的关系。
相较于传统方法,该方法对管道本体特征的依赖性很小,拥有更广的应用范围。但由于客观条件的影响,里程往往存在一定的累积误差,在未来的研究中,可以通过削弱累积误差进一步提高对齐的准确性。
参考文献:
刘海鹏,万鹏,刘庆亮,张建坤,郝郁,武晓彩,姜垣良,谷思昱.基于机器学习算法的管道内外检测数据对齐[J/OL].油气储运:1-8[2021-10-25].http://kns.cnki.net/kcms/detail/13.1093.TE.20210720.1651.004.html.
转自:管网科技
声明:本网站内容大多源自互联网整理,素材、图片、版权属原作者,内容仅供学习参考,不对信息准确性,可靠性或完整性做任何保证,切勿作为商业目的使用。如有侵权,请与我们联系,我们将在第一时间删除内容。