所有提交的EM系统将被重定向到网上投稿系统.作者被要求将文章直接提交给网上投稿系统各自的日志。

原文
,卷:14(4)

基于机器学习方法的多相流流型及含液率预测

*通信:
Chandrasekaran年代石油工程印度理工学院马德拉斯海洋工程系项目,金奈600036,印度电话:+ 91 - 9840261010;电子邮件: (电子邮件保护)

收到:2018年8月27日;接受:2018年8月27日;发表:2018年9月3日

引用:钱德泽卡兰,库玛。多相流流动模式和液体含率预测机器学习的方法。环境科学与技术,2018;14(4):173

摘要

在这项工作中,数据模型是由人工智能石油勘探过程中钻井阶段和生产阶段多相流流动模式预测和液体滞留预测的技术。这一点非常重要,因为早期预警和缓解井涌(多相流)对钻井人员的安全至关重要,可以防止不必要的生命和财产灾难。在石油工业生产过程中,解决这一问题对于了解井的产能、运输系统的设计和炼油工艺具有重要意义。结果表明,这些方法能够较好地匹配并提高多相经验相关的预测性能。不同的神经网络模型结构和机器学习分类和回归算法进行了评估和优化,以确定准确预测的最佳模型。建立模型的数据来源于文献中对斜管内空气-煤油两相流动的研究。

关键字

Classification-multiphase流;回归;实证模型

简介

多相流是流体流动过程中两个或两个以上相同时流动的现象。在石油工业中,这种流动发生在生产和钻井过程中,准确确定井筒中的压力梯度非常重要。在钻井过程中,在井涌过程中会发生多相流现象,这是由于油藏与井筒之间的压力梯度导致地层流体或气体流入井筒。在生产过程中,气液混合物在较大的压差下长距离输送,影响了生产系统的设计和净生产率。在这两种情况下,压降和流动状态的不确定性显著影响了沿井筒的压力分布。在发生井涌和井喷时,准确测定压降和流动状态可以正确选择井控程序。由于多相流具有复杂的非均质性,目前还没有建立起能够完全描述多相流的物理方程。随着时间的推移,研究人员开发的多相相关性和模型是经验性的,对建立这些关系的流动条件具有高度的主观性[1].

气液多相流的压力分布与单相流不同。当气体和液体在一起流动时,由于流体性质(密度、粘度)的变化,它们倾向于分离。在垂直流动中,由于剪切应力的变化,气体和液体通常不会以相同的速度运动。在气液多相流动中,每一相的流动面积相对于单相流动较小,因此导致每一相的压力损失。气体往往比液体流动速度快,因为它密度小,粘性小,可压缩。在这个过程中,它们倾向于在界面处以不同程度的粗糙度滑过液相,这取决于流动模式。为了模型对于多相流现象,研究人员将单相流方法扩展到多相流,但添加了额外的“混合”规则,因此提出了几个相关性来定义水平、垂直和倾斜管道的含率和流动模式。保持率定义为在两个或两个以上相存在的情况下,单相在畴中所占的体积分数。在这项工作中,Duns和Ros相关性[2和Mukherjee相关被实施并被视为基线经验模型。这些相关性是基于在特定条件下进行的实验工作,例如恒定的管径[3.].

垂直向上多相流一般有四种流态,即气泡流、段塞流、搅动流和环形雾流,如图所示图1.流动状态的变化顺序是,在给定的液体速度下增加气体速度[4].在气泡流动中,连续相为液体,而在速度变化的小气泡中观察到气相,气相对压降和持量的贡献较小。在段塞流中,较小的气泡在较高的气速下合并形成泰勒气泡。液体仍然是连续相。在搅拌流中,气泡分解。这是一个湍流相,液体和气体都不能形成连续相。随着气速的增大,气泡形成连续相,液体呈膜状涂覆在管壁上,形成环形流动[5].

environmental-science-flow

图1:流模式。

除了经验相关和机械模型,人工智能石油研究开发了自动解决压力梯度问题和流态识别的技术。这项技术是基于探测肉眼看不到的图案的能力[3.].该方法可以提取滞留预测和流型识别中的复杂关系机器学习而且人工智能方法,从而提供来自嘈杂环境的数据的见解[6].

材料与方法

在这项工作中,a机器学习该方法采用监督学习技术来理解管道中多相条件下的含率和流型识别。该方法了解实验参数之间的模式,并建立它们之间的关系。该关系存储在机器学习并进一步扩展模型,以预测不同输入条件下的流动模式。

这项工作的数据来自Mukherjee [7]覆盖了不同方向的水流(向上和向下)以及不同的倾斜度。中描述了数据的摘要图2

environmental-science-data-set

图2:Mukherjee数据集。

在这个向上流动的实验中,压缩空气-煤油的两相混合物被允许通过一根直径1.5英寸、长56英尺的管道,在不同的压力和温度条件下。每次观察压力和温度时,都观察管道末端的含液量和流动模式。在610次观测中,以段塞流为主,出现390次,分层流最少,只有12次。

早期关于流型分类的工作主要集中在流型图[8].一般情况下,为了进行流型图的可视化推断,对流型进行了最能影响流型的实验观察。气体速度数和液体速度数是实验中最能代表温度、压力和流体性质的无因次数,分别作为纵坐标和横坐标。气速数为,

方程

液体速度数为,

方程

本文建立了两种数据模型来研究多相流现象。一种模式是对流动模式进行分类,另一种模式是对流动模式进行分类模型是对支撑进行预测。数据模型是由监督学习算法开发的,需要一个数据集来学习、验证和测试。采用随机森林算法、逻辑回归算法、支持向量机算法和多层感知器分类器来解决流型类型预测的分类问题。每种方法的学习过程各不相同,对于支持向量机(SVM),支持向量机的学习过程将训练数据带入高维空间,从而避免非线性在输入数据有限的情况下,适用于三维空间。支持向量机模型找到最大分离超平面,可以最大化到训练数据的距离,确保泛化和全局最优。逻辑回归模型通过测量逻辑函数来测量输入变量之间的关系。随机树是一类集成学习方法,在训练时将输入空间分割为若干决策树,在预测时将输出类作为单个决策树的模式。神经网络模型还针对分类问题进行了开发。采用三层反向传播网络,隐层为7个神经元,输出层为4个神经元,每个神经元输出神经元对应于雾状、段塞状、层状和气泡流型[9].数据的输入模型分别是气速数、液速数、倾角;保持数值、压力、温度、比重(图3).

environmental-science-multi-layer

图3:多层感知器。

参数的超调谐机器学习算法是由网格进行搜索优化,其中个体模型参数(例如,决策树的数量是a模型随机森林法的参数)进行选择,并根据模型进行评分。参数的算法,其中提供了最好的分数模型作为其调优参数,并保留以供进一步评估。在分类问题中,混淆矩阵是算法结果评分的常用方法。混淆矩阵是一个表(二维数组),可用于描述分类器的性能,其中一个轴表示预测,另一个轴表示实际。

多层感知器神经网络模型是用来预测滞留时间的。在实验中观察到,几乎没有遗漏的压力观测值。在预处理过程中,利用数据imputation技术对不存在的压力观测数据进行近似估计。输入神经元类似于分类问题,但在这种情况下,输出是保持参数。在模型的训练阶段,考虑90%的数据集,留出10%的数据集进行测试。研究了不同的学习准则和激活函数,用计算机程序设计了最优的神经网络。在每次训练结束时,稳定后,发展模型将该方法应用于测试集,计算了预测滞留率。的模型通过网格搜索优化对参数进行超调模型估计层数为7层,每层17个节点。为了验证预测,参考了两个分析模型,即Mukherjee相关[10]及Duns & Ros相关性[2].

结果与讨论

图4显示了Mukherjee实验研究中使用的所有数据点的图表[7].表层气体速度用(0.1 ~ 100)ft/s的横坐标表示,表层液体速度用(0.07 ~ 12)ft/s的纵坐标表示。文中给出了实验数据图4,为空气-煤油流量和研究中所有倾角。可以观察到,在四种流分类中,数据不包含任何显著的模式和清晰的聚类。显然,观察到的流动模式与实验参数(即温度、压力、负载、流体性质、流动倾斜度和几何形状)之间存在复杂的关系。

environmental-science-experiment

图4:穆克吉实验。

图5-7分别为Mukherjee模型、Duns模型和Ros模型的实测和预测支撑量的比较模型神经网络模型。对每个模型,确定相关系数的平方(R2)。结果表明,所有模型的预测结果与实验结果总体上吻合较好。由于层状流和雾状流的数据点数量明显较少,因此两者之间的比较可能不显著。然而,可以观察到,神经网络的预测模型与理论模型的相关系数(0.94)分别为0.89和0.9 (表1) [23.].

environmental-science-predictions

图5:数据模型用来预测延误——所有的预测。

environmental-science-slug-flow

图6:数据模型用于预测阻塞气泡和段塞流。

environmental-science-Correlation

图7:Mukherjee, Duns和Ros相关。

慕克吉相关性 Duns & Ros相关性 数据模型
弹状流 0.937 0.935 0.939
泡状流 0.724 0.689 0.781
整体 0.9 0.89 0.94

表1:支撑关系的比较。

在本研究中,输入和输出压差被表示为压力梯度,作为输入参数。在压力梯度未知的实验观测中,采用数据imputation技术,提高了预测的置信度。采用的数据输入技术是一种多层感知器回归器,也是一种神经网络方案。这种特征工程技术使我们能够建立一个相关神经网络模型利用已知压力观测值,并将其扩展到未知观测值的预估。

图8-10为Mukherjee模型、Duns模型和Ros模型得到的流型预测模型而且机器学习模型。结果以饼状图表示,饼状图表示实验中观察到的流型与模型预测的流型的分类。在图10,为实际雾流量,数据模型预测了80%的薄雾流,19%的分层流和1%的段塞流实例。一般来说,数据模型能够准确预测80%的真实雾状流动,67%的真实分层流动,89%的真实段塞流和69个真实气泡流动。在流动模式中,段塞流预测率最高,达到89%。虽然,这可能与训练数据中的实例数量有关,但重要的是要注意模型能够很好地推广到其他类型的模式预测,因为精度也很高。的数据模型紧随慕克吉之后模型图8)对段塞流、分层流和环形雾流进行了预测,对气泡流的预测效果较好。的数据模型在预测方面也优于Duns和Ros模型图9)用于段塞状和环形雾状流动模式。但对于气泡流动,Duns和Ros模型的精度为80%,优于数据模型(69%)。邓斯和罗斯一家模型分层流没有单独的分类,大部分都属于段塞流。的数据模型比慕克吉的预测更好模型在分层流动中,气泡流动状态和预测优于Dun和Ros模型在气泡中,段塞流状态。的数据模型也可以作为一种概括模型与实验观测结果非常吻合。

environmental-science-mukherjee

图8:慕克吉模型。

environmental-science-duns

图9:Duns和Ros模型。

environmental-science-machine-learning

图10:机器学习模型。

在数据模型中也观察到,对于薄雾流动的影响模型将19%的流错误地划分为段塞流,对于分层流,将19%的流划分为段塞流模型错误地将17%归为段塞流,而对于气泡流,则为模型将31%错误地归类为段塞流。这意味着由数据标识的输入模式模型在段塞条件下,与其他流型相比,具有相关性和简单性。

的数据模型在上述讨论中提出了一种用于流态分类的随机森林评价算法。为了确定最佳方案,进行了一项简单的研究机器学习这个数据集的算法。数据被分为多组随机训练数据集和测试数据集。不同的机器学习在此数据集上应用算法,比较不同技术的总分,如图所示表2.结果表明,随机森林分类器能够较好地对流型进行分类。随机森林是一种更好的分类算法,因为逻辑回归和支持向量机可以在非线性边界和有限实例数量的情况下是一种很好的分类器。这也意味着Mukherjee实验中流模式之间的分类边界是线性和一般的,这使得随机森林对我们的输入数据集更加成功。

方法 精度
逻辑回归 0.737
支持向量机 0.798
随机森林 0.854
神经网络 0.830

表2:分类器算法

结论

本文成功地建立了两种数据模型,并应用于不同倾角下的管流预测和流态预测。这些模型成功地理解了气液两相多相流动中存在的复杂关系,并将其推广到不同输入情景下的预测。发达模型是基于较低操作压力制度下慕克吉相关的实验结果。的模型输入变量包括表面速度、密度、两相粘度、压力和温度,输出变量为阻力和流型。结果表明,该神经网络的预测精度较高模型远远优于Mukherjee, Duns和Ros的经验相关性[11].除了准确性,还有数据模型能够很好地推广,因此,可以扩展到不同的实验和现实世界的场景。在流型分类中,基于决策树的随机森林算法能够根据实验结果对流型进行准确的分类。所考虑的流型有段塞流、分层流、气泡流和环形雾流模型能够较以往的研究更准确地对接近89%的段塞流和70%的气泡流进行分类。

参考文献

选择感兴趣的语言以查看感兴趣的语言的全部内容

目录

谷歌学者引证报告
引文:355篇

环境科学:一份印度期刊收到355次引用,根据谷歌学者报告

编入索引中

  • 卡斯商学院
  • 谷歌学者
  • 打开J门
  • 中国知网(CNKI)
  • CiteFactor
  • 宇宙如果
  • 期刊索引目录(DRJI)
  • 秘密搜索引擎实验室
  • 学者文章影响因子(SAJI)

阅读更多

摩天观景轮
全球科技峰会