创建时间:2020-04-14 22:15

“Hey, Siri … …”当我们唤醒智能手机的那一刻,实际上你手机麦克风里采集到的原始语音信号,可能是每秒44,000个样本点。那么需要些什么样的规则才能把这些样本点转成一个字符串呢?或者简单点,手机如何判断这些信号里是不是含有唤醒词?这里就需要机器学习(或者也称之为深度学习)。

 

许多人初次听到机器学习,在脑海中浮现的可能是一个机器人管家或者《终结者》里可怕的AI。但是机器学习并非是幻想,它已经被我们应用几十年了。例如光学字符识别(OCR)、垃圾邮件过滤器、抖音的视频推送算法。可以说,目前机器已经深刻影响到人类生活的方法面面,可以预见,未来机器学习还将继续深入变革每一个行业。

 

什么是机器学习?

机器学习是通过编程让计算机从数据中进行学习的科学(和艺术)。

更广义的概念是:

机器学习是无需进行明确编程,就能让计算机具有学习的能力。 —— Arthur Samuel,1959

工程性的概念可表达为:

机器学习是程序利用经验 E,来进行学习任务 T,并且用性能 P进行度量,任务 T 的性能度量 P 随着经验 E 不断增长。—— Tom Mitchell,1997

 

机器学习和ITASCA

当机器学习综合应用于其他学科时,应用研究成果转化的产品较之于传统的工作方式将大大提高工作效率,这也使得当下机器学习风行一时。虽然目前土木行业在机器学习领域算是起步较晚,但随着我们的工程监测能力提升和计算性能的提高,所产生的海量工程数据若能加以整合利用,将会给整个土木行业内带来新的变革。

ITASCA国际集团也一直在思考人工智能和机器学习对ITASCA系列软件开发的冲击。岩土高端数值软件研发一直是ITASCA集团公司的优势性技术领域,公司有多款产品可用来分析预测岩土方面的相关问题,计算过程中产生的大量数据则可以作为训练数据集,用来进行机器学习,进而可以据此开展校正、反演及更进一步的数据挖掘工作。通过不断学习,在特定情况下,我们或许可以无需再基于运行时间冗长的数值分析来获得关键变量的敏感性分析结果,而可以像使用经验公式那样轻松地获得我们所感兴趣的内容。

下面将通过3个例子介绍ITASCA在机器学习方面的一些初步探索。

1)岩石爆破破碎区的预测计算

在岩石爆破过程中,炸药产生的应力超过岩石强度时就会形成破碎带。为计算爆炸后一系列的设计参数如爆后孔径、破碎带直径、平衡压力以及爆炸所产生的能量分布,我们预先通过FLAC3D建立模型( 1),据此输入不同的爆破参数(主要是炸药类型和爆破孔径),岩石模量、单轴抗压强度UCS进行计算,获得一定量的参数敏感性分析成果。进一步将以上数据集按7:3比例分割,前者用来训练人工神经网络(ANN),后者则可作为测试、校核数据,得到经机器学习形成的代理模型。以互联网作为工作平台, 2给出以单页web形式发布的代理模型客户端程序,据此可进行简易快捷的爆破分析应用(Furtney, 2012)。。

本应用揭示机器学习在效率方面的巨大优势,以数值模型方法需几分钟才能计算完成的简单爆破分析为例,代理模型则可以在几毫秒内给出预测,即便是利用目前的智能手机也可以轻松完成分析。

img1

图 1 爆破近场示意图

img2

图 2 网页端中的代理模型

2)层状土承载能力预测计算

层状土承载力确定是ITASCA公司在工程咨询研究中常见的问题之一。均质土层的承载力可以直接通过解析解所得,层状土在实际中则更为常见,其承载力亦可利用ITASCA数值分析并结合机器学习技术进行快速确定。据此,我们首先建立了如图 3所示含12个土层的数值模型,并经约10万例FLAC3D 7.0计算分析获得不同土体强度组合条件下(每层土的摩擦角和粘聚力均可以不同)的层状土地基承载力数据样本。其中,每个算例耗时约5分钟。利用该数据样本,我们训练形成自咀嚼模式人工神经网络(ANN)代理模型来预测层状土地基承载力。经大量测试揭示,代理模型预测承载力结果跟FLAC3D的平均误差在1%以内,且代理模型可大大缩短计算时间,可从原先的5分钟降至大约20秒。

img3

图 3 状土模型示意图

img4

图 4 层状土承载力的数值计算

img5

图 5 测试集误差直方图及预测对比图

3)裂缝网络的渗流率计算

裂隙网络(DFN)模型通常用作于岩土或水文地质数值模拟的输入,其应用领域非常广泛,包括矿井脱水、水文地质、边坡稳定性、核废料处置、环境工程、采矿工程、石油/地热开采等常规和非常规行业。在本例中(6),我们创建了一个包含10条几何形状固定的裂隙的简单DFN模型,通过给每条裂隙投喂不同的渗透率,采用3DEC程序裂隙流分析功能考察岩体渗透率、得到机器学习数据样本,并据此经机器学习训练得到用于岩体渗透特性研究的代理模型。当然,我们也可以用相似方法创建基于岩体渗透率反演其中每条裂隙渗透率的机器学习代理模型。6算例裂隙条件简单,计算基本在几秒之内完成,我们可以不断强化模型,进行一系列不同裂隙分布条件展开研究,如裂隙数从10条到成千上万条裂隙,这些将是我们之后研究的内容。

img6

图 6  () DFN随机渗透率 ()渗透模拟结果

以上每个案例都使用了基于python语言scikit-learn算法包中的 MLPRegressor库进行训练(Pedregosa et al., 2011),当然也有其他库,例如PyTorchXGBoost。当给定含足够样本的数据集时,所训练得到的代理程序都能很好地预测目标结果,这就需要结合大量数值试验进行训练数据集的生成。当然,一般来说,未知参量越多,收敛越慢,即学习速度越慢,这也跟ANN中隐含层的大小有影响,隐含层越小的ANN收敛更快,预测效果也相对较差。

img7

图 7 代理模型学习曲线

表 1 各实例ANN相关参数

实例

投喂参数

训练数据集 

离散系数R2 = 0.995

神经网络隐含层大小

爆破1

3

143

15,15,15

爆破2

5

106

15,15,15

DFN

10

15,888

20,20,20,15

层状土

12

>100,007

36,36,36,36,36

 

后记本期文章主要介绍了通过机器学习结合ITASCA数值模型试验训练形成代理模型开展地质体力学行为或特性研究的方法。机器学习及代理模型的优势在于极大提高分析效率,同时也具有一定的局限:代理模型是根据前期大量的数值试验产生的数据集训练所得,结果并不会优于数值试验;与常规数值试验方法相比,代理模型只能预测已训练参数。

目前,行业内认为代理模型的建模练习对基于基本的岩石力学认识没有本质上的帮助;且整个隐含层是一个黑盒过程,看不到中间解析的过程,这也就意味着可能无法做出合理的工程判断。不过,数值计算分析也经历过这样被质疑的阶段,经过一代工程师的努力,人们才相信数值模拟比传统的分析和经验方法有一定优势。现在,同样的挑战也适用于当今的机器学习和数据分析技术。尽管存在上述缺陷,但“模型即数据”的新范式是强大的,并已在地球资源工程中取得了成功。往后来说,以智能化机器学习作为技术支撑的代理模型具有显著的优势:速度快;可用于统计分析,如方差评估或反演分析;通过嵌入到智能手机或者平板,可以被用作现场轻量化快速评估工具。

我们期待机器学习改变未来。

 

参考文献:

[1]  Furtney, J. K., Le Goc, R. Surrogate Models in Rock Mechanics: Integrating Numerical Modeling and Machine Learning. 2020. Proceeding of 54th US Rock Mechanics/Geomechanics Symposium. Colorado: Golden.

[2] Pedregosa, F., G. Varoquaux, A. Gramfort, V. Michel, & B. Thirion. 2011. Scikit-learn: Machine Learning in Python, JMLR 12, pp. 2825-2830.

[3] Starfield A.M. & P.A. Cundall. 1988. Towards a Methodology for Rock Mechanics Modelling, International Journal of Rock Mech. Min. Sci. & Geomech. Abstr. Vol. 25, No. 3, 99-106.

[4]  Holling, C.S. (ed) 1978. Adaptive Environmental Assessment and Management, 377 p (Wiley: Chichester).

[5]  Furtney, J. K., E. Sellers and I. Onederra. 2012. Simple Models for the Complex Process of Rock Blasting, In Proceedings, The 10th International Symposium on Rock Fragmentation by Blasting, (New Delhi, India, November 2012). London, UK, CRC Press/Balkema.

[6] Maillot, J., Davy, P., Le Goc, R., Darcel, C., & de Dreuzy, J. R. 2016. Connectivity, permeability, and channeling in randomly distributed and kinematically defined discrete fracture network models. Water Resources Research, 52(11), 8526-8545. doi:10.1002/2016wr018973

[7] Le Goc, R., Pinier, B., Darcel, C., Lavoine, E., Doolaeghe, D., de Simone, S., E. Lavoine avy, P. 2019. DFN.lab: software platform for Discrete Fracture Network models. Paper presented at the AGU Fall Meeting, San Francisco, CA, USA.

首页    关于我们    行业资讯    机器学习与ITASCA软件 - 3个小案例

机器学习与ITASCA软件 - 3个小案例