更全的杂志信息网

基于混合核函数支持向量机的顶板砂岩富水性研究

更新时间:2009-03-28

我国许多煤矿水文地质条件非常复杂,导致矿井突水事故时有发生,制约了煤矿企业的健康发展。矿井水害问题一直是煤炭行业的主要攻关课题之一[1-4]。文献[5]在单因素分析的基础上,应用模糊聚类方法对含水层富水性进行评价,但未能全面体现出砂岩富水性各指标的综合影响。文献[6]建立了基于PNN的煤层顶板砂岩含水层富水性预测模型,预测结果和实际结果相符,证明该方法是可行的,但是预测样本较少,不能全面评价整个研究区的富水性。文献[7-8]指出了砂岩裂隙型含水层富水性分布范围,但不能定量得到研究区的富水性强弱。文献[9-10]采用了综合评价方法对煤层顶板岩石富水性进行预测,但考虑的指标和样本数量较少。尽管上述文献对煤层顶板砂岩富水性进行了研究探讨,并取得了大量成果,但研究方法较为单一,选取的指标和样本数量较少,不能全面评价煤层顶板砂岩富水性。因此,笔者运用BP神经网络、K最近邻分类法、决策树及支持向量机等方法,以寻求一种能够判定新样本归属的最优法则,从而使之有效地判别煤层顶板砂岩富水性。

1 煤层顶板砂岩富水性的指标选取

桑树坪煤矿地质条件极其复杂,开采的6#煤层厚1.08~4.76 m,可采系数为97%。煤层结构简单,顶板以泥岩、砂岩为主。全区查明断层12条,基本查明断层14条,查出断层7条,推断断层1条,这些断层的存在破坏了顶板的连续性和完整性,为顶板砂岩水的赋存提供了良好的空间。为预测6#煤层顶板砂岩的富水性,将研究区进行了剖分,确定出煤层顶板砂岩富水性的评价指标如下:

去年7月24日,中央纪委通报:陈传书担任民政部下属单位主要负责人期间,工作严重失职失责,监督管理不力,对有关问题的发生负有主要领导责任,受到留党察看一年、行政撤职处分,降为正局级非领导职务。

1)砂岩厚度。砂岩的厚度大的地段单位面积上储水空间大,砂岩厚度越大,顶板富水性越好。

2)泥岩厚度。泥岩的孔隙度小,不利于富水;砂岩的孔隙度大,有利于富水。因此砂岩越厚泥岩越薄越有利于富水。

3)浆液漏失量。揭示了地层内部裂隙发育程度,漏失量越高,说明裂隙发育程度越高。

4)岩芯采取率。决定钻探过程中取芯的难易与完整程度,采取率越高,说明该段岩层完整性越好。

5)断层强度。表示某一预测区域受断裂破坏的程度。

6)断层密度。表示单位面积内发育的断层条数。

2 算法简介

2.1 BP神经网络

神经网络中使用最多的是BP神经网络(Back propagation neural network,BPNN)模型,通过反复检验训练样本来修正权值,使得权值最好稳定于最小值[13]。其输入层到隐含层、隐含层到输出层的关系如下:

 

(1)

 

(2)

式中:ai为第i点输入;bj为第j个隐含层节点输出;wij为输入层到隐含层的权值;wji为隐含层到输出层的权值;ri为隐含层到输出层的权值;θj为隐含层的阈值。

2.2 K最近邻分类法

K最近邻分类法(K-nearest neighbors,KNN)是一种操作简单、有效并且在实践中应用较成功的分类方法[14],K最近邻分类法公式表示为:

score(P,C)=∑sim(P,Pi)u(Pi,Ci)

(3)

各预测模型的节点错误率如表3所示。

(4)

式中:P为样本相应的特征向量,P = (pi 1,pi2 ,…,pim);u (PiCi)为样本特征向量Pi关于样本类别Ci的类别属性。

对所有样本类的权重之和进行比较,根据分类结果将样本归类到权重和最大的类别中。

2.3 决策树

决策树(Decision tree,DT)是一种常用于分析数据的算法,操作简单,使用方便[15]。该算法建立在奥卡姆剃刀理论基础上,阐述了一个信息熵的概念:

 

(5)

式中:S为训练集;pi(i=1,2,…,m)为具有m个类别标签的类别属性C在所有样本中出现的频率。

2.4 支持向量机

支持向量机(Support vector machine,SVM)是一种通过采用风险和置信范围的最小化原则,来提高学习机泛化能力的算法[16-19]。其具有全局优化能力强和泛化性能好等优点,使得SVM广泛应用,已经成为许多学者关注的热点。

由Kuhn-Tucker条件知,最优超平面充要条件是分类超平面满足以下关系:

 

(6)

式中:ω0为分类线权重阵;b0为分类的阈值;αi为拉格朗日乘数因子;yi为可分类的类别。

案例企业社会责任行为说明:2018年1月19日,在《证券日报》主办的第一届新时代资本论坛上,首届“金骏马奖”评选结果出炉。中化国际荣获金骏马“最具社会责任上市公司”奖。“最具社会责任上市公司奖”主要表彰新时代资本市场上持续履行社会责任的杰出企业。中化国际作为国家“一带一路”国际合作倡议的先行者,沿“一带一路”国家和地区深入践行了大量社会责任,是中国国家化企业履行社会责任的典型代表。

3 建立模型

3.1 样本采集

为预测6#煤层顶板砂岩的富水性,将研究区进行剖分,并统计了每个预测单元的砂岩厚度(X1)、泥岩厚度(X2)、浆液漏失量(X3)、岩芯采取率(X4)、断层强度(X5)和断层密度(X6)6个预测指标,选取具有代表性样本共30组,其中22组作为训练样本,其余8组作为待预测样本(编号加上标“*”标出)。煤层顶板砂岩富水性(R)分为3个等级,即较弱(Ⅰ)、中等(Ⅱ)和较强(Ⅲ)3类,见表1。

3.2 数据预处理

2)离散化

传统课堂课堂中,教师对学生的影响其实仅仅出现在课堂内,下课之后基本上学生都是以自主学习为主。学生需要完成教师布置的家庭作业,但是这个过程基本处于教学真空状态,如果遇到问题只能自己想办法解决。从图中可以看出,传统课堂的教学模式中,师生互动基本处于真空状态,教学过程也仅仅停留于课堂之中。

 

表1 煤层顶板砂岩富水性样本

  

序号X1/mX2/mX3/(m3·h-1)X4/%X5/MPaX6/(条·m-2)R10.4750.5890.8640.0140.00130.111Ⅲ20.7040.3980.2010.2150.00030.111Ⅲ30.2960.8180.5430.0720.00080.333Ⅲ40.5210.1710.7180.0520.00110.111Ⅲ50.1800.3170.7070.09800Ⅲ60.1810.5600.7530.34000Ⅲ70.2100.6060.2340.06300Ⅲ80.5160.2370.0650.62400Ⅱ90.5200.5260.0530.78600Ⅱ100.5530.6160.0360.82300Ⅱ110.5270.5810.0410.78900Ⅱ120.5800.2480.0290.82900Ⅱ130.5120.4670.3370.05500Ⅱ140.5160.7000.2360.06100Ⅱ150.5130.1230.6110.04800Ⅱ160.3030.8590.0070.96000Ⅰ170.5950.7950.0470.8170.04400.500Ⅰ180.7860.6020.0350.3260.04600.500Ⅰ190.5750.57300.8180.05200.500Ⅰ200.2090.14901.0000.00200.500Ⅰ210.3830.6350.0040.7880.00200.500Ⅰ220.5300.3640.0270.6290.00400.500Ⅰ23*0.4250.6480.1320.2390.00020.111待测24*0.4450.5850.2440.1510.00040.222待测25*0.5020.1920.0620.61300待测26*0.5180.7110.0470.66200待测27*0.5260.2380.0250.82900待测28*0.4080.1850.0050.93200待测29*0.2530.60001.00000待测30*0.3090.6100.0070.9600.00200.500待测

1)标准化

表2从精确度和时延两方面进一步评估了算法的性能。作为比较,我们测试了其他深度学习模型的性能,比较模型包括一个两层的卷积神经网络(CNN),一个两层的循环神经网络(RNN)以及一个CNN-LSTM混合网络。其中RNN和CNN-LSTM中的LSTM部分的参数设置与表1所列相同;CNN和CNN-LSTM中的CNN部分采用了维度为[1,50]的一维卷积核,其余参数与表1一致。

由于选取的煤层顶板砂岩富水性指标具有不同的量纲和量纲单位,这种情况会影响到数据的分析结果,因此需要进行数据标准化处理。根据以下公式将表1的数据进行标准化处理:

 

(6)

式中:sij是标准化前样本;wij是标准化后样本;min(sj)是原始样本中的最小值;max(sj)是原始样本中的最大值。

由于原样本数据有不同的单位制,各指标在数值上可能相差几个数量级,直接使用原数据进行预测可能丢失信息或引起数值计算的不稳定,因此需要对数据进行处理,以提高模型的预测精度。数据处理步骤如下:

离散化可以有效地克服数据中隐藏的缺陷,减弱极端值和异常值的影响,使模型结果更加稳定。基于熵的方法是最有效的离散化方法之一[20],具体计算公式如下:

 

(7)

在DSP中实现H.264的编码器优化,优化过程主要为4步:算法优化、C代码优化、线性汇编的优化和CCS编译器选项优化[11]。优化过程如图7所示。

在本研究中,部分结构畸形及自然流产胎儿的病例并未行染色体检查分析,而这部分胎儿可能为染色体异常,所以我们把这3种妊娠结局统一归类为不良妊娠结局进行讨论。本研究结果也提示,软指标异常的胎儿不良结局发生率明显高于软指标正常的胎儿。这一结果与之前的研究结果基本一致。

3)属性约简

本文采用DEA和Malmquist指数法对我国区域高技术产业创新效率进行测算。DEA方法适用于多投入与多产出的系统研究,不需要估计生产函数,利用全局数据有效避免指标分散处理的局限性,以决策单元各输入输出的权重为变量,具有较强的客观性;Malmquist生产率指数不要求价格信息及行为假设,并可以分解为技术效率、技术进步和规模效率的乘积;因此,运用Malmquist指数法对我国省级区域全要素生产率指数进行测算是有较大优势的。

属性约简可以有效消除数据之间的信息冗余,减少样本的训练时间,提高样本的预测精度。离散化后的数据进行属性约简,发现第4组、第5组和第6组数据重复,第8组和第9组数据重复,第17组和第18组数据重复,所以删除第4组、第5组、第8组及第17组数据,剩下的18组数据为训练集,其余8组作为测试集。

3.3 相关性分析

将煤层顶板砂岩富水性评价指标,即砂岩厚度、泥岩厚度、浆液漏失量、岩芯采取率、断层强度及断层密度6个指标作为分类模型的输入向量,同时将煤层顶板砂岩富水性等级(较弱、中等、较强)作为分类模型的输出类别属性,各指标之间的关系如图1所示。

  

图1 煤层顶砂岩富水性评价指标之间的关系

由图1可见,煤层顶板富水性较弱与砂岩厚度(属性X1)呈负相关性;与泥岩厚度(属性X2) 呈正相关性;与浆液漏失量(属性X3)呈负相关性;与岩芯采取率(属性X4) 呈正相关性;与断层强度(属性X5)相关性不明显;与断层密度(属性X6)呈正相关性。

煤层顶板富水性较弱—中等与砂岩厚度(属性X1)呈负相关性;与泥岩厚度(属性X2) 呈负相关性;与浆液漏失量(属性X3)呈正相关性;与岩芯采取率(属性X4)呈负相关性;与断层强度(属性X5)呈负相关性;与断层密度(属性X6)呈负相关性。

式中:ei为离散化后的数值;k为不同的类标号数;pij为第i个区间中类j的概率,pij=mij/mi;mi为所划分的第i个区间中值的个数;mij为区间i中类j的值的个数。

煤层顶板富水性较弱—较强与砂岩厚度(属性X1)呈负相关性;与泥岩厚度(属性X2)呈负相关性;与浆液漏失量(属性X3)呈负相关性;与岩芯采取率(属性X4)呈正相关性;与断层强度(属性X5)相关性不明显;与断层密度(属性X6)相关性不明显。

合并重组后新企业的财务管理效率将受到影响,针对这一问题,企业可为财务部门设置数据收集系统,以提升管理效率。例如,企业可在各终端部门设置网络设备,该部门所产生的全部财务信息,将以数据的形式在当日上传至财务部门的数据库。财务部门可在隔日对这部分数据进行整理,并参考以往的数据对上传数据进行审核。通过这样的措施,财务部门可更为高效地获得基层数据。同时财务部门应当统一数据格式,从而使数据统计工作更加便捷。利用这一系统,财务部门将实现全网络化办公。

3.4 建立机器学习算法预测模型

基于BP神经网络、K最近邻分类法、决策树和支持向量机4种模型,分别建立以砂岩厚度、泥岩厚度、浆液漏失量、岩芯采取率、断层强度、断层密度为输入向量的条件属性,煤层顶板砂岩富水性较弱、中等和较强为类别输出向量的决策属性,建立煤层顶板砂岩富水性预测模型。

通过Matlab软件编程实现BPNN预测模型:采用BP神经网络的结构为6-5-4,训练时根据预测误差调整网络权值和阈值;KNN预测模型:建立预测模型predict(KNN.fit);DT预测模型:建立预测模型predict(DT.fit);SVM预测模型:采用径向基(Radial basis function,RBF)核函数作为SVM核函数,建立预测模型predict(SVM.fit)。

3.5 结果分析

将属性约简后的18组作为训练集,剩余8组作为测试集,利用建立的机器学习算法预测模型对测试集进行预测,预测结果见表2。

 

表2 煤层顶板砂岩富水性预测结果

  

序号实际等级各模型预测等级BPNNKNNDTSVM1较强较强较强中等较强2中等中等中等中等中等3中等较弱较强中等中等4较弱较强较弱较强中等5较强较强较强较强较强6中等中等中等中等中等7较弱较弱较弱较弱较弱8较弱较弱中等中等较弱

由表2可知,BP神经网络正确分类的实例是6个,错误的是2个,准确率为75.0%;KNN正确分类的实例是6个,错误的是2个,准确率为75.0%;DT正确分类的实例是5个,错误的是3个,准确率为62.5%;SVM正确分类的实例是7个,错误的是1个,准确率达到87.5%,高于上述其他3种模型。

I=argmax[score(P,C)]

 

表3 预测模型节点错误率

  

预测模型平均绝对误差/%均方根误差/%相对误差绝对值/%相对均方根误差/%BPNN7.8717.6834.1636.29KNN15.5729.6633.0950.52DT23.6124.6251.4860.67SVM5.0616.2411.0333.32

由表3得到各预测模型的误差大小:平均绝对误差,DT>KNN>BPNN>SVM;均方根误差,KNN>DT>BPNN>SVM;相对误差绝对值,DT>BPNN>KNN>SVM;相对均方根错误,DT>KNN>BPNN>SVM。

以桑树坪煤矿为工程研究背景,运用Weka平台,选取4种算法均成功实现了对8组测试集的预测,其中SVM预测准确率为87.5%,高于以上BPNN、KNN和DT预测模型;在节点错误率方面,SVM低于上述其他3种模型。综合考虑,SVM的预测效果较好。为了提高预测准确率,选择学习能力和泛化能力较强的混合核函数对SVM进行优化,建立了煤层顶板砂岩含水层富水性的混合核函数支持向量机预测模型,当λ1=0.05与λ2=0.95时预测准确率达到100%,效果较好。

4 模型优化

SVM预测模型有较强的学习能力,但泛化能力较弱,预测准确率需要进一步提高。将学习能力较强的RBF核函数与泛化能力较强的Sigmoid核函数组合为混合核函数:

KM(x,xj)=λ1tanh(βxTxj)+λ2exp(-γx-xj2)

(8)

式中:(x,xj)为混合核函数KM的内积;λ1为Sigmoid核函数系数;λ2为RBF核函数系数;λ1>0,λ2>0,且λ1+λ2 =1;β为输出权重;T为期望输出,T=,其中H是隐层节点数的输出;γ为核参数。

建立煤层顶板砂岩含水层富水性的混合核函数支持向量机预测模型,对测试集进行预测,结果见图2。

  

图2 模型优化后的煤层顶板砂岩富水性预测结果

运用Matlab软件运行得到混合核函数支持向量机预测模型的预测准确率随着λ1的变化曲线,见图3。

  

图3 预测结果准确率随着λ1的变化曲线

由图2和图3可知,当λ1=0.05,λ2=1-λ1=0.95时,说明混合核函数支持向量机预测模型的学习能力和泛化能力较强,预测准确率达到100%。

5 结语

通过比较可知,SVM预测模型的节点错误率低于上述其他3种模型。综合考虑准确率和节点错误率,SVM的预测效果较好。

我们尽量贴近案例的实际构建一个支付矩阵。如下表所示,参与者为中国联通和中国移动,每个公司有两个可选策略,涨价或者不涨价。

定义3:设信息系统S=(U,A,V,f),A=(a1…an)的分辨矩阵为M(S)=(mij)m×m,mij⊆A,且i, j=1,2,…,m。

参考文献

[1] 熊晓英,刘满才,宋晓梅,等.潘谢矿区煤层顶板砂岩水害分析与防治措施[J].中国煤田地质,2006,18(1):41-44.

[2] 卜庆林,陈成星,杨成超,等.煤层顶板岩层富水性分区指标及其涌水量预测[J].山东科技大学学报(自然科学版),2005,24(3):28-31.

[4] 吴江.分析煤层顶板砂岩含水层富水性单因素[J].中小企业管理与科技(上旬刊),2014(5):222.

[3] 王尚令,孙本魁,洪荒.恒源公司矿井4煤层顶板砂岩裂隙水突水分析及治理[J].矿业快报,2005(11):32-34.

[1][6][11][12][13][14]马克思、恩格斯:《马克思恩格斯选集》第 4 卷,北京:人民出版社,1995 年,第 24、18-22、698、728、701、696 页。

[5] 武旭仁,魏久传,尹会永,等.基于模糊聚类的顶板砂岩富水性预测研究——以龙固井田为例[J].山东科技大学学报(自然科学版),2011,30(2):14-18.

[6] 刘德民,连会青,韩永,等.基于概率神经网络的煤层顶板砂岩含水层富水性预测[J].煤炭技术,2014,33(9):336-338.

[7] 彭涛,宣良瑞,张海潮,等.卧龙湖煤矿砂岩含水层富水性预测及评价[J].煤矿安全,2014,45(8):199-202.

[8] 任智德,吕玉广,郑纲.利用脆性岩石含量指数预测裂隙型含水层富水区[J].煤田地质与勘探,2011,39(4):35-38.

[9] 张文泉,李加祥,张红日,等.兴隆庄煤矿3煤顶板岩层富水性分区[J].煤田地质与勘探,2000,28(4):53-56.

[10] 崔雪丽.综采顶板砂岩富水性多元信息预测模型与应用[D].徐州:中国矿业大学,2014.

[11] WANG W,CHENG Y P,WANG H F,et al.Fracture failure analysis of hard-thick sandstone roof and its controlling effect on gas emission in underground ultra-thick coal extraction[J].Eng-ineering Failure Analysis,2015,54(10):150-162.

[12] 卜庆林,陈成星,杨成超,等.煤层顶板岩层富水性分区指标及其涌水量预测[J].山东科技大学学报(自然科学版),2005,34(3):28-31.

碾压混凝土施工技术的动态控制是指在大坝施工的过程中,通过合理的控制气温、湿度等来减少降雨、日照对大坝施工产生的影响。另外,在混凝土的碾压施工、养护施工过程中也要进行有效的动态控制管理,确保每一个施工环节的质量,提升大坝施工效果。

[13] GHOLAM H.Mineralogy and geochemistry of the Jurassic coals from the Gheshlagh mine[J].Eastern Alborz.Journal of Economic Geology,2015,7(2):369-383.

[14] 张庆国,张宏伟,张君玉.一种基于k最近邻的快速文本分类方法[J].中国科学院研究生院学报,2005(5):554-559.

[15] BUDAK C.A.Removal of impulse noise in digital images with naive bayes classifier method[J].Turkish Journal of Electrical Engineering & Computer Sciences,2016,24(4):2717-2729.

[16] 冯少荣.决策树算法的研究与改进[J].厦门大学学报(自然科学版),2007(4):496-500.

[17] 张宏伟,鹿广利,徐路,等.支持向量机在煤与瓦斯突出预测中的应用[J].矿业安全与环保,2013,40(2):55-58.

[18] 王志辉,舒服华.改进的支持向量机在煤矿安全评价系统中的应用[J].矿业安全与环保,2007,34(1):82-84.

[19] DEMIDOVA L.Intellectual Approaches to Improvement of the Classification Decisions Quality on the Base of the SVM Classifier[J].Procedia Computer Science,2017,103:222-230.

[20] 谭旭,唐云岚,陈英武.基于粗糙集的区间型数据离散化算法[J].系统工程理论与实践,2009,29(6):157-165.

其次,消费社会环境的变化。就像鲍德里亚所指出的那样:“要成为消费的对象,物品必须成为符号。”[26]媒介的更替、信息的爆炸,壮拳也由原来实实在在身体技术升腾为文化符号,表现出由“物”至“符号”的抽象而系统化过渡。桂西壮拳随着时间的推移由格斗技术与宣泄手段到成为教材上图片与文字的教育资本的流变与由壮人组成的消费社会环境的变迁息息相关。

 
张良良,石永奎,李俊勇
《矿业安全与环保》 2018年第02期
《矿业安全与环保》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号