地震预测包括预测震级、震中心位置以及发生时间[1]3个要素, 因此地震预测要解决的问题就是预测在某个区域、某段时间、某个震级范围的地震是否发生, 其本质上是一个二分类问题。目前, 多数地震预测相关的研究都关注大区域, 但是大区域不同地区的地质结构可能存在较大差异, 因此地震发生的频率和震级可能有很大不同, 而很多地震指标与目标区域的地质结构相关, 单一地震事件难以代表整个大区域的地震情况。于是, 一些学者采用区域分割的方式对大区域进行分割, 再针对子区域进行预测[2-3]。然而, 这些研究在进行区域分割之后, 仍然采用单一的分类方法进行地震预测, 且未能由子区域的预测结果得出大区域的预测结果。由于不同子区域地质条件不同, 地震分布状况也不尽相同, 采用单一模型难以在所有子区域都达到较好的预测效果, 因此本文采用多种分类方法对子区域进行地震预测, 并通过子区域的预测结果计算大区域的地震发生情况。
神经网络能够处理复杂非线性关系, 是地震预测的一种重要方法[4]。但是, 神经网络需要大量的训练数据集, 否则容易出现过拟合的问题[5], 而地震数据, 尤其是可用的大地震数据相对较少。危险理论从自身状态出发, 通过判断输入信号是否对机体造成危险进而判断是否为危险信号。该方法的一个优势是没有训练过程, 不需要训练集, 但是当数据量较大时, 处理时间相对较长。因此, 本文提出一种混合型算法, 同时采用反向传播神经网络(Back Propagation Neural Network, BPNN)算法和危险理论的树突状细胞算法(Dendritic Cell Algorithm, DCA)对区域分割后的小区域分别进行建模, 并将子区域的结果整合为大区域的预测结果。
1 研究现状由于地震预测本质上是一个二分类问题, 因此有许多分类方法适用于地震预测。文献[6]利用K-means算法对智利震级大于4.4的地震进行预测。文献[7]通过贝叶斯网络来分析地震事件之间的联系进而达到预测效果。文献[8]采用BP神经网络对滇西南地区进行地震预测。文献[9]基于多种神经网络模型对东京未来7天内是否有大于等于5.0震级的地震发生进行预测。文献[10]采用支持向量机和混合神经网络进行地震预测。神经网络由于能够处理复杂的非线性关系, 因此在面对指标众多且关系复杂的地震预测问题时, 比其他分类方法表现得更好[9]。但是, 神经网络需要有大量的数据集进行训练才能得到令人满意的效果, 对于地震数据量较小的地区, 预测效果较差。
人工免疫系统是受人体免疫系统的启发而产生的人工智能方法, 其核心是区分自我和非我的SNS(Self/Non-Self)理论[11]。文献[12]将这种理论应用于地震预测, 但是这种区分自我和非我的理论无法识别自身的有害物质和非自身的有益物质, 随后有学者提出危险理论。危险理论并不区分自我和非我, 只区分危险信号。它从系统自身状态出发, 通过判断输入的信号是否对机体造成损伤来甄别有害信号[13-14]。基于危险理论提出的DCA算法[15]以树突状细胞(Dendritic Cell, DC)为核心, 通过树突状细胞的迁移过程来判断输入信号是否属于有害信号。由于DCA是先天性免疫的算法, 无需训练即可发挥作用, 因此其非常适合于地震预测这种数据集较小的应用领域。
当目标区域较大时, 对整个区域进行建模会影响模型的精度, 因此, 部分学者采用将大区域划分成小区域的方式对模型进行调优。文献[2]通过将南加州划分成6个区域, 并分别对每个区域采用神经网络进行建模以提高预测精度。文献[3]将智利划分为4个区域来进行地震预测。上述文献均采用单一神经网络方法对子区域进行地震预测, 未能预测整个大地区的地震情况。由于不同子区域地震分布状况可能有较大差异, 采用一种方法难以描述所有子区域的地震情况, 因此本文在区域分割的前提下, 采用BP神经网络和DCA结合的算法来对整个大区域的地震进行预测。
2 算法介绍本文算法主要分为3个阶段:第1阶段进行数据预处理, 将目标区域分割成小区域, 并分别计算每个小区域的地震指标; 第2阶段进行小区域处理, 分别对每个小区域采用BPNN和DCA进行建模, 并对2个模型的预测结果进行对比, 选择结果较好的方法作为该小区域的预测模型; 第3阶段是合并阶段, 根据小区域的预测结果为每个区域分配权重, 由此来计算整个目标区域的地震发生情况。
2.1 预处理阶段预处理阶段分为2步:第1步是对大区域进行分割, 文献[2-3]通过经纬度划分子区域并取得较好结果, 本文也采用经纬度划分的方式, 将四川省划分为4个子区域; 第2步是计算每个子区域的地震指标, 本文采用文献[16]提出的8个地震指标, 具体见表 1, 特征指标矩阵如下:
![]() |
下载CSV 表 1 地震指标描述 |
$ \boldsymbol{F}=\left\{T, M_{\mathrm{mean}}, d E^{1 / 2}, b, \eta, \Delta M, \mu, c\right\} $ | (1) |
树突状细胞算法通过采集、分析树突状细胞对抗原, 即输入信号, 判断其是否为危险信号。该算法主要分为3个阶段, 如图 1所示。
![]() |
Download:
|
图 1 树突状细胞算法流程 |
具体分析如下:
1) 初始化阶段
初始化阶段的主要工作是初始化DC池、抗原向量、权值矩阵、迁移阈值等。其中, 抗原向量是由8个地震特征指标映射而来, 包括3个信号分量, 分别是病原体相关分子模式(Pathogen-Associated Molecular Pattern, PAMP)、安全信号(Safe Signal, SS)和危险信号(Danger Signal, DS)。
2) 抗原处理阶段
抗原处理阶段是指DC细胞从组织中获取抗原, 并采用加权平均的方式对抗原的PAMP、SS、DS信号进行计算, 如式(2)所示, 输出csm、mat和semi信号。通过这3个输出信号来判断DC是否迁移。如果csm达到阈值, 该DC将会发生迁移, 然后比较semi值和mat值的大小, 若semi值较大, 则该DC为半成熟状态, 若mat值较大, 则该DC为成熟状态。
$ C_{[\mathrm{csm}, \mathrm{mat}, \mathrm{semi}]}=\frac{\left(W_{\mathrm{P}} \cdot C_{\mathrm{P}}\right)+\left(W_{\mathrm{S}} \cdot C_{\mathrm{S}}\right)+\left(W_{\mathrm{D}}+C_{\mathrm{D}}\right)}{\left|W_{\mathrm{P}}\right|+\left|W_{\mathrm{S}}\right|+\left|W_{\mathrm{D}}\right|} $ | (2) |
3) 分类阶段
抗原处理结束之后, 进入抗原分类阶段。该阶段将计算每个抗原的成熟环境抗原值(Mature Environment Antigen Value, MCVA), 计算过程如式(3)所示。
$ M C A V=\frac{A_{m}}{A_{m}+A_{s}} $ | (3) |
其中, Am表示成熟的DC数量, As表示未成熟的DC数量, 通过比较MCAV值与阈值的大小得到抗原状态。若MCAV值大于阈值, 则该抗原为异常抗原, 即发生地震, 反之则为正常抗原, 不发生地震。
2.2.2 BP神经网络BP神经网络是一种经典的基于非线性微分函数来进行训练的前馈神经网络。它由输入层、隐含层和输出层构成, 每一层又由多个神经元组成[17]。同一层的神经元之间相互独立, 但是前一层的神经元会通过加权运算对后一层神经元产生影响, 如图 2所示。在BP神经网络中, 除了信号从输入层正向传播外, 在计算出输出结果之后, 还要将结果误差从输出层进行反向传播, 由此调节权值和偏差。
![]() |
Download:
|
图 2 神经网络模型 |
在每个子区域确定最适合的预测方法之后, 采用加权和的方式计算整个地区的地震发生概率。本文将每个地区的预测准确率作为评价标准来计算每个区域的权重, 计算过程如式(4)所示。
$ {W_i} = \frac{{{B_i}}}{{\sum\limits_j^n {{B_j}} }} $ | (4) |
其中, B表示子区域的预测准确率, W为该区域的权重。
整个地区的地震发生概率计算如式(5)所示。
$ P = \sum\limits_i^n {{P_i}} {W_i} $ | (5) |
其中, P为发生地震的概率。P大于阈值即表示该地区将发生指定震级范围的地震, 否则不发生地震。
2.4 评价指标本文采用4个统计学指标来衡量模型的预测效果, 分别是检测概率(POD)、误报率(FAR)、准确率(ACC)和R得分。其计算公式如下:
$ P O D=\frac{N_{\mathrm{pc}}}{N_{\mathrm{pc}}+N_{\mathrm{ni}}} $ | (6) |
$ F A R=\frac{N_{\mathrm{pi}}}{N_{\mathrm{pc}}+N_{\mathrm{pi}}} $ | (7) |
$ A C C=\frac{N_{\mathrm{nc}}+N_{\mathrm{pc}}}{N_{\mathrm{nc}}+N_{\mathrm{ni}}+N_{\mathrm{pc}}+N_{\mathrm{pi}}} $ | (8) |
$ R=P O D-F A R $ | (9) |
其中, Npc表示实际发生了达到阈值的地震且被预测成功的次数, Npi表示实际发生了达到阈值的地震, 但未被预测到的次数, Nnc表示实际未发生达到阈值的地震, 且与预测结果一致的次数, Nni表示实际未发生达到阈值的地震, 但与预测结果不同的次数。POD值越高, 表示地震被检测到的概率越高, 模型的预测效果就越好。FAR值越小, 表示地震漏报的概率越低。ACC值越大, 表示整体准确率越高。R得分的值在-1~1之间, R值越大, 表示预测的精度越高, 预测效果越好。
除以上4个指标外, 本文还采用受试者工作特征曲线(Receiver Operating Characteristic curve, ROC)来直观地展示预测效果[18], 并计算ROC曲线下面积(Area Under ROC Curve, AUC)值来定量标识算法的分类效果。AUC值为0.5表示该分类算法的分类效果与随机分类相同; AUC值为1表示分类准确率为100%;当AUC值介于0.5~1之间时, 其值越大表示分类效果越好。
3 实验结果与分析 3.1 数据预处理数据预处理主要是对数据进行分类并计算地震特征指标。本文数据资料来源于中国地震台网, 根据1990年1月—2016年12月发生于四川省震级在4.0以上的地震数据, 对未来一个月是否会发生震级在4.5以上的地震进行预测。数据信息包括:地震发生时间, 震级大小, 震中心位置的经纬度。
预处理的第1步是对整个四川省的地震数据按照区域进行分割。本文按照经纬度将四川省划分为4个区域, 分别命名为1区、2区、3区和4区, 其对应的经纬度信息如表 2所示。按照表 2所示的区域范围, 将整个四川省的地震数据分为4类, 部分数据如表 3所示。
![]() |
下载CSV 表 2 子区域及其对应的经纬度 |
![]() |
下载CSV 表 3 按区域分类后部分数据展示 |
对数据进行分类之后, 根据第2.1节中的地震指标计算每个子区域从1990年1月—2016年12月的共312条地震指标数据, 表 4给出1区的部分地震指标数据。
![]() |
下载CSV 表 4 1区部分地震指标数据 |
在得到每个区域的地震指标数据之后, 采用基于危险理论的预测方法和神经网络方法对这些指标数据进行预测和对比, 采取结果较好的模型作为该地区的最佳预测模型。
在采用基于危险理论的地震预测方法时, 首先要将地震指标映射为抗原向量, 即计算每条地震指标的PAMP、SS和DS信号值。1区部分地震数据的处理结果如表 5所示。
![]() |
下载CSV 表 5 1区危险理论预处理的部分数据 |
在每个区域内采用DCA算法和BPNN算法进行预测, 并对每个算法进行调优, 结果如图 3~图 6所示。从图 3和图 4可以看出, 在1区和2区, DCA算法的实验结果比BPNN算法要好, POD和R得分的值均高于BPNN算法, 所以对于这2个区域, 采用DCA算法预测效果更好。而在图 5和图 6中, BPNN算法的POD、ACC和R得分的值都比DCA算法高, 说明在3区和4区更适合采用BP神经网络算法进行地震预测。
![]() |
Download:
|
图 3 1区内2种算法的地震预测结果对比 |
![]() |
Download:
|
图 4 2区内2种算法的地震预测结果对比 |
![]() |
Download:
|
图 5 3区内2种算法的地震预测结果对比 |
![]() |
Download:
|
图 6 4区内2种算法的地震预测结果对比 |
本文采用DCA与BPNN的混合算法, 将本文算法的结果与单一使用的DCA算法和BPNN算法进行对比, 结果如表 6所示, 其中本文算法采用的阈值为0.7。
![]() |
下载CSV 表 6 3种算法的地震预测结果对比 |
由表 6可以看出, 本文算法的POD、ACC、AUC和R得分值均高于其他2种算法, 同时从图 7的ROC曲线可以看出, 本文算法的分类效果整体要比其他2种算法好。以上结果表明, 本文算法可有效改善地震预测效果。
![]() |
Download:
|
图 7 3种算法地震预测的ROC曲线 |
本文提出一种基于区域分割的地震预测算法。在对大区域进行分割之后, 分别采用BPNN算法和DCA算法对小区域建模, 并选出最适合该区域的预测算法, 最后通过子区域的结果计算整个大区域的地震发生情况。实验结果表明, 该混合算法的预测效果比单一算法效果好。然而, 本文目前只采用2种分类算法, 下一步将增加预测算法种类, 以进一步提高预测精度。
[1] |
WYSS M, BOOTH D. The IASPEI procedure for the evaluation of earthquake precursors[J]. Geophysical Journal International Banner, 1997, 131(1): 423-424. ( ![]() |
[2] |
PANAKKAT A, ADELI H. Recurrent neural network for approximate earthquake time and location prediction using multiple seismicity indicators[J]. Computer-Aided Civil and Infrastructure Engineering, 2009, 24(4): 280-292. DOI:10.1111/j.1467-8667.2009.00595.x ( ![]() |
[3] |
REYES J, MORALES-ESTEBAN A, MARTÍNEZ-ÁLVAREZ F. Neural networks to predict earthquakes in Chile[J]. Applied Soft Computing Journal, 2013, 13(2): 1314-1328. ( ![]() |
[4] |
SHODIQ M N, KUSUMA D H, RIFQI M G, et al. Neural network for earthquake prediction based on automatic clustering inindonesia[J]. International Journal on Informatics Visualization, 2018, 2(1): 1-7. DOI:10.30630/joiv.2.1.33 ( ![]() |
[5] |
陶砾, 杨朔, 杨威. 深度学习的模型搭建及过拟合问题的研究[J]. 计算机时代, 2018(2): 14-17. ( ![]() |
[6] |
FLORIDO E, MARTÍNEZ-ÁLVAREZ F, MORALES-ESTEBAN A, et al. Detecting precursory patterns to enhance earthquake prediction in Chile[J]. Computers and Geosciences, 2015, 76(C): 112-120. ( ![]() |
[7] |
ZHANG Ya, ZHAO Hai, HE Xuan, et al. Bayesian prediction of earthquake network based on space-time influence domain[J]. Physica A:Statistical Mechanics and Its Applications, 2016, 445: 138-149. DOI:10.1016/j.physa.2015.11.006 ( ![]() |
[8] |
徐程, 邹金慧. BP神经网络在地震预测中的应用研究[J]. 自动化仪表, 2012, 33(6): 12-14. DOI:10.3969/j.issn.1000-0380.2012.06.004 ( ![]() |
[9] |
ASENCIO-CORTÉS G, MARTÍNEZ-ÁLVAREZ F, TRONCOSO A, et al. Medium-large earthquake magnitude prediction in Tokyo with artificial neural networks[J]. Neural Computing and Applications, 2017, 28(5): 1043-1055. DOI:10.1007/s00521-015-2121-7 ( ![]() |
[10] |
ASIM K M, IDRIS A, IQBAL T, et al. Earthquake prediction model using support vectorregressor and hybrid neural networks[J]. PLoS One, 2018, 13(7): 1-8. ( ![]() |
[11] |
BHATTACHARYA S. Artificial immune system research in the past years-an overview of existing methods, new initiatives and applications in intrusion detection systems[J]. IOSR Journal of Electrical and Electronics Engineering, 2014, 9(6): 20-30. DOI:10.9790/1676-09622030 ( ![]() |
[12] |
阮海贵, 谭毅华, 鹿明明, 等. 神经网络的粒子群优化算法及其在地震预测中的应用[J]. 计算机与数字工程, 2013, 41(2): 155-157. DOI:10.3969/j.issn.1672-9722.2013.02.001 ( ![]() |
[13] |
STRIKWERDA C.The danger theory and its application to artificial immune systems[EB/OL].[2018-07-01].https://arxiv.org/ftp/arxiv/papers/0801/0801.3549.pdf.
( ![]() |
[14] |
SUNUSI N, DARWIS S, TRIYOSO W, et al. Study of earthquake forecast through hazard rate analysis[J]. International Journal of Applied Mathematics and Statistics, 2010(10): 96-103. ( ![]() |
[15] |
GREENSMITH J, AICKELIN U. The dendritic cell algorithm[J]. Revista Clínica Española, 2007, 202(10): 552-554. ( ![]() |
[16] |
PANAKKAT A, ADELI H. Neural network models for earthquake magnitude prediction using multiple seismicity indicators[J]. International Journal of Neural Systems, 2007, 17(1): 13-33. DOI:10.1142/S0129065707000890 ( ![]() |
[17] |
ZHOU Feiyan, ZHU Xiaofeng. Earthquake prediction based on LM-BP neural network[J]. Lecture Notes in Electrical Engineering, 2014, 270: 13-20. ( ![]() |
[18] |
汪云云, 陈松灿. 基于AUC的分类器评价和设计综述[J]. 模式识别与人工智能, 2011, 24(1): 64-71. DOI:10.3969/j.issn.1003-6059.2011.01.008 ( ![]() |