做啥类型网站,xampp可以做网站吗,seo 工具,怎么在百度上发布信息广告LPPN论文阅读笔记
LPPN: A Lightweight Network for Fast Phase Picking
背景 深度学习模型的问题在于计算复杂度较高#xff0c;在实际数据处理中需要面临较高的处理代价#xff0c;且需要专用的加速处理设备#xff0c;如GPU。随着数据累积#xff0c;迫切需要设计一种…LPPN论文阅读笔记
LPPN: A Lightweight Network for Fast Phase Picking
背景 深度学习模型的问题在于计算复杂度较高在实际数据处理中需要面临较高的处理代价且需要专用的加速处理设备如GPU。随着数据累积迫切需要设计一种能够保证精度的轻量化高速震相拾取模型以提高处理海量数据的效率这种模型同时可以方便地部署在设备端。
具有更少的训练参数和轻量级网络在处理大规模数据集所需要轻量级网络保证CPU上的运行效率轻量级网络也减少训练所需要的标记数量嵌入式系统总是需要比较小的内存需求模型轻量级网路的模型尺寸比较小适合嵌入到现场进行地震信号处理LPPN使用深度可分离卷积的优化减少模型参数 提高性能渴求轻量级网络和传统方法相当的拾取精度以及比较高的速度实现
LPPN首先对一小部分的波形的相位类型进行分类然后使用回归输出所需要相位的准确起始时间。该结构使用深度卷积的优化减少了模型参数并且提高性能
模型设计
相位选择包括两个任务相位确定和起始时间选择LPPN完成两个工作确定时间序列小区间的相位类型和选择期望相位的时间分别对应分类问题和回归问题深度神经网络根据从标记波形中学习到的特征来选择相位。特征数量和感受野是影响网络性能的两个重要因素。虽然更多的特征可以更好地描述波形但是也会导致更高的计算成本适当数量有助于不降低性能的情况下提高效率对于地震图可以将感受野视为提取特征的时间窗口长度。接受野是CNN针对输入控件特定特征所关注的区域对于相位选择来自更广泛的感受野的特征可以提高对P/S或噪声的分类可靠性
模型架构 大多数相位拾取网络将输出每一个输入数据点的概率那么LPPN的思路是输出连续的几个点的相位类型概率降低计算成本 首先确定是否存在所需的相位然后选择相位时间 如果输入的地震图长度是T个点LPPN的总下采样率是S那么有T/S概率输出 S是步长每一个输出都是原始波形的一个小片段的概率然后确定它所属的类型。第I个输出代表从Is到is S - 1的S个采样点的概率is是数据采样点的索引对应于时间ti。那么准确的相位到达可能不精确的从ti开始。 分类和回归都是基于从连续T点提取的特征但是输出将减少到由步幅控制的T/S 100HZ 30.71S 采样点是3072,那么采取大约30s的窗口来确保用于特征提取的足够长度。 分类的损失使用交叉熵损失函数回归的损失函数使用均方差损失
LPPN的网络优化
LPPN设计用于在各种设备上运行在训练时可以配置特征数量和步长网络内部也进行优化n代表模型的特征数目特征提取是通过七个CNN块进行的每一个块执行两个任务使用前一个块的特征并执行下采样来减少输出的长度同时它扩展了特征的数量来恢复长度将足够信息传递给下一个层。每一个块包括两个点卷积层和一个深度卷积层形成一个卷积单元来取代传统的CNN卷积层这样的优化将参数数量减少45%特征提取的输出被进一步输入到扩大感受野模块中该模块使用三个下采样层和三个上采样层组成
LPPN的训练与性能评估 对比PhaseNet数据集 使用STEAD数据集 评价指标 预测和标记到达时间之间的时间残差的精度 召回率 平均值 标准差 one-hot向量p [0,1,0] s[0,0,1] 噪声[1,0,0] 真正的P到时位于该段内部表明相位分类是正确的 时间窗口是0.16s 说明窗口有16个点 分段的初始时间t在真正的P时间拾取之前在加上回归模块提供的t之后预测的P时间更加接近真实的P时间 LPPN 可以使用不同的步长来节省内存占用并且加快相位拾取但是较大的步长也会演唱回归的时间窗口可能会导致比较低的精度 测试发现步长为16的中等模型可以在模型性能和计算成本方面提供平衡的配置 对于所有模型精度和召回率都随着信噪比的增加而增加并且对于高信噪比差异较小。对于低信噪比的波形所有模型都表现出比较差的性能但是参数比较多、步幅比较小的模型通常比其他模型更好表明LPPN模型更适合处理期望比较低的SNR波形数据
讨论
LPPN是从目标检测模型修改来处理地震波形的。LPPN只输出S个连续点的一个概率来预测相位类型而不是每个输入点的输出概率。可训练参数的数量表示模型的大小内存需要存储这些参数那么较大的步幅将减少内存需求当模型被训练并且应用于真实的数据集之后模型的性能会下降可以通过添加一些局部样本通过迁移学习提高性能
STanford EArthquake Dataset (STEAD): A Global Data Set of Seismic Signals for AI
斯坦福地震数据集
局部地震波形350km地震内没有地震信号的地震噪声波形地震通常由配备一个垂直和两个正交水平传感器的三分量一起记录第一个到达的脉冲是P波地震并不是产生地震波的唯一来源。尽管有数百TB的存档地震波形数据和数千万个人类拾取参数可用但还没有存在用于地震波形的大型高质量标记基准数据集每个模型都使用不同的数据集进行训练和演示其性能。在没有标准基准的情况下作者设置了自己的评估性能标准。这抑制了进展因为它很难确定每种方法的相对性能以及优缺点