admin 管理员组

文章数量: 1086019


2024年3月14日发(作者:len函数与lenb函数的应用)

第20卷 第5期

2022年9月

中国水利水电科学研究院学报(中英文)

JournalofChinaInstituteofWaterResourcesandHydropowerResearch

Vol.20 No.5

,2022September



----

文章编号:2097096X(2022)05043811

大规模降雨监测数据异常识别方法

,2,2,2,2

田济扬

,刘含影

,刘荣华

,丁留谦

,刘 宇

(1.中国水利水电科学研究院,北京 100038;2.水利部防洪抗旱减灾工程技术研究中心,北京 100038)

摘要:为实现大规模降雨监测数据的异常识别和快速处理,基于Hampel法、格拉布斯准则、周边测站分析法和

--

雷达辅助校验等方法,建立了递进式异常站点筛查体系,通过Kdtree(Kdimensiontree)高级数据结构和并行计

算方法提高计算效率,并以福建省5234个具有雨量监测功能的地面站2015—2021年雨量数据进行了验证,结果

表明福建省地面站雨量监测数据质量逐年提升;各类测站中,雨量站异常站点占全部异常站点的比例最高,各类

异常站点在全省相应类型站点中,雨量站异常站点的占比也最高;雷达辅助校验能够有效解决在雨区与非雨区边

0%左右,校验后界、雨强差异较大的雨区边界的正常站点易被误判为异常值的问题,校验前异常识别准确率为9

准确率提高为95%左右。通过Kdtree和并行计算,全省测站完成一次异常识别需约5~8min,为大规模降雨监

测数据异常识别、充分利用雨量监测站有效信息提供可靠的方法。

关键词:Hampel法;格拉布斯准则;周边测站分析法;雷达校验;异常识别

                 

中图分类号:P426.62文献标识码:Adoi:10.13244?j.cnki.jiwhr.20210239

1 研究背景

降雨监测是水文监测的重要组成部分,是暴雨洪水灾害防御工作的耳目和参谋

[12

。21世纪以

来,水利部门加大了对自动监测站建设的支持力度,特别是经过山洪灾害防治项目建设,全国山洪灾

害自动监测站点达13.2万个,自动雨量站网平均密度为38km?站,是2006年(6000站)的22倍,最小

报汛时段缩短到10min,数据信息量增加100余倍,极大地缩小了降雨监测盲区,有力支撑了水旱灾害

。但由于部分测站建设标准偏低,位于山丘区的测站运维困难,数据质量难以得到保障,防御工作

[35

常常出现冒大数、缺测、漏测等情况,且测站出现问题具有很强的随机性,完全抛弃某一测站不切实际。

为使所有测站的监测数据得到有效利用,需从众多雨量监测站中找出不同时段内监测数据准确的

站点,剔除数据质量存在问题的站点。目前常用的异常站点识别方法有Hampel法、肖维勒准则、格

拉布斯准则、Kmedoids聚类法、离群点监测等。Person等

[6

提出了Hampel过滤方法,用中位数和中

位绝对偏差代替对异常点敏感的平均数和标准差,使异常数据处理更有效。肖维勒准则的置信概率偏

低,且概率分布不均匀,对异常数据的剔除存在误判的可能性

[7

。格拉布斯准则适用于样本数量在

[3,100]区间的异常数据判别

[8

。在逐时雨量异常数据判别时,聚类分析契合了逐时降雨数据量大且

变异性强的特点,但数据离散程度较大且区段划分具有极强的主观性

[9

。离群点检测的优点是无需知

道数据集的分布模型和分布参数,适用于存在某种距离度量手段的任何维度特征空间,其缺点是需要

0]

进行大量的距离计算与比较,对计算资源要求高

[1

业务应用对异常站点识别方法的高效性、稳定性和可靠性均提出很高的要求。本文以福建全省雨

ampel法、格拉布斯准则及周边测站法等方法建立起递进式异常站点筛查体系,量监测站为例,基于H

--

并引入Kdtree(Kdimensiontree)高级数据结构和并行计算提高计算效率,以期为异常站点的快速识

----

收稿日期:20210928;网络首发时间:20220719

网络首发地址:https:??kns.cnki.net?kcms?detail?10.1788.TV.20220719.1401.002.html

基金项目:国家自然科学基金项目(51909274);国家重点研发计划项目(2019YFC1510605);中国水科院五大人才计划项目

JZ0199A022021)(

--

作者简介:田济扬(1989),高级工程师,主要从事暴雨洪水预报工作。Email:tjyshd@126.com

—438—

Copyright©博看网. All Rights Reserved.

别、控制雨量监测数据质量提供参考。

2 研究区与数据

福建省位于我国东南沿海,山丘区面积占80%以上,且气象条件复杂多变,受台风影响较大,暴

。为有效应对强降水及其可能带来的洪涝灾害,福建在全省范围内建设了大量的雨雨洪涝灾害频发

[5

量监测站,站网密度达到25km?站,居全国前列。研究选用雨量监测站的数据来源于福建省水利厅。

020年的统计数据,福建全省发挥雨量监测作用的各类雨量监测站5234个,其中雨量站、河道按照2

水文站、水库水文站、河道水位站个数分别为3268、119、1176、671,测站分布如图1所示。气象部

0min,其余各类测站报讯时间间隔多为1h。为便于异常站点识别,门雨量监测站报讯时间间隔为1

研究采用的雨量监测数据时间间隔统一为1h。自2010年山洪灾害防治项目实施以来,福建省雨量监

测站数量迅速增加,至2015年数量基本稳定,后续每年仍有新建测站,但数量较少,大部分为更新

改造。因此,研究选用福建全省雨量监测站降雨数据的时间序列为2015—2020年。

3.1 初步判定基准站

3.1.1 Hampel法 Hampel法可用于异常极端值的判别,其基本原理是对给定的数据集假设一个分布

113]

。基于长序列测站的年雨量值,和概率模型,然后根据假设采用不一致检验对数据系列进行处理

[1

利用Hampel法对单一测站监测数据的异常年份进行识别,方法如下:

MeXdian

MAD

0.6745

()

(1)

式中:X为数据序列X中的某一值;Median为X的中位数;MAD(medianabsolutedeviation)为数据集Y

e的中位数;X

{x,x,…,x,是测站年降雨量数据序列;Y

{y,y,…,ydian,

12n

12n

}{

1xdian,…,xdian}。当Z(i,2,…,n)值大于2.24时,则判定X为异常点,i为该测站

ii

4]

的异常年份

[1

。但考虑到大量测站建设年代较近,数据序列较短,仅通过Hampel法从时间维度上判

定测站监测数据的异常年份,可靠性还不够。

3.1.2 改进的格拉布斯准则 格拉布斯准则适用于测量次数较少的情况(3<100),可一次性求出

多个异常值。其基本原理是判断可疑值取舍的过程中,将正态分布中平均值和方差这两个最重要的参

517]

。考虑到本文单站年累积雨量的时间序列较短,为了提高异常值判数引进来,提高判断的准确性

[1

定的准确性,需借助周边测站从空间维度再做判断,格拉布斯准则判别法较为适用。改进的格拉布斯

8]

准则是将原准则公式中的平均值用中位数代替,可有效消除同侧异常值的屏蔽效应,更为稳健

[1

。具

体方法如下。

先将通过Hampel法初步判定为某年异常的测站选出,在其周围以20km为半径划定区域,区域

内测站约50个左右,区域内所有站点的年雨量值构成样本,通过从小至大排序为样本序列X

(x,

x,…,x),统计临界系数G(a,n)的值G(查临界值表获得),a为显著性水平,本文取a为0.05,

2n0

并计算G、G:

1n

Gx)?

σ

)G?

σ

式中:n为测站数量;X

为样本中位数;

σ

为标准差。

若G且G>G,则判定x为异常值并予以剔除;若G且G>G,则x为异常值并予以剔

1n101n1n0n

除;若G<G且G<G,则不存在异常值。若存在异常值,则剔除之后用剩余站点的年雨量值重新计

10n0

算,重复上述步骤,直到无异常值为止。

为提高计算效率,缩短判断待评估测站与周边站点距离关系时程序的运行时长,在使用格拉布斯

准则对疑似异常站点进行判断时,根据面积、测站分布、降雨空间分布情况等因素,将福建省分为7

920]

个区域,程序在查找20km范围内测站时,仅在其中一个区域内查找

[1

。已经判断为异常的测站在

(2)

(3)

后续判别待测站时不作为周边测站参与比较,减少部分异常值对判别效果的不良影响。通过Hampel

法和格拉布斯准则共同判断后,则完成基准站初步判定。

3.2 周边测站分析 采用周边测站分析时,优先选用基准站与待评估测站进行同时段雨量比较,基准

站距离较远的(超过某一阈值),则选用距离待评估测站较近且经基准站评估后已确定为正常站点的非

基准站,与待评估测站进行同时段雨量比较。为了避免初步确定的基准站在某一时刻降雨监测出现问

题,在采用基准站评估待评估测站时,待评估测站也包括基准站。通过比较待评估测站雨量与同时段

周边基准站(或已评估合格的非基准站)的平均雨量,判断待评估测站是否异常。周边测站分析仅对

1h(或3h、6h)雨量超过10mm、12h雨量超过15mm、24h雨量超过25mm的测站进行评估。评估

1h、3h、6h、12h、24h)雨量值与周边站点相应时段的平均雨量值,时分别比较待测站不同时间段(

当雨量值相差超过一个等级时,则判定为异常站点。参考气象部门对降雨等级的划分规范,结合福建

省的降雨特点,将雨量等级划分如表1所示。

—440—

Copyright©博看网. All Rights Reserved.

表1 雨量等级表

等级

小雨

中雨

大雨

暴雨

大暴雨

特大暴雨

雨量?mm

1h

0.1~1.5

1.6~6.9

7.0~14.9

15.0~39.9

40.0~49.9

0.0

3h

0.1~2.9

3.0~9.9

10.0~19.9

20.0~49.9

50.0~69.9

0.0

6h

0.1~3.9

4.0~12.9

13.0~24.9

25.0~59.9

60.0~119.9

20.0

12h

0.1~4.9

5.0~14.9

15.0~29.9

30.0~69.9

70.0~139.9

40.0

24h

0.1~9.9

10.0~24.9

25.0~49.9

50.0~99.9

100.0~249.9

50.0

为选取合适的评估范围,计算距离待评估测站5km、10km、15km、20km、25km、30km时,

待评估测站的周边站点平均数量分别为4个、13个、30个、50个、78个、115个,分析了距离选取对

异常站点识别准确率及计算时长的影响,具体见图3。考虑到福建省雨量监测站网密度约为25km?站,

且准确率在15km时达到最大,计算时长相对适中,故采用周边测站分析时,分析范围的半径设为

15km,分析范围内站点平均数量30个。

图3 距离与计算时长?准确率的对应关系

3.3 雷达辅助校验 经过基准站初步判定和周边测站分析后,已完成异常站点的筛查,但人工校验时

发现,雨区与非雨区边界、雨强差异较大的雨区边界处,报讯正常的测站也容易被误认为异常站点,

因此仍需进一步验证筛查结果。尽管雷达降雨反演的精度受反演算法等因素的影响大,但利用雷达反

射率仍能有效判定雷达探测覆盖范围是否产生降雨或判断降雨量级,能够充分反映某一时段降雨的空

123]

间分布特征

[2

。雷达辅助校验方法包括:一是利用雷达低层仰角反射率超过20dBZ阈值时即发生

降雨的条件,验证雨区与非雨区边界处测站判定结果;二是通过雷达基数据反演降雨强度,并与测站

降雨量级进行对比,验证测站是否异常;三是通过反射率的空间变化梯度,验证雨强差异较大的雨区

边界处测站的判定结果。

3.4 大规模降雨监测数据处理算法 福建省雨量监测站数量多、密度大。为了能够达到实时计算并判

断异常站点的目的,研究采用Kdtree高级数据结构和并行计算方法,大幅提高计算效率。经测试,

全省站点进行一次异常识别,计算时长约5~8min。

--

3.4.1 Kdtree高级数据结构 Kdtree高级数据结构主要用于优化一定范围内周边站点的筛选过程。

Kdtree是对数据点在k维空间(如二维(x,y),三维(x,y,z),k维(x,y,z,…))中划分的一种

--

数据结构。为了能有效的找到最近邻,Kdtree将整个空间划分为几个小部分,且Kdtree索引的空

间划分不会出现区域重叠现象,更适合作为计算环境中的上层全局索引,从而在多维查询过程中快速

425]

发现包含查询结果的局部数据节点

[2

3.4.2 并行计算 针对多个测站同时进行异常值识别这一问题,研究采用CUDA(ComputeUnified

—441—

Copyright©博看网. All Rights Reserved.

DeviceArchitecture)平台,使用支持CUDA的GPU(GraphicsProcessingUnit)进行并行编程,与传统的

GPU相比,CUDA的GPU能获得相比同期CPU(CentralProcessingUnit)高几倍乃至十几倍的提速,大

629]

。该方法是对多个独立站点同时进行异常识别,把来自不同站点的指令在不同的幅缩短计算时长

[2

0]

处理器上同时执行,提高计算效率

[3

。Hampel法和格拉布斯准则所用数据为年尺度,不进行实时计

算,计算量相对较小,对计算的时效性要求不高,仅在格拉布斯准则法分区计算时采用并行算法。周

边测站法所用数据为逐小时降雨数据,数据量大且需要实时计算,对计算的时效性要求很高,因此周

边测站法全程采用并行计算将不同站点分配到不同的处理器进行同时计算。雷达辅助校验的计算量取

决于筛查出的异常站点数量,尽管时效性要求高,但计算量较小,未采用并行计算。

234个,某一时刻站点降雨数据量最多有目前福建全省发挥雨量监测作用的各类雨量监测站5

5234条,以计算量最大的周边测站分析法为例,按分析范围15km计,某一待检测站周边站点降雨数

0条,采用支持CUDA的GPU并行计算可将计算时长控制在5~8min。据约3

4 结果分析

4.1 基准站初步判定结果 经过Hampel法和格拉布斯准则判别法对2015—2020年异常站点进行判定

015年的异常站点数量最多,占比11.5%,之后异常站点逐年减少,至2020年,异常站点数发现,2

量占比仅5.18%。主要原因是汛后逐年加强了测站的运行维护,测站监测数据的质量有所提升。异常

站点中雨量站、水库站的比例偏高,2015—2020年雨量站异常站点在所有异常站点中的占比分别为

42.83%、44.13%、48.25%、47.83%、50.84%、47.97%,水库水文站异常站点在所有异常站点中的占

比分别为35.33%、35.20%、31.88%、29.83%、25.18%、34.69%。分析计算2015—2020年每年各类

异常站点在全省相应类型站点中的占比,发现水库水文站、河道水位站的占比更高,各类异常站点的

,异常站点数量及占比见图6。为检验基准站初步判定结果,将2015—2020年每空间分布情况见图5

年判定的异常站点与实际异常站点进行对比,基准站判定的准确率为95.4%,详见表2,其中异常站

点的类型主要有三种:一是年降雨总量为0的站点(站点不报数);二是年降雨总量远小于周边测站的

站点(站点年内长时期不报数);三是年降雨总量极大且远高于周边测站的站点。典型实例如图7

所示。

4.2 基于周边测站分析的异常站点识别结果 由于每年的基准站会发生一定的变化,因此在周边测站

分析时取前一年的基准站为基准开展周边测站分析,如对2017年逐小时降雨数据进行异常识别时,

016年降雨资料判定的基准站。分别选取2016—2020年每年的6月、7月和8月的1日8选取基于2

点、10日14点、30日20点的异常值识别结果进行人工验证,异常识别正确率绝大多数超过了90%

(见表3)。为进一步验证方法的可用性,以2021年6月27—28日福建全省的雨量监测站进行了异常

站点实时判别,结果如图8和图9所示。

通过周边测站分析法对2021年6月27日和28日的逐小时降雨数据进行判定并选取共计8个时刻

的结果进行统计分析。结果表明6月28日15∶00的异常站点数量最多,占全省站点的11.6%,6月27

日3∶00的异常站点数量最少,占全省站点的3.8%,6月27日和28日21点的异常站点数量均较多,

7日19∶00—21∶00和6月28日9∶00—15∶00降雨范围较广,报讯站较主要原因是福建全省在6月2

多,更容易发现异常站点。对于不同类型测站,雨量站异常站点占全部异常站点比例依然最大,其次

是水库水文站、河道水位站,占比最小的是河道水文站,各类异常雨量监测站的数量情况见图9(a)。

分析计算8个时刻各类异常站点在全省相应类型站点中的占比,发现雨量站、河道水文站的占比相对

较高,具体情况见图9(b)。

经周边测站分析法检测出的异常站点主要分为三类:一是实际发生降雨但未报数(降雨值为0)的

站点;二是雨量值明显小于周边测站的站点;三是降雨值极大且明显高于周边测站的站点(冒大数)。

在三类异常站点中,处于不同等级降雨区域分界处的站点较难识别,典型实例如图10所示。

—442—

Copyright©博看网. All Rights Reserved.

(注:不同标记代表的站点类型参考图1(b)图例)

 2015—2020年异常站点分布图图5

图6 2015—2020年异常站点数量及占比情况

表2 判定异常站和实际异常站点数量

站点数量

判定异常站

实际异常站

2015年

600

689

2016年

392

375

2017年

345

361

2018年

238

248

2019年

274

266

(单位:个)

2020年

271

279

—443—

Copyright©博看网. All Rights Reserved.

(注:图中红色站点为相应类型的异常站点,蓝色柱表示雨量大小,标注数值为降雨量(单位:mm))

图7 异常站点类型

表3 雨量异常值识别正确率

年份

2016

2017

2018

2019

2020

6月

1日8∶00

90

92

91

93

92

10日14∶0030日20∶00

87

90

93

94

91

90

88

92

91

94

1日8∶00

89

90

92

93

92

7月

10日14∶0030日20∶00

86

92

94

95

91

87

94

95

92

94

1日8∶00

91

91

95

92

92

8月

(单位:%)

10日14∶0030日20∶00

90

94

91

94

90

90

91

88

95

92

4.3 异常站点识别结果校验与准确率 经过基准站初步判定和周边测站分析后,已初步完成异常站点

的筛查,但人工校验时发现,处于雨区与非雨区边界、雨强差异较大的雨区边界的正常站点也容易被

判定为异常值,因此仍需借助雷达反射率进一步验证。在2021年6月28日11点的异常结果中选取属

1。尽管通过于这类情况的4个站点,将站点雨量图与雷达回波图叠加进行人工判断,具体情况见图1

上述方法将该4个站点判定为异常,但经过雷达回波图校验发现,10∶00—11∶00,川里村站1h雨量

为0.4mm,光泽西关站1h雨量为1.5mm,枫林村站1h雨量为0.5mm,王村站1h雨量为22.2mm。

—444—

Copyright©博看网. All Rights Reserved.

图9 6月27日、28日4个时刻异常站点数量及占比情况

Copyright©博看网. All Rights Reserved.

—445—

10∶00—11∶00每间隔6min完成一次提扫并获得一次雷达反射率,计算1h内4个站点位置处对应的

雷达反射率均值分别为14dBz、25dBz、27dBz、20dBz。对比雷达反射率和站点小时雨量可知,川里

村站、光泽西关站无异常,枫林村站的雨量值偏小,而王村站的雨量值偏大。

7日19∶00—21∶00和6月28日09∶00—15∶00降雨范围较广,报讯站较考虑到福建全省在6月2

多,所以选择如下6个时刻的异常结果进行雷达回波的校验,具体情况如下表4所示。雷达校验前异

常识别结果的平均准确率为89%,经雷达校验后平均准确率提升至95%,这表明雷达辅助校验方法非

常适用于应对处于雨区与非雨区边界、雨强差异较大的雨区边界的正常站点被错误判断为异常站点的

情况。

表4 6个时刻雷达校验前后福建省雨量监测站异常识别结果准确率

时间

校验前准确率

校验后准确率

2021年6月27日

19∶00

88

94

20∶00

90

95

21∶00

90

93

9∶00

89

96

2021年6月28日

11∶00

89

94

13∶00

90

92

(单位:%)

5 结论

本研究利用福建省5234个雨量站2015—2021年实测降雨资料,基于Hampel法、格拉布斯准则、

周边测站分析法和雷达辅助校验等方法构建了递进式异常站点筛查体系,对降雨监测数据进行了异常

识别。主要结论如下:

(1)基于测站年累积雨量,采用Hampel法和格拉布斯准则对异常站点进行识别,结果表明异常站

点类型主要有测站全年不报数、测站年内长时期不报数、年降雨总量远高于周边测站3类。在2015—

2020年,福建省雨量监测站数据质量不断提升,异常站点数量逐年减少。其中,2015年异常站点数

量最多,占比为11.5%;2020年异常站点数量最少,占比为5.18%。此外,福建省内雨量站和水库数

量较其他类型站点明显偏多,异常站点数量也较其他类型异常站点更多,2015—2020年雨量站异常站

2.83%~50.84%,水库水文站异常站点占全部异常站点比例为25.18%~点占全部异常站点比例为4

35.33%。

(2)采用周边测站分析法对2016—2020年间9个时刻全省雨量监测站进行异常识别,异常识别正

确率超过90%,并以2021年6月27日和28日逐小时降雨监测数据进行了进一步验证,结果表明异常

站点类型主要有实际发生降雨但未报数、明显小于实际雨量、冒大数3类,处于不同等级降雨区域分

界处更难准确识别。当降雨范围较大时,更容易发现异常站点,雨量站异常站点占全部异常站点的比

例最高,各类异常站点在全省相应类型站点中,雨量站异常站点的占比也最高。

(3)通过雷达辅助校验,6个典型时刻的异常识别平均准确率由雷达校验前的89%提升至95%,

表明雷达辅助校验方法非常适用于应对处于雨区与非雨区边界、雨强差异较大的雨区边界的正常站点

被错误判断为异常站点的情况。

4)本研究采用Kdtree高级数据结构和并行计算方法,大幅提高了计算效率。经测试,全省站(

点进行一次异常识别,计算时长约5~8min。

参 考 文 献:

[1] 张继国,谢平,龚艳冰,等.降雨信息空间插值研究评述与展望[J].水资源与水工程学报,2012,23

(1):69,13.

[2] 刘志雨.我国水文监测预报预警体系建设与成就[J].中国防汛抗旱,2019,29(10):2529.

[3] 尚全民,吴泽斌,何秉顺.我国山洪灾害防治建设成就[J].中国防汛抗旱,2020,30(Z1):14.

—447—

Copyright©博看网. All Rights Reserved.

[4] 孙东亚.山洪灾害防治理论技术框架[J].中国水利水电科学研究院学报,2021,19(3):313317.

[5] 张晓蕾,刘荣华,刘启,等.福建省山洪灾害风险识别与定量分析[J].中国水利水电科学研究院学报,

2019,17(4):299304.

[6] 齐敏芳.大数据技术及其在电站机组分析中的应用[D].北京:华北电力大学,2016.

[7] 熊艳艳,吴先球.粗大误差四种判别准则的比较和应用[J].大学物理实验,2010,23(1):6668.

[8] 刘秀林,张行南,方园皓,等.金沙江下游遥测雨量站数据质量研究[J].人民长江,2019,50(3):135

,175.139

--

[9] 夏宁霞,苏一丹,覃希.一种高效的Kmedoids聚类算法[J].计算机应用研究,2010,27(12):45174519.

[10] 杨茂林,卢炎生.基于剪枝的海量数据离群点挖掘[J].计算机科学,2012,39(10):152156.

[11] PEARSONRK.Outliersinprocessmodelingandidentification[J].IEEETransactionsonControlSystemsTech

nology,2002,10(1):5563.

[12] GATHERDU.TheIdentificationofMultipleOutliers[J].PublicationsoftheAmericanStatisticalAssociation,

1993,88(423):782792.

[13] 高倩.鲁棒数据校正理论与应用研究[D].上海:上海交通大学,2007.

[14] 谭克平.极端值判断方法简介[J].台东大学教育学报,2008,19(1):131150.

[15] 焦秀珍,石子烨.基于格拉布斯校验法的陆军模拟训练学员成绩评估方法[J].中国电子科学研究院学报,

2016,11(3):283287.

[16] 林丽芬,肖化,吴先球.肖维勒准则和格拉布斯准则的比较[J].大学物理实验,2012,25(6):8991.

[17] 肖明耀.误差理论与应用[M].北京:计量出版社,1985.

[18] 杨金艳,江曾杰,陈伟.稳健统计与格拉布斯准则在能力验证结果分析中的应用[J].计量学报,2018,

39(6):112117.

[19] 谢晓平,刘光生.近60年来福建省降雨时空分布特征[J].水电能源科学,2020,38(8):58.

[20] 陈晓瑜,孙晓航,黄奇晓,等.1970—2017年福建省降雨侵蚀力的时空变化特征[J].福建农林大学学报:

自然科学版,2021,50(1):125133.

[21] 蒙癤臻,林奕桐,李仕强,等.自动站温度、雨量数据的质量控制方法和应用研究[J].气象研究与应用,

2014,35(1):99103.

[22] 姜明,党岳,李晓波,等.区域自动气象站小时雨量数据质量控制方法研究[J].气象水文海洋仪器,

2015,32(2):6.

[23] 盛志军,马中元,许爱华.自动气象站强降水数据质量控制方法与实践[J].气象水文海洋仪器,2016,

33(1):7985.

[24] 何婧,吴跃,杨帆,等.基于KD树和R树的多维云数据索引[J].计算机应用,2014,34(11):32183221.

[25] 贾宁,马寿峰,钟石泉.基于遗传算法优化和KD树的交通流非参数回归预测方法[J].控制与决策,

2012,27(7):991996.

[26] 邵真天.基于GPU并行加速的实时超声成像系统研究[D].南京:南京大学,2014.

[27] BIRKM,BALZERM,RUITERN,etal.Comparisonofprocessingperformanceandarchitecturalefficiencymet

ricsforFPGAsandGPUsin3DUltrasoundComputerTomography[C]??InternationalConferenceonReconfigurable

Computing&Fpgas.IEEE,2012.

[28] CHENJ,YUA,SOKH.Designconsiderationsofrealtimeadaptivebeamformerformedicalultrasoundresearchusing

FPGAandGPU[C]??FieldProgrammableTechnology(FPT),2012InternationalConferenceon.IEEE,2012.

[29] 张舒,褚艳利.GPU高性能运算之CUDA[M].北京:中国水利水电出版社,2009.

[30] 姚远.计算机系统结构简述[J].计算机光盘软件与应用,2014,17(4):304306.

(下转第463页)

—448—

Copyright©博看网. All Rights Reserved.

ResearchprogressonhydrodynamicmechanismsandsimulationofMicrocystisblooms

YANGYu,ZENGLi,WUYihong,YANGFangyu,LIUFeng,HANRui

(StateKeyLaboratoryofSimulationandRegulationofWaterCycleinRiverBasin,

ChinaInstituteofWaterResourcesandHydropowerResearch,Beijing 100038,China)

Abstract:Microcystisblooms,asoneglobalwaterecologicaldisaster,canintensifythedeteriorationofwater

,affectwatersafety,disruptthebalanceofaquaticecosystems,andthreatenhumanhealth.Thehydrodyquality

Microcystisbloomaresignificantforpreventingandcontrollingrelatedblooms,namicmechanismandsimulationof

whicharethefrontierhotspotsanddifficultiesinthecurrentenvironmentalandecologicalhydraulicsresearch.Pres

entedinthispaperisareviewonthehydrodynamicmechanismandsimulationofMicrocystisblooms,includingthe

biologicalmechanismoftheautonomousmigrationofMicrocystis,theverticalmigrationmechanismofMicrocystis

individualsandcoloniesinstillwater,thehydrodynamicmechanismofMicrocystisaggregationintypicalflowssuch

aswindinducedflowanddensityflow,themethodandapplicationofthenumericalsimulationofthemigrationand

distributionofMicrocystisfromtheperspectiveoftheindividualandcontinuummodels,aswellassomekeyissues

thatneedtobesolvedinfuture.

KeyWords:Cyanobacteria;Microcystis;harmfulalgalblooms;hydrodynamicmechanism;numericalsimulation;

verticalmigration

(责任编辑:祁 伟)

(上接第448页)

Anomalyrecognitionmethodofmassiverainfalldata

1,21,21,211,2

TIANJiyang,LIUHanying,LIURonghua,DINGLiuqian,LIUYu

(1.ChinaInstituteofWaterResourcesandHydropowerResearch,Beijing 100038,China;

2.ResearchCenteronFloodandDroughtDisasterReductionofMinistryofWaterResources,Beijing 100038,China)

Abstract:Toachieveanomalyrecognitionandquickprocessingofthemassiverainfalldata,aProgressive

ScreeningSystem(PSS)isestablishedinthisstudybasedontheHampelmethod,Grubbscriterion,RadarAux

iliaryVerification,andPeripheralStationAnalysisMethod.Meanwhile,theK

dimensiontreeadvanceddata

structureandparallelcomputingmethodarealsoappliedtoimprovethecalculationefficiency.Basedontheestab

,theanomalyrecognitionontherainfalldatafrom5234stationsinFujianProvincefrom2015to2021lishedPSS

areconducted,andtheresultsshowthattherainfalldataqualitiesofthesestationshavebeenimprovedbyyears.

Amongallkindsofstations,theraingaugingstationsaccountforthehighestproportionof5234stationswithab

,themisjudgmentontheabnormalvaluecanbereducedgreatlybyradarauxiliarynormaldata.Itisprovedthat

verification,whichoccursgenerallyattheboundaryofrainfallareasortherainfallareaswithextremevariationof

rainfallintensity.Theaccuracyrateofanomalyrecognitioncanbeimprovedfrom90%to95%byradarauxiliary

,basedonK

dimensiontreeadvanceddatastructureandparallelcomputingmethod,verification.Additionally

theanomalyrecognitionfor5234stationsonlytakes5to8minutes.AlloftheseindicatethatthePSSisnotonly

effectiveonanomalyrecognitionandquickprocessingofmassiverainfalldata,butalsoreliableonextractingvalu

ableinformationfrommassdata.

KeyWords:Hampelmethod;Grubbscriterion;surroundingstationanalysismethod;radarcalibration;anomaly

recognition

(责任编辑:祁 伟)

—463—

Copyright©博看网. All Rights Reserved.


本文标签: 站点 雨量 数据 降雨 进行