一、研究進(jìn)展情況
主要內(nèi)容:
①研究計(jì)劃總體執(zhí)行情況及各子課題進(jìn)展情況;
研究計(jì)劃總體執(zhí)行情況
本項(xiàng)目自啟動(dòng)以來,積極組織相關(guān)領(lǐng)域?qū)<医M建研究團(tuán)隊(duì),成立子課題組,嚴(yán)格按照研究計(jì)劃、內(nèi)容分工扎實(shí)推進(jìn)各子課題研究,定期召開課題研究成果匯報(bào),調(diào)整方向和進(jìn)度。具體進(jìn)展情況如下:
子課題1:氣象災(zāi)害大數(shù)據(jù)的本體構(gòu)建研究進(jìn)展
目前本子課題已經(jīng)完成60%。
1)在分析現(xiàn)有領(lǐng)域本體構(gòu)建方法的基礎(chǔ)上,提出了一種基于形式概念分析(FCA)的領(lǐng)域本體構(gòu)建方法。該方法主要包括數(shù)據(jù)預(yù)處理、對象-屬性矩陣分析、概念格創(chuàng)建、概念語義相似度分析和本體構(gòu)建幾個(gè)步驟。
2)以氣象災(zāi)害大數(shù)據(jù)為檢索對象,設(shè)計(jì)了基于氣象災(zāi)害本體的氣象災(zāi)害大數(shù)據(jù)語義檢索模型。模型首先對當(dāng)前流行的同義詞集WordNet和本體庫SUMO進(jìn)行擴(kuò)展和融合,形成涵蓋同義詞集與本體概念之間相互映射關(guān)系的同義詞集——概念索引庫。然后融合氣象災(zāi)害本體對氣象災(zāi)害領(lǐng)域主題概念及其之間語義關(guān)系的明確定義,對用戶檢索詞進(jìn)行本體概念匹配和語義擴(kuò)展(如:將用戶檢索詞擴(kuò)展為本體概念+概念同義詞+概念上下位詞+概念屬性),形成擴(kuò)展的語義檢索式,然后檢索氣象災(zāi)害大數(shù)據(jù),從而獲取更精確、更全面的氣象災(zāi)害數(shù)據(jù),用于后續(xù)分析。同時(shí)課題以“臺風(fēng)莫蘭蒂”作為本體語義擴(kuò)展檢索實(shí)驗(yàn),比較分析了“臺風(fēng)莫蘭蒂”及其語義擴(kuò)展檢索式“2016 and(莫蘭蒂 臺風(fēng) 風(fēng)暴 暴雨 狂風(fēng) 洪水 洪澇)and (福建 廈門 翔安 福州 閩南)”的檢索性能。實(shí)驗(yàn)發(fā)現(xiàn),語義擴(kuò)展檢索式檢索結(jié)果準(zhǔn)確率更好,達(dá)到80%。
3)融合Web of Science和中國知網(wǎng)中“大數(shù)據(jù)”研究文獻(xiàn)數(shù)據(jù),借助CiteSpaceII可視化分析軟件繪制出國內(nèi)外大數(shù)據(jù)領(lǐng)域的科學(xué)知識圖譜——作者、國家和機(jī)構(gòu)的科研合作網(wǎng)絡(luò),關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò),文獻(xiàn)共被引聚類網(wǎng)絡(luò),揭示出國內(nèi)外大數(shù)據(jù)研究概貌。研究發(fā)現(xiàn),國內(nèi)大數(shù)據(jù)方面科研社區(qū)較多,但規(guī)模較小,而國際大數(shù)據(jù)科研社區(qū)較少,但規(guī)模較大,規(guī)模最大研究社區(qū),達(dá)到30多人。國家和機(jī)構(gòu)之間的科研合作極少,國際TOP30科研機(jī)構(gòu)中,大部分為美國高校,中國機(jī)構(gòu)較少。國內(nèi)外大數(shù)據(jù)研究涉及的熱點(diǎn)主要有:基于大數(shù)據(jù)的云計(jì)算;基于MapReduce和Hadoop的海量數(shù)據(jù)分布式處理研究;大數(shù)據(jù)在數(shù)據(jù)挖掘、社會網(wǎng)絡(luò)、互聯(lián)網(wǎng)金融、識別與預(yù)測等領(lǐng)域的應(yīng)用研究。而國內(nèi)涉及較少的研究熱點(diǎn)有:大數(shù)據(jù)模型和算法研究、大數(shù)據(jù)分類研究和大數(shù)據(jù)相關(guān)系統(tǒng)研究。
4)以暴雨災(zāi)害為主題,基于FCA方法構(gòu)建了若干具體的全局和局部本體(如暴雨災(zāi)害本體、次生災(zāi)害本體和災(zāi)害管理本體等),并分別使用基于單目標(biāo)優(yōu)化的模擬退火算法、禁忌搜索算法和基于多目標(biāo)優(yōu)化的網(wǎng)絡(luò)空間進(jìn)化算法、多目標(biāo)蟻群算法進(jìn)行網(wǎng)絡(luò)空間主題爬蟲,以獲取網(wǎng)絡(luò)空間氣象災(zāi)害大數(shù)據(jù)的相關(guān)非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)和資料。實(shí)驗(yàn)結(jié)果表明,通過采用本體技術(shù)的多目標(biāo)主題爬蟲方法的爬準(zhǔn)率較其他網(wǎng)絡(luò)爬蟲方法效果更佳。
子課題2:氣象災(zāi)害大數(shù)據(jù)的融合研究進(jìn)展
目前本子課題已經(jīng)完成70%。
1)采用加權(quán)雙線性等計(jì)算方法,將社會統(tǒng)計(jì)數(shù)據(jù)分配到一定尺度的規(guī)則地理柵格上,通過非空間屬性大數(shù)據(jù)的網(wǎng)格化,實(shí)現(xiàn)了多源數(shù)據(jù)的分解與融合,以便與環(huán)境、地形等數(shù)據(jù)綜合使用,實(shí)現(xiàn)大數(shù)據(jù)的融合分析。
2)采用雙線性插值法,將各種硬(軟)數(shù)據(jù)統(tǒng)一到等經(jīng)緯度格點(diǎn)上,然后再求解加權(quán)最小成本目標(biāo)函數(shù)。該算法由研究區(qū)域范圍內(nèi)各個(gè)格點(diǎn)的硬(軟)數(shù)據(jù)與待求解的理想結(jié)果之差的平方和,以及待求解的融合結(jié)果矢量的二階導(dǎo)數(shù)組成。
3)借鑒FGDC地理空間數(shù)據(jù)內(nèi)容標(biāo)準(zhǔn)(CSDGM)V.2.0和ISO 地理信息(CD 2.0)理念,采用ArcGIS 軟件提供的坐標(biāo)轉(zhuǎn)換功能實(shí)現(xiàn)數(shù)據(jù)坐標(biāo)系統(tǒng)的歸一化,具體包括社會統(tǒng)計(jì)數(shù)據(jù)的網(wǎng)格化、矢量化的空間配準(zhǔn)與已有矢量數(shù)據(jù)的坐標(biāo)轉(zhuǎn)換,以及衛(wèi)星資料投影轉(zhuǎn)換;在氣象災(zāi)害本體知識庫基礎(chǔ)上開發(fā)面向應(yīng)用的本體知識管理引擎,為業(yè)務(wù)運(yùn)行所需的聯(lián)合查詢、抽取和轉(zhuǎn)換提供解析服務(wù)。
子課題3:氣象災(zāi)害大數(shù)據(jù)的降維與災(zāi)害識別研究進(jìn)展
目前本子課題已經(jīng)完成60%。
1)針對超高維數(shù)據(jù),提出一種穩(wěn)健的,無模型假設(shè)的,基于區(qū)間分位數(shù)的超高維特征篩選方法,從理論上和數(shù)值模擬上驗(yàn)證了所提出方法的優(yōu)良性質(zhì)。
2)針對超高維數(shù)據(jù),基于條件分布函數(shù)與無條件分布函數(shù)之間的相互聯(lián)系,提出一種快速的超高維特征篩選方法,從理論上和數(shù)值模擬上驗(yàn)證了所提出方法的優(yōu)良性質(zhì)。
3)針對社交網(wǎng)絡(luò)平臺上的超高維海量文本數(shù)據(jù),提出一種災(zāi)害信息挖掘算法,能夠有效快速地提取災(zāi)害相關(guān)信息,并對不同的災(zāi)害類別利用所搜集網(wǎng)絡(luò)平臺信息進(jìn)行了災(zāi)害類別信息挖掘。此外,還從網(wǎng)絡(luò)內(nèi)容的發(fā)布、傳播、分享等方面展開研究,分析了促使網(wǎng)絡(luò)信息傳播的核心因素。
4)針對全國近50年霧霾能見度數(shù)據(jù),創(chuàng)立混合效應(yīng)廣義高斯過程函數(shù)回歸模型,對二十個(gè)代表性城市能見度進(jìn)行建模和估計(jì),并進(jìn)行預(yù)測研究。實(shí)例和模擬分析結(jié)果表明,模型不僅能夠很好地刻畫能見度和影響因子的復(fù)雜相關(guān)關(guān)系,而且能夠較大程度地提高預(yù)測效果。
5)針對中國161個(gè)城市的空氣質(zhì)量數(shù)據(jù),以PM2.5濃度為主要研究對象,創(chuàng)立函數(shù)型數(shù)據(jù)懲罰似然聚類方法,加入工業(yè)煙(粉)塵排放量等人類活動(dòng)因素作為輔助聚類變量,通過Logistic模型和混合模型進(jìn)行雙層建模,提高聚類準(zhǔn)確性和穩(wěn)健性。聚類結(jié)果有助于各城市根據(jù)自身經(jīng)濟(jì)形勢和氣候條件等因素制訂對應(yīng)的環(huán)境治理措施。
子課題4:氣象災(zāi)害的經(jīng)濟(jì)社會影響評估研究進(jìn)展
目前本子課題已經(jīng)完成70%。
1)基于GIS平臺,初步建立了城市內(nèi)澇數(shù)據(jù)庫,主要包括系統(tǒng)數(shù)據(jù)庫、基礎(chǔ)地圖數(shù)據(jù)庫、內(nèi)澇點(diǎn)數(shù)據(jù)庫、氣象和水文數(shù)據(jù)庫、實(shí)況災(zāi)情數(shù)據(jù)庫等。
2)基于城市內(nèi)澇數(shù)據(jù)庫,構(gòu)建了城市不同區(qū)域(如居民區(qū)、商業(yè)區(qū)或根據(jù)匯排水概化的區(qū)域等)不同等級內(nèi)澇(按內(nèi)澇水深分級)、不同重現(xiàn)期下(5、10、15、20、30、50、100年一遇)致災(zāi)臨界面雨量(也稱為致洪閾值),建立針對行人、車輛、建筑物、商業(yè)和居民社區(qū)財(cái)產(chǎn)等不同承災(zāi)體的內(nèi)澇脆弱性評估模型,建立不同區(qū)域各類承災(zāi)體暴露度和脆弱性評估模型,開展城市暴雨內(nèi)澇災(zāi)害風(fēng)險(xiǎn)評估。評估不同區(qū)域內(nèi)澇風(fēng)險(xiǎn)等級,可能出現(xiàn)積水的區(qū)域或地段、水深、承災(zāi)體數(shù)量和價(jià)值量,以及相應(yīng)的經(jīng)濟(jì)損失。
3)采用Haimes & Jiang(2001)、Santos, Haimes & Lian et al.(2006)、吳先華等(2012, 2014)提出的非正常投入產(chǎn)出模型(IIOM 模型),從災(zāi)害沖擊減少產(chǎn)業(yè)最終需求入手,通過投入產(chǎn)出表的技術(shù)矩陣所表達(dá)的產(chǎn)業(yè)間關(guān)聯(lián)關(guān)系,計(jì)算了災(zāi)害影響下計(jì)劃產(chǎn)出與災(zāi)后產(chǎn)出值之差。
4)基于 Web GIS 實(shí)現(xiàn)“人機(jī)交互式”數(shù)據(jù)采集;通過統(tǒng)計(jì)方法確定災(zāi)損率曲線,計(jì)算災(zāi)害的直接經(jīng)濟(jì)損失;利用投入產(chǎn)出模型計(jì)算災(zāi)害的間接經(jīng)濟(jì)損失。采用“所見即所得”的思路,只需要輸入降雨量的實(shí)況數(shù)據(jù),便可即時(shí)計(jì)算城市各易澇點(diǎn)的直接和間接經(jīng)濟(jì)損失,提供災(zāi)害經(jīng)濟(jì)損失的空間分布,自動(dòng)生成各易澇點(diǎn)的災(zāi)損和防御對策報(bào)告。該系統(tǒng)有助于提高政府部門的災(zāi)害應(yīng)急管理能力,為類似災(zāi)害的經(jīng)濟(jì)損失評估提供典型范例。
子課題5:氣象災(zāi)害應(yīng)急決策的生成與評價(jià)研究進(jìn)展
目前本子課題已經(jīng)完成70%。
1)在災(zāi)前,以臺風(fēng)為例針對臺風(fēng)預(yù)報(bào)的不確定性,提出了集成案例推理(Case-Based Reasoning, CBR)和前景理論的兩階段臺風(fēng)災(zāi)害應(yīng)急方案生成和調(diào)整方法。對于氣象災(zāi)害事件的態(tài)勢感知,運(yùn)用系統(tǒng)動(dòng)力學(xué),對氣象災(zāi)害事件的演化路徑及過程進(jìn)行了研究,并對政府如何根據(jù)氣象災(zāi)害事件的演化路徑提出了初步的對策建議。
2)在災(zāi)后,基于系統(tǒng)動(dòng)力學(xué),建立了考慮市民恐慌程度和損失率的雙目標(biāo)函數(shù)模型,對當(dāng)前臺風(fēng)應(yīng)急預(yù)案的執(zhí)行效果進(jìn)行了評價(jià),并提出了三個(gè)臺風(fēng)災(zāi)害應(yīng)急策略。在災(zāi)后,基于進(jìn)化算法和多目標(biāo)優(yōu)化理論,提出了一系列的多目標(biāo)優(yōu)化算法對應(yīng)急過程進(jìn)行動(dòng)態(tài)優(yōu)化,提高了應(yīng)急效率。
3)日益頻發(fā)的城市暴雨內(nèi)澇災(zāi)害已成為快速城鎮(zhèn)化建設(shè)中急需應(yīng)對的嚴(yán)峻挑戰(zhàn);但當(dāng)前與暴雨內(nèi)澇相關(guān)的氣象數(shù)據(jù)、災(zāi)情數(shù)據(jù)和社會經(jīng)濟(jì)數(shù)據(jù)等尚未能有效融合,不能快速有效地生成內(nèi)澇災(zāi)害應(yīng)急決策方案,這成為災(zāi)害應(yīng)急管理的障礙。本子課題從城市暴雨內(nèi)澇災(zāi)害大數(shù)據(jù)融合的幾個(gè)方面入手,分別評述了大數(shù)據(jù)的本體技術(shù)、數(shù)據(jù)融合方法、數(shù)據(jù)降維與災(zāi)害識別、災(zāi)害的社會經(jīng)濟(jì)損失評估,以及應(yīng)急決策的生成與評估方法等相關(guān)理論與實(shí)踐進(jìn)展,并對未來研究進(jìn)行了展望。最后指出,在大數(shù)據(jù)融合背景下開展城市暴雨內(nèi)澇災(zāi)害的應(yīng)急管理研究,具有豐富的理論和實(shí)踐價(jià)值。
②調(diào)查研究及學(xué)術(shù)交流情況(調(diào)研數(shù)據(jù)整理運(yùn)用、文獻(xiàn)資料收集整理、學(xué)術(shù)會議、學(xué)術(shù)交流、國際合作等);
1)調(diào)研數(shù)據(jù)整理運(yùn)用
一是針對新浪微博平臺上的微博信息,利用爬蟲等數(shù)據(jù)抓取軟件,抓取搜集了幾種主要災(zāi)害信息數(shù)據(jù)。
二是調(diào)研了農(nóng)業(yè)部種植業(yè)管理司公布的災(zāi)情數(shù)據(jù)庫。災(zāi)情數(shù)據(jù)庫由農(nóng)業(yè)部種植業(yè)管理司和農(nóng)業(yè)部信息中心合作開發(fā),數(shù)據(jù)庫來源于《中國統(tǒng)計(jì)年鑒》及《中國農(nóng)業(yè)統(tǒng)計(jì)資料》。 災(zāi)情數(shù)據(jù)庫收錄了1949年至今分省、分年度、分災(zāi)種的受災(zāi)、成災(zāi)、絕收的面積數(shù)據(jù)共2.3萬條。
三是開展了臺風(fēng)災(zāi)害案例分析和數(shù)據(jù)收集,已經(jīng)完成了自1949年以來分省、分年度、分災(zāi)種的受災(zāi)、成災(zāi)、絕收的面積數(shù)據(jù)、成災(zāi)率、受災(zāi)率、絕收率的統(tǒng)計(jì)工作,收集并整理了國內(nèi)外相關(guān)文獻(xiàn)2000余篇。同時(shí),還積極開展了國際合作,到美國俄克拉荷馬州立大學(xué)進(jìn)行了為期半年的國際交流合作,與該校的Gary.Yen教授開展有目標(biāo)優(yōu)化算法及其在應(yīng)急管理中的應(yīng)用,取得了較好的成績。
四是2017年7月5日-20日,帶領(lǐng)研究人員到福建省漳州市馬洋溪調(diào)研洪澇災(zāi)害損失情況,收集整理了該洪澇災(zāi)害的相關(guān)數(shù)據(jù),并將調(diào)研資料整理成學(xué)術(shù)論文一篇,在《災(zāi)害學(xué)》上發(fā)表。
2)文獻(xiàn)資料收集整理
目前本課題組已查閱并收集了本體構(gòu)建、大數(shù)據(jù)融合、大數(shù)據(jù)降維、災(zāi)害損失評估以及氣象災(zāi)害應(yīng)急管理等相關(guān)研究的國內(nèi)外文獻(xiàn)。
3)學(xué)術(shù)會議
作為大會程序委員會主席,與中國“雙選法”學(xué)會共同舉辦、承辦了“第十九屆中國管理科學(xué)學(xué)術(shù)年會——綠色發(fā)展與管理科學(xué)”(地點(diǎn):南京信息工程大學(xué))。
課題首席專家召集,每月召開一次課題進(jìn)展研討會。
4)學(xué)術(shù)交流
一是2017年9月到清華大學(xué)經(jīng)濟(jì)管理學(xué)院做訪問學(xué)者,導(dǎo)師為陳國青教授,擬積極參加團(tuán)隊(duì)活動(dòng),深入學(xué)習(xí)大數(shù)據(jù)融合的方法。
二是作為特邀專家,參加了美國UNCP舉辦的“Disaster risk analysis(2017)”以及國內(nèi)的“2017應(yīng)急管理與金融工程”等學(xué)術(shù)會議。
三是作為會議分會場主席,2018年6月13-17日參加了臺灣銘傳大學(xué)承辦的DEAIC2018國際會議。
四是邀請北卡羅萊納大學(xué)彭布洛克分校衛(wèi)國教授、美國新墨西哥州立大學(xué)王通會教授、美國賓夕法尼亞州高等教育系統(tǒng)滑石分校林益教授、田納西大學(xué)金明洲教授、寧波大學(xué)鐘昌標(biāo)教授、溫莎大學(xué)王運(yùn)通教授、北京化工大學(xué)李想教授、四川大學(xué)胡知能教授、江蘇省社會科學(xué)院經(jīng)濟(jì)研究所所長胡國良研究員、南京農(nóng)業(yè)大學(xué)鐘甫寧教授等10余位專家來校進(jìn)行學(xué)術(shù)交流。
5)國際合作
繼續(xù)與美國的UNCP(University of North Carolina at Pembroke)的Guo WEI教授、美國的UNR(University of Nevada-Reno)的Shunfeng SONG教授合作、法國里昂大學(xué)終身副教授Yeming Gong博士開展共同研究,撰寫研究論文。合作內(nèi)容主要包括:
一是共同研發(fā)基于格點(diǎn)的災(zāi)害大數(shù)據(jù)融合算法研究(與Guo WEI教授合作)。
二是共同研發(fā)基于社交媒體大數(shù)據(jù)的災(zāi)害預(yù)警方法研究(與Shunfeng SONG教授合作)。
三是研發(fā)針對霧霾災(zāi)害的多階段網(wǎng)絡(luò)DEA模型(與法國里昂大學(xué)終身副教授Yeming Gong博士合作)。
四是氣象災(zāi)害大數(shù)據(jù)的降維與災(zāi)害識別研究(與Guo WEI教授合作)。
以上這些合作,為后續(xù)進(jìn)一步的深入研究提供了很好的方法基礎(chǔ)。
③成果宣傳推介情況(成果發(fā)布會、《工作簡報(bào)》報(bào)送情況、國家社科基金?陡寮安捎们闆r等);
1)李廉水教授與吳先華教授合作撰寫的專報(bào)《基于大數(shù)據(jù)融合提升災(zāi)害應(yīng)急管理能力的政策建議》,被教育部社會科學(xué)司采納,并已呈遞給有關(guān)領(lǐng)導(dǎo)參閱。
2)李廉水教授、王會軍院士、吳先華教授合作撰寫的調(diào)研報(bào)告《以數(shù)據(jù)融合為基礎(chǔ),全面提升災(zāi)害應(yīng)急管理能力》在中國科學(xué)技術(shù)協(xié)會內(nèi)部刊物《科技工作者建議》2017年發(fā)表。
④研究中存在的主要問題、改進(jìn)措施,研究心得、意見建議;
1)研究中存在的主要問題1:氣象災(zāi)害本體是實(shí)現(xiàn)“基于氣象災(zāi)害本體的氣象災(zāi)害大數(shù)據(jù)語義檢索模型”的核心技術(shù)。氣象災(zāi)害本體明確界定了氣象災(zāi)害概念及其之間相互語義關(guān)系,可以消除氣象災(zāi)害數(shù)據(jù)格式不統(tǒng)一和數(shù)據(jù)內(nèi)容歧義的問題。然而氣象災(zāi)害本體無法解決概念的同義詞集問題、一詞多義(多義詞)和多詞一義(同義詞)問題,因此需要借助當(dāng)前通用的概念本體庫SUMO和同義詞集Wordnet,對兩大本體庫進(jìn)行融合,構(gòu)建涵蓋SUMO本體概念與Wordnet同義詞集映射關(guān)系的集成本體庫。然而,SUMO本體概念與Wordnet同義詞集涉及的概念和同義詞數(shù)量龐大,語義關(guān)系復(fù)雜,如何建立SUMO本體概念與Wordnet同義詞集之間映射關(guān)系是后續(xù)面臨的主要問題。
改進(jìn)措施:全面研讀國內(nèi)外相關(guān)的研究文獻(xiàn)和技術(shù)文檔,梳理出本體概念與同義詞集之間建立映射關(guān)系的理論、方法、技術(shù)和工具,從而解決如何建立SUMO本體概念與Wordnet同義詞集之間映射關(guān)系的問題。
2)研究中存在的主要問題2:如何設(shè)計(jì)動(dòng)態(tài)尋優(yōu)子空間算法,進(jìn)行特征提取與選擇,實(shí)現(xiàn)氣象災(zāi)害大數(shù)據(jù)的維數(shù)約簡;在此基礎(chǔ)上建立典型氣象災(zāi)害數(shù)據(jù)的深度學(xué)習(xí)模型,實(shí)現(xiàn)災(zāi)害的分類識別。
改進(jìn)措施:利用統(tǒng)計(jì)學(xué)上的相關(guān)分析、灰色關(guān)聯(lián)度分析、關(guān)聯(lián)規(guī)則挖掘等方法,主要用于篩選各類氣象災(zāi)害的影響因素,采用主成分分析(PCA)、線性判別分析(LDA)和最大邊緣準(zhǔn)則(MMC)三種全局統(tǒng)計(jì)子空間算法,用于設(shè)計(jì)動(dòng)態(tài)尋優(yōu)子空間方法,結(jié)合氣象災(zāi)害數(shù)據(jù)的行業(yè)特性,進(jìn)行特征提取與選擇,實(shí)現(xiàn)氣象災(zāi)害大數(shù)據(jù)維數(shù)約簡。利用模糊聚類等統(tǒng)計(jì)方法,用于測試氣象災(zāi)害的數(shù)據(jù)結(jié)構(gòu)特征;采用泛函分析和數(shù)理統(tǒng)計(jì)方法,用于推導(dǎo)數(shù)據(jù)分布統(tǒng)計(jì)量與典型激活函數(shù)的關(guān)聯(lián)性;利用智能優(yōu)化算法,如粒子群優(yōu)化算法、螢火蟲算法、模擬退火算法、遺傳算法等,用于搜索最優(yōu)層數(shù),設(shè)定深度學(xué)習(xí)算法層數(shù)的閾值等等。在這些研究的基礎(chǔ)上,建立典型氣象災(zāi)害數(shù)據(jù)的深度學(xué)習(xí)模型,實(shí)現(xiàn)災(zāi)害的分類識別。
3)研究中存在的主要問題3:在數(shù)據(jù)的搜集和整理方面有所欠缺,對氣象災(zāi)害的實(shí)時(shí)數(shù)據(jù)、災(zāi)后重建數(shù)據(jù)、管理方面的數(shù)據(jù)搜集得不夠全面,在維度和深度上都需要進(jìn)一步加強(qiáng),從而使得在數(shù)據(jù)分析應(yīng)用方面能夠有更好的效果。
改進(jìn)措施:擬通過我校與中國氣象局、各省級氣象局的渠道,加大溝通力度,爭取獲得更多的一線災(zāi)害數(shù)據(jù),確保研究的真實(shí)性和可靠性。采取現(xiàn)場調(diào)研方式獲取第一手的基礎(chǔ)地理信息數(shù)據(jù),充分利用臺站資料、預(yù)報(bào)資料和遙感數(shù)據(jù),及時(shí)與相關(guān)部門聯(lián)系獲取最新的基礎(chǔ)地理信息數(shù)據(jù)。
⑤其他需要說明的問題。
無。
二、研究成果情況
①代表性成果簡介(基本內(nèi)容、主要觀點(diǎn)、學(xué)術(shù)價(jià)值、社會影響等);
1)研究成果1(基于大數(shù)據(jù)融合提升災(zāi)害應(yīng)急管理能力的政策建議)介紹:
主要內(nèi)容:數(shù)據(jù)“碎片化”影響防災(zāi)救災(zāi)決策準(zhǔn)確性,主要體現(xiàn)在:一是災(zāi)害管理數(shù)據(jù)采集和使用分散,二是災(zāi)害管理數(shù)據(jù)未形成統(tǒng)一標(biāo)準(zhǔn),三是數(shù)據(jù)孤島、數(shù)據(jù)閑置和數(shù)據(jù)不足等現(xiàn)象并存。國外基于數(shù)據(jù)共享的災(zāi)害應(yīng)急管理經(jīng)驗(yàn)值得借鑒,一是災(zāi)害數(shù)據(jù)庫互聯(lián)共享,二是大數(shù)據(jù)技術(shù)應(yīng)用于災(zāi)害應(yīng)急管理系統(tǒng),三是以社區(qū)為中心,開展災(zāi)害防御和基礎(chǔ)數(shù)據(jù)精準(zhǔn)數(shù)據(jù)采集,四是以。ㄖ荩闃屑~,構(gòu)建災(zāi)害應(yīng)急管理三級聯(lián)動(dòng)體系。
主要觀點(diǎn):一是大力發(fā)展大數(shù)據(jù)融合技術(shù),二是以數(shù)據(jù)融合為突破口,全面規(guī)劃智慧城市建設(shè),推進(jìn)和協(xié)調(diào)政府部門的數(shù)據(jù)開放和數(shù)據(jù)融合,三是以數(shù)據(jù)開放共享為導(dǎo)向,建立和加強(qiáng)“社區(qū)防災(zāi)”為中心的災(zāi)害管理理念。
學(xué)術(shù)價(jià)值:災(zāi)害數(shù)據(jù),包括預(yù)報(bào)數(shù)據(jù)、災(zāi)情數(shù)據(jù)和社會統(tǒng)計(jì)數(shù)據(jù)三大類,具有體量浩大、模態(tài)繁多、生成快速和價(jià)值巨大但密度很低的大數(shù)據(jù)特征,但目前這些數(shù)據(jù)的歸屬分割、標(biāo)準(zhǔn)迥異、互不相融,呈現(xiàn)“碎片化”特征,難以滿足在發(fā)生災(zāi)害的緊急情景下的應(yīng)急決策需要,甚至成為應(yīng)急決策的障礙。大數(shù)據(jù)技術(shù)和應(yīng)用的蓬勃發(fā)展,使得多元異構(gòu)的災(zāi)害數(shù)據(jù)的快速融合成為可能。本研究具有較高的學(xué)術(shù)價(jià)值。
社會影響:引入災(zāi)害大數(shù)據(jù)融合方法,篩選高風(fēng)險(xiǎn)點(diǎn)、高敏感行業(yè)和部門,發(fā)展大數(shù)據(jù)融合背景下災(zāi)害應(yīng)急決策管理技術(shù),能夠?yàn)闉?zāi)害的實(shí)時(shí)評估及應(yīng)急決策提供理論和方法支持,為災(zāi)害應(yīng)急管理提供強(qiáng)有力的決策支持。
2)研究成果2(基于FCA的氣象災(zāi)害本體構(gòu)建)介紹:
主要內(nèi)容:從氣象災(zāi)害相關(guān)的學(xué)術(shù)文獻(xiàn)和新聞報(bào)道抓取數(shù)據(jù),利用 ICTCLAS 系統(tǒng)提取關(guān)鍵詞,經(jīng)過修正后形成領(lǐng)域術(shù)語;接著從術(shù)語集和文本集中生成形式化背景,導(dǎo)入ConExp中自動(dòng)生成概念格和 Hasse圖,形成領(lǐng)域術(shù)語層次關(guān)系;最后錄入本體管理工具 Protégé中構(gòu)建本體,生成本體的可視化圖形和 OWL代碼文件。
主要觀點(diǎn):在大數(shù)據(jù)應(yīng)用背景下,需要對海量、多源、異構(gòu)的氣象大數(shù)據(jù)進(jìn)行融合,構(gòu)建領(lǐng)域術(shù)語規(guī)范,促進(jìn)氣象大數(shù)據(jù)融合。
學(xué)術(shù)價(jià)值:該研究成果對領(lǐng)域本體構(gòu)建方法進(jìn)行了新的探索,即在基本的構(gòu)建本體過程中,考慮以非結(jié)構(gòu)化的氣象災(zāi)害大數(shù)據(jù)作為數(shù)據(jù)源,并引入主題詞表以實(shí)現(xiàn)主題詞表與概念格詞匯的相互修正,確保了領(lǐng)域本體術(shù)語的完善性與準(zhǔn)確性。
社會影響:通過將基于概念形式分析(FCA)的本體構(gòu)建方法引入鮮有人涉足的氣象災(zāi)害領(lǐng)域,借助本體技術(shù),為氣象災(zāi)害領(lǐng)域構(gòu)建規(guī)范化術(shù)語體系,幫助計(jì)算機(jī)更好地理解氣象災(zāi)害術(shù)語,在真正意義上促進(jìn)各氣象部門的數(shù)據(jù)共聯(lián)、共通、共享,實(shí)現(xiàn)從信息孤島到信息網(wǎng)絡(luò)的轉(zhuǎn)變。
3)研究成果3(國內(nèi)外大數(shù)據(jù)研究前沿、熱點(diǎn)與合著模式的圖譜分析)介紹:
基本內(nèi)容:以可視化圖譜的方式全面直觀展示當(dāng)前新興的熱點(diǎn)主題——大數(shù)據(jù)的國內(nèi)外研究全貌,為氣象災(zāi)害大數(shù)據(jù)研究提供前瞻指引和奠定基礎(chǔ)。本文融合Web of Science和中國知網(wǎng)中“大數(shù)據(jù)”研究文獻(xiàn)數(shù)據(jù),借助CiteSpaceII可視化分析軟件繪制出國內(nèi)外大數(shù)據(jù)領(lǐng)域的科學(xué)知識圖譜——作者、國家和機(jī)構(gòu)的科研合作網(wǎng)絡(luò),關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò),文獻(xiàn)共被引聚類網(wǎng)絡(luò),揭示出國內(nèi)外大數(shù)據(jù)研究概貌。
主要觀點(diǎn):研究發(fā)現(xiàn),國內(nèi)大數(shù)據(jù)方面科研社區(qū)較多,但規(guī)模較小,而國際大數(shù)據(jù)科研社區(qū)較少,但規(guī)模較大,規(guī)模最大研究社區(qū),達(dá)到30多人。國家和機(jī)構(gòu)之間的科研合作極少,國際TOP30科研機(jī)構(gòu)中,大部分為美國高校,中國機(jī)構(gòu)較少。國內(nèi)外大數(shù)據(jù)研究都涉及的熱點(diǎn)有:基于大數(shù)據(jù)的云計(jì)算;基于MapReduce和Hadoop的海量數(shù)據(jù)分布式處理研究;大數(shù)據(jù)在數(shù)據(jù)挖掘、社會網(wǎng)絡(luò)、互聯(lián)網(wǎng)金融、識別與預(yù)測等領(lǐng)域的應(yīng)用研究。而國內(nèi)涉及較少的研究熱點(diǎn)有:大數(shù)據(jù)模型和算法研究、大數(shù)據(jù)分類研究和大數(shù)據(jù)相關(guān)系統(tǒng)研究。
學(xué)術(shù)價(jià)值:“大數(shù)據(jù)”是國家戰(zhàn)略布局的新興前沿產(chǎn)業(yè),早在2015年8月,國務(wù)院為推動(dòng)我國大數(shù)據(jù)產(chǎn)業(yè)持續(xù)健康發(fā)展,發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》。目前Web of Science核心庫顯示,2005-2015期間有4288篇與大數(shù)據(jù)相關(guān)的文獻(xiàn),中國知網(wǎng)期刊數(shù)據(jù)庫顯示2000-2015期間,國內(nèi)學(xué)者發(fā)表了16,798篇大數(shù)據(jù)方面的文獻(xiàn)。然而目前利用科學(xué)知識圖譜全面解讀國內(nèi)外大數(shù)據(jù)領(lǐng)域知識基礎(chǔ)、科研合作、研究熱點(diǎn)與前沿的文獻(xiàn)還相對較少。該研究成果通過全面展示國內(nèi)外大數(shù)據(jù)研究的主要科研團(tuán)隊(duì)、發(fā)文國家和機(jī)構(gòu),以及他們之間的合作情況,同時(shí)展示出國內(nèi)外大數(shù)據(jù)研究的熱點(diǎn)主題、前沿?zé)狳c(diǎn)與領(lǐng)域核心知識基礎(chǔ)。一方面,可以為讀者和研究人員展示當(dāng)前大數(shù)據(jù)領(lǐng)域研究的全貌,為他們今后的研究方向和選題提供一定的參考和借鑒,另一方面,通過國內(nèi)外大數(shù)據(jù)研究概況進(jìn)行一個(gè)對比分析,可以促進(jìn)我國大數(shù)據(jù)研究體系的完善。
4)研究成果4(基于網(wǎng)頁空間進(jìn)化算法的暴雨災(zāi)害主題爬蟲策略)介紹:
基本內(nèi)容:對于鏈接主題相關(guān)性分析,提出了評價(jià)鏈接潛在價(jià)值的三個(gè)目標(biāo):鏈接指向網(wǎng)頁的主題相關(guān)度,鏈接的錨文本相關(guān)度和網(wǎng)頁的PageRank值。針對單目標(biāo)優(yōu)化算法解決爬蟲問題難以獲得最優(yōu)加權(quán)因子和易于陷入局部最優(yōu)的缺點(diǎn),首次將多目標(biāo)優(yōu)化算法引入主題爬蟲,提出了一種基于多目標(biāo)優(yōu)化的網(wǎng)頁空間進(jìn)化(WSE)算法。WSE算法通過計(jì)算測試鏈接與鏈接庫中鏈接的最短距離,并將其與鏈接庫中所有鏈接的平均距離進(jìn)行比較來更新鏈接庫。另外,針對多目標(biāo)優(yōu)化中Pareto最優(yōu)解的選取問題,提出了一種最近最遠(yuǎn)候選解法(NFCS)。最后,以暴雨災(zāi)害為主題,在相同的實(shí)驗(yàn)環(huán)境下,運(yùn)行WSE算法與文獻(xiàn)中的寬度優(yōu)先搜索(BFS)算法、最佳優(yōu)先搜索(OPS)算法和模擬退火(SA)算法。實(shí)驗(yàn)結(jié)果表明,WSE算法相比其他三種算法明顯提高了主題爬蟲的效果,因此WSE算法是一種有效的主題爬蟲策略。
主要觀點(diǎn):主題爬蟲是垂直搜索引擎技術(shù)的基礎(chǔ)和核心,垂直搜索引擎中的數(shù)據(jù)全部來自于爬蟲的抓取,如何高效全面的收集氣象災(zāi)害高質(zhì)量的網(wǎng)頁是氣象災(zāi)害主題爬蟲問題研究的重點(diǎn)和難點(diǎn)。
學(xué)術(shù)價(jià)值:首次將多目標(biāo)優(yōu)化算法引入主題爬蟲,提出了一種基于多目標(biāo)優(yōu)化的網(wǎng)頁空間進(jìn)化(WSE)主題爬蟲算法。該項(xiàng)研究成果對于高效、全面抓取互聯(lián)網(wǎng)上與氣象災(zāi)害大數(shù)據(jù)相關(guān)的非結(jié)構(gòu)化和半結(jié)構(gòu)化網(wǎng)頁提供了強(qiáng)有力的幫助。
社會影響:隨著“井噴式”增長的網(wǎng)民和幾近同步增長的網(wǎng)頁,如何保證人們在海量信息中迅速獲取所需信息成為一個(gè)巨大的挑戰(zhàn)。本研究成果有助于人們從海量的網(wǎng)頁大數(shù)據(jù)中高效抓取主題相關(guān)的網(wǎng)頁。
5)研究成果5(寧波市城市內(nèi)澇風(fēng)險(xiǎn)評估數(shù)據(jù)庫與仿真模型建設(shè))介紹:
基本內(nèi)容:收集、分析寧波市臺風(fēng)/典型暴雨降水、臺風(fēng)大風(fēng)等氣象因子歷年數(shù)據(jù),構(gòu)建臺風(fēng)/典型暴雨(致災(zāi)因子)綜合影響強(qiáng)度指數(shù);采用GIS技術(shù),綜合考慮受災(zāi)地區(qū)地理孕災(zāi)因子海拔高度、地形標(biāo)準(zhǔn)、江河水網(wǎng)密度,社會經(jīng)濟(jì)孕災(zāi)因子,包括人口密度、單位面積GDP、農(nóng)業(yè)密集程度、主要經(jīng)濟(jì)行業(yè)發(fā)展指標(biāo)等因素,構(gòu)建孕災(zāi)環(huán)境暴露性指數(shù)及承載體脆弱性指數(shù);收集、分析寧波市歷年災(zāi)情數(shù)據(jù)時(shí)空分布數(shù)據(jù)(包括人員傷亡、經(jīng)濟(jì)損失、房屋倒塌、受災(zāi)成災(zāi)面積),構(gòu)建臺風(fēng)災(zāi)損度指數(shù)。進(jìn)而構(gòu)建寧波市臺風(fēng)/典型暴雨基本災(zāi)情數(shù)據(jù)庫及災(zāi)損評價(jià)指數(shù)數(shù)據(jù)庫,為后續(xù)研究提供數(shù)據(jù)支撐。開發(fā)了寧波市城市暴雨內(nèi)澇仿真模型,主要服務(wù)于防止氣象災(zāi)害—強(qiáng)對流或者暴雨帶來的城市內(nèi)澇發(fā)生。比如通過模擬一次15毫米的降雨過程,可以通過計(jì)算機(jī)周密的運(yùn)算,得出該地區(qū)積水量能達(dá)到多少。這套軟件具有“暴雨來臨前預(yù)測”和“突發(fā)暴雨隨時(shí)監(jiān)測”的雙重功能。預(yù)測功能主要指,在暴雨來臨前,提前預(yù)測出未來哪天將會出現(xiàn)降水以及降水分布情況,再運(yùn)用數(shù)值預(yù)報(bào)中的多類預(yù)報(bào)產(chǎn)品,合理地將全市劃分為眾多“網(wǎng)格”,按照區(qū)域分塊,利用仿真系統(tǒng)預(yù)測出哪個(gè)“網(wǎng)格”區(qū)域內(nèi)會出現(xiàn)積水,這樣可以提前通知排水部門做好準(zhǔn)備,利用城市排水系統(tǒng)將雨水排出。此外,結(jié)合寧波市氣象臺新啟用的“短時(shí)臨近預(yù)報(bào)綜合業(yè)務(wù)平臺”,采用WEB GIS(網(wǎng)絡(luò)地理信息系統(tǒng))與氣象數(shù)據(jù)庫的架構(gòu),使雷達(dá)、閃電定位、TJ-WRF數(shù)值預(yù)報(bào)產(chǎn)品等各類氣象資料在實(shí)時(shí)地理位置上可直觀顯示,進(jìn)一步強(qiáng)化了預(yù)報(bào)預(yù)警的精細(xì)化程度。
社會影響:基于 Web GIS 實(shí)現(xiàn)“人機(jī)交互式”數(shù)據(jù)采集;通過統(tǒng)計(jì)方法確定災(zāi)損率曲線,計(jì)算災(zāi)害的直接經(jīng)濟(jì)損失;利用投入產(chǎn)出模型計(jì)算災(zāi)害的間接經(jīng)濟(jì)損失。采用“所見即所得”的思路,只需要輸入降雨量的實(shí)況數(shù)據(jù),便可即時(shí)計(jì)算城市各易澇點(diǎn)的直接和間接經(jīng)濟(jì)損失,提供災(zāi)害經(jīng)濟(jì)損失的空間分布,自動(dòng)生成各易澇點(diǎn)的災(zāi)損和防御對策報(bào)告。該系統(tǒng)有助于提高政府部門的災(zāi)害應(yīng)急管理能力,為類似災(zāi)害的經(jīng)濟(jì)損失評估提供典型范例。
②階段性成果清單(請?zhí)顚懜郊﨓XCEL表格)。
見附件。
三、下一步研究計(jì)劃
子課題1:氣象災(zāi)害大數(shù)據(jù)的本體構(gòu)建研究
1)2018.07-2019.07:氣象災(zāi)害數(shù)據(jù)的自動(dòng)語義標(biāo)注。提煉氣象災(zāi)害數(shù)據(jù)的類型和屬性,運(yùn)用數(shù)據(jù)挖掘方法明確各因素之間的相互關(guān)系,采用本體和元數(shù)據(jù)技術(shù)構(gòu)建氣象災(zāi)害本體概念模型MDEOM。構(gòu)建基于“名稱—屬性—屬性值—約束”四元組的氣象災(zāi)害知識詞表,采用線性規(guī)劃和本體學(xué)習(xí)等方法進(jìn)行語義推理,實(shí)現(xiàn)氣象災(zāi)害數(shù)據(jù)的自動(dòng)語義標(biāo)注。
2)2019.08-2020.07:構(gòu)建大數(shù)據(jù)環(huán)境下的氣象災(zāi)害本體。整合氣象災(zāi)害知識術(shù)語類,通過本體學(xué)習(xí)、支持向量機(jī)等技術(shù)自動(dòng)構(gòu)建氣象災(zāi)害本體。整合氣象災(zāi)害的概念庫、實(shí)例庫和本體庫,建立氣象災(zāi)害大數(shù)據(jù)標(biāo)準(zhǔn)體系,構(gòu)建大數(shù)據(jù)環(huán)境下的氣象災(zāi)害本體。
子課題2:氣象災(zāi)害大數(shù)據(jù)的融合研究
1)2018.07-2019.07:設(shè)計(jì)氣象災(zāi)害大數(shù)據(jù)的標(biāo)準(zhǔn)編碼體系。從大數(shù)據(jù)的編碼、坐標(biāo)系統(tǒng)、空間范圍、存儲格式、精度和分辨率等方面,對多源異構(gòu)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,為不同類型的數(shù)據(jù)設(shè)計(jì)相應(yīng)的編碼體系標(biāo)準(zhǔn),設(shè)計(jì)大數(shù)據(jù)的標(biāo)準(zhǔn)編碼體系。
2)2019.08-2020.07:研究數(shù)據(jù)融合處理的算法。多源異構(gòu)大數(shù)據(jù)的標(biāo)準(zhǔn)化處理,包括社會經(jīng)濟(jì)類、災(zāi)情類非空間屬性數(shù)據(jù)、氣象類空間大數(shù)據(jù)、Web等離散數(shù)據(jù)的標(biāo)準(zhǔn)化處理。研究數(shù)據(jù)融合處理的算法,包括對非空間屬性數(shù)據(jù)的網(wǎng)格化技術(shù)、衛(wèi)星資料幾何校正算法、多源網(wǎng)格化軟、硬數(shù)據(jù)融合的通用算法研究。
子課題3:氣象災(zāi)害大數(shù)據(jù)的降維與災(zāi)害識別研究
1)2018.07-2019.07:氣象災(zāi)害大數(shù)據(jù)的約簡研究。采用多種大數(shù)據(jù)降維的算法,比較分析各種算法的優(yōu)缺點(diǎn),設(shè)計(jì)一種混合的氣象災(zāi)害大數(shù)據(jù)降維算法,并以城市暴雨災(zāi)害為例對方法進(jìn)行驗(yàn)證。
2)2019.08-2020.07:氣象災(zāi)害的分類識別研究。根據(jù)統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)等方法,將遙感影像、Web數(shù)據(jù)和社會調(diào)研數(shù)據(jù)相結(jié)合,研發(fā)災(zāi)害分類識別的模型和方法,并以暴雨洪澇等氣象災(zāi)害為例進(jìn)行驗(yàn)證。
子課題4:氣象災(zāi)害的經(jīng)濟(jì)社會影響評估研究
1)2018.07-2019.07:構(gòu)建災(zāi)損率曲線、EC+IIOM。在數(shù)據(jù)采集和融合的基礎(chǔ)上,測算各高風(fēng)險(xiǎn)點(diǎn)的災(zāi)損率曲線;開發(fā)最終需求各項(xiàng)的面板數(shù)據(jù)模型,構(gòu)建EC+IIOM模型。
2)2019.08-2020.07:構(gòu)建MD+CGE模型。設(shè)計(jì)CGE的基準(zhǔn)情景、設(shè)計(jì)函數(shù)及方程、處理數(shù)據(jù)及參數(shù)、采用通用數(shù)學(xué)建模系統(tǒng)編程,構(gòu)建MD+CGE模型,并評估氣象災(zāi)害給關(guān)聯(lián)產(chǎn)業(yè)和部門帶來的經(jīng)濟(jì)影響。
子課題5:氣象災(zāi)害應(yīng)急決策的生成與評價(jià)研究
1)2018.07-2019.07:應(yīng)急決策方案的快速生成研究。開展包括案例推理、規(guī)則推理的方法研究,基于案例推理、規(guī)則推理和Web GIS集成的氣象災(zāi)害應(yīng)急決策方案研究等。
2)2019.08-2020.07:應(yīng)急決策方案的動(dòng)態(tài)評估研究。開展包括前景理論的原理和方法,前景理論在氣象災(zāi)害應(yīng)急決策領(lǐng)域的應(yīng)用研究,氣象災(zāi)害大數(shù)據(jù)應(yīng)急決策評估指標(biāo)體系的設(shè)計(jì)研究,基于前景理論的應(yīng)急決策方案的動(dòng)態(tài)評估模型研究等,最后以城市暴雨災(zāi)害為例對方法進(jìn)行驗(yàn)證。
(課題組供稿)