
閆冬梅 中科院空天信息創新研究院供圖
科學大數據,是當今時代的戰略性資源,是科技創新發展的重要基礎。
2018年,中國科學院正式啟動“地球大數據科學工程”先導專項,為“一帶一路”“數字中國”、人類命運共同體和聯合國可持續發展目標等提供科技支撐和決策支持。
海量數據匯聚于此,如何管理、解析、應用,離不開一位“數據管家”——中科院空天信息創新研究院研究員閆冬梅。
“數據”是對我們身邊客觀世界進行試驗或者觀察獲得的未經加工的原始素材。數據處理的過程,就是尋找規律和邏輯的過程,也是將數據與客觀世界相對應的過程。
從小就對數據格外感興趣的閆冬梅,2000年考入了當時的中科院遙感應用研究所,攻讀遙感圖像處理博士研究生。其間,閆冬梅通過衛星遙感影像領略了地球之美。一張張全國遙感影像圖,恰似一幅幅中國水墨丹青。
真正讓閆冬梅感嘆的是,衛星遙感影像不僅為我們展現了地球之美,還有更為重大的科學價值和現實意義。圖中的每個像素,在自然中都是有著實際意義的數據,有了這些數據,人們不必再翻山越嶺進行大量的實地勘測,只需根據數據和少量的地面實測就能繪制出專業地圖,服務自然資源調查、環境監測評價、區域分析規劃及全球宏觀研究。
單就制作修訂一幅全國地圖來講,遙感制圖方法和傳統勘測方法相比,效率提高了至少10倍以上。了解了“數據”的精髓后,如何提高遙感數據的處理精度和效率、提高數據的精準服務能力,成為閆冬梅此后一直奮斗的目標。
閆冬梅博士畢業后的15年間,全球和中國的數據獲取能力飛速提升。隨著對地觀測技術的進步和對地觀測衛星的密集發射,中國已經進入地球大數據時代。
大數據可以根據各數據要素之間在時間、空間上的關聯關系,通過數據融合和挖掘技術來探究數據背后的本質信息,成為觀察人類社會和地球的“顯微鏡”和“透視鏡”。大數據之“大”,在于眾多“小數據”的匯集。但是,由于數據采集歷史和管理等各種各樣的原因,在科研機構和行業應用部門中存在大量的“數據孤島”,導致數據匯聚困難,最終無法形成大數據的合力。因此,建立數據的標準規范、推動數據共享迫在眉睫。
2018年1月,中科院啟動為期5年的“地球大數據科學工程”先導科技專項,并在專項負責人郭華東院士和總體組的帶領下,成立了數據共享工作組和課題組。閆冬梅任課題負責人和數據共享工作組的副組長,開始了對大數據的梳理、清洗和開放共享工作,成為了一名“數據管家”。
作為地球大數據專項的“數據管家”,閆冬梅和同事們要面對來自國內外129家科研單位的海量、多學科的異構數據。海量數據存儲、數據交互、網絡傳輸、數據管理、質量控制等,成為閆冬梅工作中繞不開的難題。
萬事開頭難,建立“數據共享臺賬”是立項之初專項總體組下達的第一項關于數據的任務。閆冬梅和來自中科院資源、環境、生物、生態等多學科的科研人員,歷時半年著手調研分析了對地觀測、野外臺站、生物多樣性和生態安全以及大氣海洋等多種數據資源現狀,并進行趨勢分析與預測,形成了數據共享工作的明細賬,明確了專項“5年匯聚17PB數據資源”的目標,并基于臺賬基礎,在中科院率先建立了科學數據管理年度工作計劃。
閆冬梅帶領團隊繼續迎難而上,面對問題抽絲剝繭,構建數據匯交、質量評估、共享服務等全生命周期的數據開放服務體系。她帶領團隊專家創新性地提出數據共享新范式,打造“大數據存儲—云服務分析處理—高性能計算—數據出版共享”集成模式,實現“數據—成果”的一站式生產與共享,加快大數據環境下的多領域、多學科數據交叉融合與深度挖掘,形成地球大數據的價值鏈。
無論是在科研一線還是在管理崗位,閆冬梅一直致力于數據共享工作,兢兢業業地扮演著“數據管家”的角色。
2020年,閆冬梅組織出版了《地球大數據科學工程數據共享藍皮書》。截至2022年6月,專項數據共享服務系統收集、整編了中國科學院多個領域的地球大數據資源,總數據量超過14PB,匯集40年衛星影像數據,其中衛星影像產品460萬景、生物生態數據7.6PB、遙感數據4.8PB,在線訪問量超9374萬次,累計下載超102萬次,用戶遍布全球174個國家和地區,成為我國地學領域科學數據共享最具影響力的數據服務平臺之一。
2010年青海玉樹地震、2013年四川雅安地震等十余次重大災害應急遙感監測數據和災情評估信息的共享工作,也都由閆冬梅牽頭協調完成,并為科技救災入選“中國科學院改革開放四十年40項標志性科技成果”奠定了堅實的空間數據基礎。
2010年青海玉樹地震發生后,閆冬梅第一時間組織部署數據共享工作,在地震發生當日實現了航空、衛星遙感數據共享發布,并向國務院應急辦、地震局等16個國家部委提供了全部共享數據。同時,在新浪網站上發布的31張災區高分辨率航空遙感影像圖,是國內首次災害高分辨率遙感影像對公眾開放,累計總瀏覽量逾2000萬次,形成了科技救災的良好社會反響。
在一個繁忙的火車站,監控攝像頭正全方位追蹤站臺的情況,乘客流量、軌道占用、衛生狀況……所有信息實時傳輸給中央人工智能(AI)系統。這個系統的任務是幫助調度列車,讓它們安全準點進站。然而,一旦有人惡意干......
為推動地方數據集團創新發展,服務全國一體化數據市場培育建設,7月23日,國家數據局組織召開座談會。國家數據局黨組書記、局長劉烈宏出席會議并講話,局黨組成員、副局長沈竹林、夏冰、余英出席會議。局黨組成員......
隨著人工智能(AI)、自動化等技術的持續突破,利用傳感器進行數據采集與高速傳輸,并通過物聯網存儲海量數據,正持續推進智能化養殖業發展,逐漸成為推動豬育種向精準化、高效化、智能化轉型的核心驅動力。從整個......
國家知識產權局辦公室關于印發《知識產權數據使用手冊及開放目錄》的通知國知辦函服字〔2025〕153號各省、自治區、直轄市和新疆生產建設兵團知識產權局,各地方有關中心:為促進知識產權數據開發利用,提高知......
2月23日,記者從海南醫科大學獲悉,該校熱帶醫學院楊國靜教授團隊近日在國際醫學期刊《英國醫學雜志》在線發表論文《中國被忽視熱帶病負擔估計的差異:真實世界數據與GBD2021的比較研究(2004—202......
人工智能(AI)初創公司xAI創始人埃隆·馬斯克近日表示:“在AI訓練中,我們現在基本上耗盡了人類知識的累積總和。”之前研究也表明,人類生成的真實數據將在2到8年內消耗殆盡。鑒于真實數據日益稀缺,為滿......
12月28日,由人民數據開發的“數融平臺”正式上線試運營。平臺整體依托區塊鏈、人工智能和企業經營相關數據要素,實現鏈上信息全透明、全上鏈,實現數據資產情況全穿透,實時追蹤一手風控數據,對潛......
隨著新一輪科技革命和產業變革深入發展,數據作為關鍵生產要素的價值日益凸顯。五部門:制定數據產業發展促進政策近日,國家數據局聯合中央網信辦、工業和信息化部、公安部、國務院國資委印發了《關于促進企業數據資......
2024年12月3日,自然科學基金委管理科學部、信息科學部在北京召開專項項目“數據市場制度設計與關鍵技術”評審會議。自然科學基金委黨組成員、副主任江松院士出席會議并講話。國家數據局政策與規劃司副司長欒......
2024年度國家自然科學基金指南引導類原創探索計劃項目“數據流通市場的基礎理論與治理方法”項目指南以數據要素為核心引擎推動數字經濟深化發展,有利于構建新發展格局、建設現代化經濟體系、構筑國家競爭新優勢......