王家耀院士:人工智能是地理信息產業轉型升級的核心驅動力
地理信息產業與時空大數據產業
地理信息產業與時空大數據產業兩者的內涵及其區別和聯系是一個很難說清楚但是又應該說清楚的問題。
1.1 地理信息與地理信息產業
地理信息,指人對地理現象的感知。其內容包括地理系統諸要素的數量、質量 、分布特征、相互聯系和變化規律等,分為空間位置信息和屬性特征信息兩大類 , 在計算機中以數據的形式存儲和處理。地理信息產業,指以全球導航衛星系統、遙感、地理信息系統及計算機通信網絡技術為支撐,以地理信息 “ 獲取( 傳感網 )→處理( 生產 )→應用 ( 服務 )” 作為產業鏈的信息產業,屬于信息服務產業, 即地理信息服務產業,是信息產業的基礎和重要組成部分。
地理信息產業的發展取得了可喜的成績,表現出了明顯的發展趨勢:
一是實現了模擬測繪產品生產到數字測繪產品的轉變;
二是實現了延續多年的以基礎測繪生產任務為主到基礎測繪產品與深加工產品的轉變;
三是實現了基礎測繪向地 理國情普查和監測的延伸和拓展;
四是正在經歷 從沿襲多年的計劃經濟體制機制到適應市場經濟 體制機制轉變 ;
五是正在建立 “ 基礎地理信息+”( 跨界融合)的地理信息產業新理念和新思維 ;
六是正在思考和迎接當前迅速發展的云計算 、 大數據 、人工智能等新興信息技術給地理信息產業 的轉型發展帶來的挑戰和機遇 。
1.2 時空大數據與時空大數據產業
時空大數據:指基于統一時空基準活動或存 在于時間和空間與位置直接或間接相關聯的大數據 。據此,時空大數據由時空框架數據和時空變 化數據兩大類數據組成。時空框架數據指基于統一時空基準的衛星導航定位數據(含連續運行參考站 數據)、遙感影像數據、地圖數據、地名數據等;時空變化數據包括社會經濟人文數據、位置軌跡數據 、與位置相關聯的空間媒體數據、社交網絡數據、搜索引擎數據 、 視頻觀測數據 、生態環境 監測數據等。時空變化數據聚合(關聯)在時空框架數據上,就構成了時空大數據。時空大數據具有位置、屬性、時間、尺度、分辨率、多樣性、異構性、多維性、價值隱含性、快速性等特性。這樣定義時空大數據的科學依據如下 :
其一,從哲學上講,空間與時間一起構成運動著的物質存在的兩種基本形式,兩者相互聯系且不可分割。
其二,從全球治理的角度講,當今社會的一個重要特點是,隨著全球化進程的加快,世界(區域 、國家、城市)管理和治理對空間和時間的依賴程度 越來越高,時空大數據正日益成為全球治理體系和治理能力現代化的核心驅動力。
其三,從作戰 指揮的角度看,時間和空間的使用任何時候都是至關重要的 。作戰指揮特別是一體化聯合作戰指揮,武器平臺特別是遠程精確打擊武器等,需要精確的時間和空間協同。對于未來的非接觸、非線性作戰,需要天空地海一體實時動態的全球一致、陸海一體、無縫連續的時空大數據引領和支撐。
其四,從復雜世界的表達看,世界上變化著的萬事萬物只能通過時間維、 空間維、屬性維來表達多維特征信息、即在空間維上關聯隨時變化的各種屬 性信息。
其五,從大數據的本質看,大數據是包括人類活動在內的事物( 現象 )運動變化的產物,而且這種運動變化都是在確定的時間和空間中進行的,都具有時間參照和空間參照兩個基本特征,所以,大數據本質上就是時空大數據。
時空大數據產業( 簡稱大數據產業 ):指以天空地海傳感器網絡為基礎,以時空信息 “ 獲取 (傳感網)→處理(生產)→應用(服務)” 為產業鏈,以 人工智能等新興信息技術為支撐 , 以數據密集型計算為特征的知識密集型信息產業 , 屬于第四產業的范疇(從第三產業中分離出來)。
同地理信息產業相比較,時空大數據產業內涵要寬泛得多,規模要大得多,類型更具多維性和多樣性,知識更密集,速度更快,產品更加多樣化和個性化。與大數據相比較,時空大數據的概念提出較晚,但內涵外延都有了很大的豐富和擴展,時空大數據的應用領域更加廣闊和有效,產業發展態勢很好。
時空大數據發展的現狀與趨勢
2.1 國外時空大數據發展態勢
目前,時空大數據已進入從概念到推廣應用的關鍵轉折期。
1)時空大數據全球戰略布局全面提升。
以美國為代表的發達國家期望通過大數據競爭優勢鞏固其在該領域的領先地位。美國最早實施國家 大數據戰略、2012年3月發布《大數據研究和發展倡議 》,2016年5月出臺《 聯邦大數據研究與開 發戰略計劃 》; 歐盟繼2011年發布 《開放數據:創新、增長和透明治理的引擎》之后,又出臺了《 數據 驅動經濟戰略》;
澳大利亞先后于2011年5月和2013年8月發布了《國家數字經濟戰略報告》 和《公共服務大數據戰略》;英國于2013年10月發布了《英國數據能力發展戰略規劃》;日本于2012年、2013年先后發布了《面向2020年和ICTS綜合戰略 》 和《 新IT戰略——創建最頂尖IT國家宣言》;韓國于2011年提出《大數據中心戰略》,2013年又宣布建設首個面向社會公共開放的“全行業數據中心” 計劃;等等。
2)時空大數據已成為戰略性資源,判斷大數據的核心價值成為核心 。
據有關統計分析資料,2020年前,全球數據量將保持40%以上的指數增長速度 ,大約每年翻一番,到2020年人類將擁有40ZB(1ZB=1048 576GB)的數據量 ,相當于地 球上的每個人產生5200GB數據,數據將成為核心生產資料 。數據總量的爆炸式增長也給數據存儲、分析和使用帶來巨大挑戰,對大數據的分析和挖掘能力提出了更高的要求,判斷大數據的價值成為核心問題,這就要求加大對大數據處理和分析挖掘技術研究的投入力量,以實現 “ 數據隱含價值 → 計算發現價值 → 應用實現價值 ” 的目標。
3)跨境數據流驅動全球商品流 、服務貿易流、資本流,標志著全球化進入了新的發展階段 。
根據麥卡錫全球研究院發布的《數字全球化:新時代的全球性流動》,2000-2014年 ,全球數據流從4.7TB增長到211.3TB,增長了43倍 , 與之相 對應的,全球商品流從10.6萬億美元增長到19萬億美元 , 全球服務貿易流從2.5萬億美元增長到4.9萬億美元,全球資本流( 外商直接投資 )從 1.39萬億美元增長到1.63 萬億美元。這就是大數據的力量。
時空大數據產業保持快速增長。時空大數據產業較之一般大數據產業更加寬泛和豐富。僅就一般大數據產業而言,據有關文獻對2012-2018年全球大數據市場規模分析,2015年全球大數據 產業規模同比增長24.2%,預計2015-2018年全球大數據產業規模的復合增長率為21.8%。
2.2 中國時空大數據發展態勢
中國政府高度重視大數據作為一種前瞻領域的戰略意義,正在加快推進相關政策的制定和實施 ,啟動促進大數據發展的數據強國計劃。
1)國家大數據戰略體系基本形成。
2014年,中國首次將大數據戰略寫入《政府工作報告》; 2015年8月,國務院發布了《促進大數據發展行 動綱要 》;同年10月,中共十八屆五中全會將大數 據寫入會議公報并升級為國家戰略;
2016年3月公布的《 國家 “ 十三五 ” 規劃綱要 》中 ,明確提出 “ 大 數據戰略及行動計劃”;2017年1月,正式發布《大數據產業發展規劃 (2016-2020)》,為大數據產業的持續健康發展確立了目標與路徑。國家大數據戰略體系基本形成。
2)地區大數據發展格局初步形成。
在國務院2015年發布《促進大數據發展行動綱要》之前,廣東(2012年12月 )、 上海 (2013 年7月 )、 貴州 (2014年2月 )等省( 市 )率先開展大數據地方政 策的先行先試 ;
在《促進大數據發展行動綱要》發布之后,各地政府加快跟進,截至2017年2月,全國已有28個省份出臺與大數據相關的政策文件;特別是兩批國家大數據綜合試驗區的獲批啟動,對中國大數據發展起到了重要輻射帶動作用。
3)數據開放取得初步成效 。
面對開放數據所能帶來的經濟發展的巨大潛能,中國政府正在推動全國范圍的數據開放工作。2015年發布的 《 促進大數據發展行動綱要 》明確提出,要在2017年底前形成跨部門數據資源共享共用格局 ,2018年底以前建成國家政府數據統一開放平臺,到2020年逐步實現交通、醫療、衛生、環境、氣象、企業登記監管等領域的數據向社會開放。
從實際執行情況來看,中央各部門間的數據共享與開放已取得一定進展,同時輻射帶動了各省、市、縣下設的十余萬個單位;以上海、北京為代表的十多個地方政府自2011年便陸續啟動了自己的數據開放計劃 。
4)大數據產業規模快速增長 。
據有關文獻,中國大數據產業規模到2018年將超過500億元人民幣,2015-2018年的復合增長率將達到47%,是全球大數據產業復合增長率的2.2倍,2018年以后的兩年,大數據核心產業將有40%左右的高增長空間。2017年發布的《大數據產業發展規劃(2016-2020)》提出 ,2020年大數據產 業將突破1萬億元人民幣的規模,年復合增長率將達到30%。
2.3 國內外時空大數據發展水平和存在的問題
從世界范圍看,美國是大數據的策源地和創新引領者。可以說,美國200多年的發展史也是一部圍繞美國人口普查的數據科學和數據文化形成的發展史。
200多年前的美國第一次人口普 查拉開了這個新生國家初數時代的序幕 , 數據在 內戰時期的成功應用成為1863年終結奴隸制的燈塔,從1865年內戰結束到1900年 “ 鍍金時代的三重崛起 ”(思維變革、組織變革和技術創新)影響 了其后整整一個世紀 ,20世紀30年代對選舉結果的預測研究催生了統計科學的一次重大變革——科學抽樣,1951年電子計算機走出 “ 象牙塔” 到20世紀80年代互聯網的普及促成了開放 時代的到來,與數據總量急驟增加相適應的摩爾定律、社交網絡、數據挖掘成為“ 改變世界的三股力量”,標志著大數據時代的到來,萬物皆聯網、無處不計算的普適計算即計算型社會時代正在到來。
美國200多年來數據科學和數據文化的形成與發展,使得美國在大數據理論和技術方面走在了世界各國的前面。
盡管如此 ,目前大數據領域仍然存在許多問題 。例如,關注商業大數據的多 ,而研究科學大數據的少;討論一般大數據的多,而研究時空大數據的少,忽視大數據的時空觀,這涉及對大數據本質的認識問題;“ 一切憑數據說話,一切靠數據決策” 的尊重事實( 數據 )、 強調精準、推崇理性和邏輯的大數據理念尚未普遍建立等等。
人們應深刻認識到,大數據不僅涉及自然科學,也涉及社會人文科學;不僅涉及社會經濟,也涉及內政外交和國防軍事。文化本質上是人類及 其社會的品格 ,或一個國家及其社會的品格,數據文化是人類及其社會對待數據( 事實 ) 的品格。
中國大數據發展總體態勢很好,但也存在一些急待解決的問題。
例如部分領域過熱,盲目建設大數據中心和重建設輕應用、重硬件輕軟件 重 復建設問題突出;數據開放進展相對滯后,地方數據開放的積極性不高,總體水平較低,質量參差不齊,試圖擁有或占有大數據的多,而真正開發應用大數據的少;
投入大數據領域研究的人力、物力、財力不足和產學研相結合的政策、體制機制不落實,數據隱含價值→計算發現價值→應用實現價值的大數據理論、技術 、 產品和服務模式體系遠未形成;數據文化的培育和普及未受到應有的重視,沒有認識到數據文化是我國大數據及其產業化發展的靈魂,是推動數據科學不斷發展的更基本、更深沉、更持久的力量。
盡管中國的大數據和數據文化相對滯后,但占有后發優勢,特別是2017年5月貴陽大數據博覽會期間,大數據戰略重點實驗室和全國科學技術名詞審定委員會發布的 “ 大數據十大新名詞”,即塊數據、主權區塊鏈、秩序互聯網、激活數據學 、5G社會、開放數據、數據交易、數據鐵籠、數據安全、數權法等,既揭示了大數據的時代特征 ,又反映了大數據的發展趨勢。
“ 大數據十大新名詞 ” 的發布代表了中國在實施大數據戰略方面取得的成績與經驗,說明中國在推動大數據發展中正在 搶占理論創新、實踐創新和規則創新的制高點。
時空大數據及其產業化
——地理信息產業的轉型升級版
3.1 時空大數據平臺
時空大數據平臺是時空大數據產業化的核心。它是指把各種分散的和分割的大數據即時空框架數據和時空變化數據匯聚到一個特定的平臺上,并使之發生持續的聚合效應 。
這種聚合效應就是通過數據多維融合和關聯分析與數據挖掘,揭示事物的本質規律,對事物做出更加快捷、更加全面、更加精準和更加有效的研判和預測。從這個意義上講,時空大數據平臺是大數據的核心價值,是大數據發展的高級形態,是大數據時代的解決方案。
3.2 “通用時空大數據平臺+”模式
從產業化的角度講,通用時空大數據平臺是指將時空框架數據匯聚在一個特定平臺上,利用這個平臺生產軍民兩用的基礎測繪地理信息產品。
所謂“通用時空大數據平臺+”模式,即以通用時空大數據平臺作為框架,聚合民用、軍用的時空變化數據,分別構成民用、軍用時空大數據平臺。
對于 “ 通用時空大數據平臺+民用”模式,即將地方政府各部門各行業的政務 、自然資源、規劃、交通、水利、管網、人口、經濟、人文、社會、醫療、教育、電力、公安等數據匯聚在通用時空大數據平臺上,使之成為新型智慧城市的 “ 智腦 ”,通過持續的聚合效應,生成各類(種)民用深加工知識產品,為政府綜合決策、各部門各行業和社會公眾提供智能化服務;
對于“通用時空大數據平臺+軍民”模式,即將戰場(作戰)環境、兵要、目標、情報、態勢等數據匯聚在通用時空大數據平臺上,使之成為聯合作戰一體化指揮的“ 智腦 ”,通過數據分 析與數據挖掘,生成各類軍用深加工知識產品,為國防建設、作戰指揮和作戰行動提供智能化決策支持 。
3.3 時空大數據平臺的構建
從目前信息技術發展情況看,時空大數據平臺的構建有4種模式可供借鑒:
一是基于網絡服務的空間信息共享與空間數據互操作技術模式 ;
二是基于網格服務的信息資源共享與協同工作(協同解決問題)技術模 式 ;
三是基于云計算的時空信息服務技術模式 ;
四是基于網格集成與彈性云的 混合式時空信息服務技術模式。
上述4種模式中,第一 、三種技術模式是分別基于網絡計算和云計算的,應用較普遍,特別是第三種技術模式;第二種技術模式是基于網格計算的,這里的網格是指新一代網絡或第三代互聯網,主要用于重大工程和復雜科學計算的廣義信息資源共享和協同工作,技術 門框相對要高;而第四種則是吸取了網格服務和云服務各自特點的優勢互補的技術模式 。
針對上述 4 種模式,從內涵、功能、技術架構、關鍵技術、標準、服務共享特點和發展趨勢等7個方面分析,可以看出4種技術模式都是采用面向服務的體 系架構,都是解決 “共 享”與 “服務” 問題,只不過“共享”的程度與“服務”的范圍 、 方式不完全相同;
網絡服務與網格服務的技術標準有相同的,也有不同的, 二者的大趨勢是兼容或融合,但標準是國際或國家統一的,服務提供方和服務請求方都必須清楚;而云服務標準可以是內部統一的,用戶不必清楚;網格服務是網絡服務的發展 , 云服務是網格服務的簡化版或商業化實現。
據此,提出如下構建時空大數據平臺的技術重點:
1)構建一個開放共享的體系架構, 強化共用,整合通用,開放應用。SOA 由 3個角色(服務提供者、服務請求者、服務注冊中心)和4個基本操作(服務提供者將自己的 “ 服務 ” 描述和發布到服務注冊中心,服務請求者在服務注冊中心訪問 和發現自己所需的 “ 服務 ”, 根據服務注冊中心的 “ 服務 ” 定位直接 “ 綁定 ” 服務提供者的 “ 服務 ”, 調 用 “ 服務 ”) 構成。
2)構建一張天地一體的信息服務網絡 為實現范圍更加廣泛的信息資源共享與多層次 、 多節點的協同工作提供嶄新的運行環境。包括時空信息獲取(實時化)、 處理(智能化)、服務(網絡/網格化)的一體化運行環境,多源異構時空信息融合環境,實現數據即服務軟件即服務、基礎設施即服務、平臺即服務 和知識即服務的信息資 源共享環境 , 多層次 、 多節點協同工作(協同解決 問題)的環境,以及分布異構時空信息系統網格集成的環境。
3)構建一個開放共享的時空信息服務“ 資源池 ”為時空大數據平臺應用服務提供強大支撐(數據體系)。通過多源異構時空大數據融合(聚合),形成一致性的數據集(全球一致、陸海一體、無縫連續),通過數據挖掘與知識發現 , 進一步提升治理體系和指揮決策的現代化水平。
4)構建一個通用功能平臺 通過服務化封裝,實現各類信息資源的高效調度 , 支撐信息服務 的智能化 。
5)構建一個高效運行的組織管理指揮體系 實現信息資源的匯聚共享和跨部門的多層次、多節點的協調聯動,保證時空大數據平臺安全 、可靠運行。
6)構建一套標準體系 保證時空大數據平臺規范、有序、健康、安全、可持續運行。
3.4 時空大數據的產業化
時空大數據產業化是通過時空大數據平臺產業化實現的。因為時空大數據產業化是一個新問題,應該走一條從基礎研究起步產業化創新之路。
1)要研究和建立以數據科學為核心的時空大數據理論體系 目前,“ 數據科學 ” 的邊界還不清晰,時空大數據理論研究薄弱,更未形成時空大數據的理論體 系,而這是時空大數據產業化的基礎 。
2)要研究和建立以 “ 數據隱含價值 → 計算發 現價值 → 應用實現價值 ” 為核心 , 以 “ 數據獲取(傳感器網)→處理(生產)→應用(服務)” 為產業鏈的 時空大數據產業化的技術體系 。
3)研究和設計包括軟件產品、硬件產品、軟硬件集成產品、各類(種)應用平臺產品和數字產 品在內的時空大數據產品體系。
地理信息產業轉型升級的驅動力
信息化的發展遵循數字化→網絡化→智能化的規律,地理信息產業的發展亦如此 ,智能化是地理信息產業發展的高級階段。
1) “ 互聯網+”改變地理信息產業發展的思維方式:跨界融合。
“ 互聯網+”本質上是互聯網、物聯網、云計算等新興信息技術在包括地理信息 產業在內的各行各業“ 全工作 流 ”、“全產業鏈”、“全價值鏈”中的深度融合和集成創新應用,已經成為包括地理信息產業在內的信息服務業發展的新動力。
因此,“互聯網+”的本質是跨界融合, “基礎地理信息+”和“ 通用時空大數據平臺 +”的本質也是跨界融合,“+” 是核心,提出跨界融合的解決方案是關鍵。只有這樣,才能更充分地發揮基礎地理信息和通用時空大數據平臺的“基礎”和“通用 ” 作用,實現地理信息產業到時空大數據產業的轉型升級。
2)云計算具有的信息資源管理、處理和應用的“全面彈性”支撐“地理信息產業 ”到“時空大數據產業”的轉型。
時空大數據產業化需要超強計算能力的支持。云計算是一種新的計算模式 ,它 通過 “ 池化”和 “云化”把數千臺甚至上萬臺機器都 放在一個“池子”里面 , 具有時間彈性和空間彈性 ,用戶需要多少CPU、內存、硬盤的 “虛擬電腦 ”,只要通過一種叫做“調度” 的算法,就可 以在 “池子”里面找到并使用自己所需要的信息資源。這就是 “資源彈性”IaaS。
云計算在“資源彈性”即基礎設施即服務(IaaS)之上增加了一層 “應用彈性”,即平臺即服務(PaaS)和軟件即服務(SaaS),以滿足時空大數據的“應用彈性“需求。云計算支撐時空大數據處理的分布、協作(同)化和智能化。通過任務分解,解決分布式問題;通過工作流重構,解決并行問題;通過算法調度, 解決協作(同)化問題。
3)人工智能是地理信息產業轉型升級的核心驅動力。
人工智能技術的發展經歷了推理期(20世紀50年代至70年代初)、知識期(20世紀中期開始)、學習期(20世紀80年代以來)。機器學習是人工智能技術發展進入學習期的標志性事件,即計算機通過學習獲取知識。算法、大數據和計算能力構成了人工智能的三要素或 “三駕馬車”。
其中,算法是用好大數據和計算能力的關鍵 需要靠機器學習來不斷優化,而算法的不斷優化又是靠不斷輸入大數據進行深度學習來實現的,沒有大數據,算法就成了 “無本之木、無米之炊 ”,數據質量不好,就會算不準。算法、大數據還要靠超算能力,沒有計算能力,算法就失去了引擎,大數據處理的快速性也不可能實現。
在人工智能的算法、大數據、計算能力三要素中,隨著智能感知技術的快速發展,時空大數據已出現爆炸式增長態勢,為時空大數據產業化提供充足的數據支撐;隨著計算機技術的快速發展,適應時空大數據產業化需求的計算能力已經完全具備;需要人們更加關注的是算法研究,特別需要加強多源異構時空大數據融合、分析、挖掘與知識發現、可視化等方面的算法研究。
在人工智能算法、大數據、計算能力 “ 三駕馬車 ” 的驅動下,地理信息產業 到時空大數據產業的轉型升級必將加速實現。(王家耀、武芳)
聲明①:文章部分內容來源互聯網,如有侵權請聯系刪除,郵箱 cehui8@qq.com
聲明②:中測網登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述,文章內容僅供參考。
加群提示:我們創建了全國32個省份的地方測繪群,旨在打造本地測繪同行交流圈,有需要請聯系管理員測小量(微信 cexiaoliang)進群,一人最多只能進入一個省份群,中介人員勿擾