大數(shù)據(jù)的崛起不過20年的時間,已經(jīng)對人類社會產(chǎn)生了摧枯拉朽般的發(fā)展影響。舊的思維方式被打破,新的社會體系在形成,每個人,每件事,每一次活動都成了數(shù)據(jù)的“供給者“,以及數(shù)據(jù)分析反饋的“享用者”。
2017年4月19日,武漢大學(xué)副校長、中國工程院院士李建成應(yīng)邀出席了泰伯網(wǎng)在四川成都協(xié)辦的“首屆中國空間大數(shù)據(jù)產(chǎn)業(yè)高峰論壇“,和與會嘉賓分享了大數(shù)據(jù)的發(fā)展歷程,并著重分析了大數(shù)據(jù)時代地理信息產(chǎn)業(yè)發(fā)展的機(jī)遇。
以下為會議現(xiàn)場速記節(jié)選(未經(jīng)院士本人確認(rèn))。
李建成院士:
尊敬的各位嘉賓,各位地理信息產(chǎn)業(yè)的各位同仁。非常高興應(yīng)泰伯的邀請做一個關(guān)于大數(shù)據(jù)地理測繪與未來大數(shù)據(jù)的思考。
目前,各個行業(yè),各個領(lǐng)域都在談大數(shù)據(jù),大數(shù)據(jù)的確在未來的生活、工作當(dāng)中將起著決定性的作用,我們也從過去的IT時代,進(jìn)入了全新的DT時代,而DT時代給測繪帶了史無前例的機(jī)遇。
大數(shù)據(jù)時代的思維轉(zhuǎn)變
大數(shù)據(jù)時代帶來的是一種新的基礎(chǔ)資源,是一種新的思維方式,是一種新的技術(shù),也將帶來一種新的產(chǎn)業(yè),一種職業(yè),以及一種行業(yè)發(fā)展的契機(jī)。
在這里舉一個例子,現(xiàn)在出行都用攜程訂票,或者使用航班管家。但是,在2012年之前,民航局的信息是封鎖的。之后,它專門成立了一家公司,把數(shù)據(jù)開放出去,目前一年產(chǎn)值已經(jīng)達(dá)到五百億。
從這個例子我們可以看出,數(shù)據(jù)單放著價值密度非常低,但是使用起來價值密度會非常高。這也是大數(shù)據(jù)時代的一個特色,就是要想為己必須先為人,就是他提供信息,反過來信息支撐了公司的發(fā)展。
關(guān)于大數(shù)據(jù)紅利與信息安全、隱私的矛盾
談到大數(shù)據(jù)利用,不可避免的要涉及信息安全和個人隱私的問題。我國成立了四個領(lǐng)導(dǎo)小組,其中網(wǎng)絡(luò)信息安全領(lǐng)導(dǎo)小組是習(xí)近平總書記擔(dān)任組長,可見從國家層面對于信息安全的重視程度。
那么該如何將大數(shù)據(jù)的紅利與信息安全、個人隱私處理好?
矛盾的焦點(diǎn)在于:隱私泄密和濫用風(fēng)險、外部惡意攻擊更為集中、現(xiàn)有網(wǎng)絡(luò)安全措施滯后。需要注意的是,現(xiàn)在很多公司都提供免費(fèi)的云存儲,它意在搜集你的信息,所以保護(hù)每個人的隱私信息變得非常重要。
我的觀點(diǎn)是,數(shù)據(jù)開放和信息安全是同一事物的正反兩個方面,要堅持以發(fā)展促進(jìn)安全,以安全促發(fā)展的原則,不能以不上網(wǎng),不共享,不互聯(lián)互通來保護(hù)安全。政府信息資源要以共享為原則,不共享為例外。
信息安全和個人隱私保護(hù)需要通過發(fā)展網(wǎng)絡(luò)和大數(shù)據(jù)技術(shù)才能實(shí)現(xiàn)。這面臨著法律監(jiān)管條例缺失和個人用戶數(shù)據(jù)保護(hù)的法律界限模糊的問題。需要從兩方面去理解:一方面是大數(shù)據(jù)挖掘帶來的益處,即基于大數(shù)據(jù)分析的網(wǎng)絡(luò)安全防護(hù)體系,以及基于大數(shù)據(jù)分析的攻擊檢測和防護(hù);另一方面是大數(shù)據(jù)帶來的安全困境,即數(shù)據(jù)自身的可信度,還有抗隱私泄露的大數(shù)據(jù)分析技術(shù),有很多數(shù)據(jù)是不真實(shí)的。
這里要引入的是關(guān)于大數(shù)據(jù)的三個變革思維:
樣本 = 總體——利用所有數(shù)據(jù),而不是一小部分?jǐn)?shù)據(jù)
2+2 = 3.9——允許不精確,接受混亂性
“是什么”,而不是“為什么”,關(guān)注相關(guān)關(guān)系而非因果關(guān)系
我們過去是先驗(yàn)證,現(xiàn)在是先發(fā)現(xiàn)再去想。在以前人們需要有了想法,然后再去收集數(shù)據(jù)去測試這個想法的可行性,而現(xiàn)在通過大量的數(shù)據(jù)和更好工具,可以先發(fā)現(xiàn)相關(guān)關(guān)系,再產(chǎn)生想法。大多數(shù)情況下,一旦完成了對大數(shù)據(jù)的相關(guān)分析,而又不再滿足于僅僅知道“是什么”時,就會繼續(xù)向更深層次研究因果關(guān)系,找出背后的“為什么”。
大數(shù)據(jù)發(fā)展所面臨的問題和相關(guān)技術(shù)
大數(shù)據(jù)技術(shù)要解決的問題,就是快速的數(shù)據(jù)流轉(zhuǎn),多樣的數(shù)據(jù)類型,海量的數(shù)據(jù)規(guī)模,最后它的交集就是中間的價值,所以我們從大量的非結(jié)構(gòu)化的數(shù)據(jù)流,結(jié)構(gòu)化的數(shù)據(jù)流,海量的數(shù)據(jù)終提取一小點(diǎn)有價值的數(shù)據(jù)。
將來我們的數(shù)據(jù)就是可視化,能用一句話說清楚不要用兩句話,能拿圖表表述的不要說話。還有就是非結(jié)構(gòu)化數(shù)據(jù)分析和數(shù)據(jù)量、分析深度分析自動化,還有數(shù)據(jù)挖掘并進(jìn)行機(jī)器學(xué)習(xí)的應(yīng)用,還有數(shù)據(jù)密集計算的效率,不同計算長頸的特點(diǎn),高效數(shù)據(jù)查詢訪問低成本超大容量,預(yù)處理,多源,多摹本數(shù)據(jù)融合。
數(shù)據(jù)采集包括很多,比如網(wǎng)頁支柱,網(wǎng)絡(luò)機(jī)器人,我們相當(dāng)于放一個蟲子整個網(wǎng)絡(luò)去搜索。另外就是結(jié)構(gòu)化和非結(jié)構(gòu)化,半結(jié)構(gòu)化數(shù)據(jù),分布式文件系統(tǒng),關(guān)系數(shù)據(jù)庫,非關(guān)系數(shù)據(jù)庫,數(shù)據(jù)倉庫等等。數(shù)據(jù)分析與挖掘,有各種各樣的算法,最后就是計算結(jié)果表示,標(biāo)簽云,聚類圖,空間信息流,熱圖等等。
大數(shù)據(jù)時代一定要有開放的心態(tài)
大數(shù)據(jù)利用不確定性的海量數(shù)據(jù)發(fā)現(xiàn)規(guī)律以及趨勢預(yù)測,我們信息化測繪需要解決什么問題呢?
比如數(shù)據(jù)的實(shí)施性。如果像民航公司能把民航系統(tǒng)開放給你們,向全國全球提供中國的地理信息數(shù)據(jù),那兩年之內(nèi)一定會做大?,F(xiàn)在各個導(dǎo)航公司的地理信息都在他們公司來做,而我們國家做了那么多事都放在保險柜里面沒有用,所以要跟隨大數(shù)據(jù)時代的機(jī)遇,一定要有開放的心態(tài)。
另外要充分利用信息技術(shù)、空間技術(shù)和網(wǎng)絡(luò)技術(shù),實(shí)現(xiàn)測繪地理信息服務(wù)于社會經(jīng)濟(jì)發(fā)展的測繪生產(chǎn)、生活方式和功能形態(tài)。
測繪信息在一定尺度下對地理實(shí)體的精準(zhǔn)描述,空間大數(shù)據(jù)分析決策需要時空信息,大數(shù)據(jù)與位置信息密切關(guān)聯(lián),大數(shù)據(jù)與測繪地理信息聯(lián)合空間大數(shù)據(jù),大數(shù)據(jù)是一種新的數(shù)據(jù)源,一種新方法,能開創(chuàng)新領(lǐng)域??臻g大數(shù)據(jù)的目的不在于地理實(shí)體的精確描述,而是地理實(shí)體的廣泛應(yīng)用。
大數(shù)據(jù)時代測繪地理信息的發(fā)展與機(jī)遇
地理數(shù)據(jù)包括地圖數(shù)據(jù)、遙感數(shù)據(jù)、大地基準(zhǔn)數(shù)據(jù),簡單一句話就是連續(xù)與時間相關(guān)的定位就叫導(dǎo)航,單點(diǎn)的、獨(dú)立的和時間沒有關(guān)系的就叫定位??臻g媒體數(shù)據(jù)包含了位置與時間因標(biāo)記數(shù)字化文字、圖象、圖形、聲音、視頻影響和動畫媒體等。
數(shù)據(jù)價值大但價值密度遞,現(xiàn)在大多數(shù)都是用的測繪地圖。地理信息服務(wù)關(guān)健在于什么是信息,什么是模式,以什么樣的信息,什么樣的模式,什么樣的品質(zhì)提供信息服務(wù)。
現(xiàn)階段的問題是信息不夠豐富,時效性差,地理空間信息和用戶感興趣的專題信息難以結(jié)合,實(shí)施分析決策能力不足。觀點(diǎn)是針對地理信息服務(wù),相對于云服務(wù)模式、大數(shù)據(jù)更清晰。
中國工程院重大項(xiàng)目咨詢智能城市建設(shè)與大數(shù)據(jù)戰(zhàn)略研究中提出,以大數(shù)據(jù)時空多維為核心,研究智能城市實(shí)時獲取、多源、多事態(tài)的空間全覆蓋的空間信息及實(shí)施介入的各類傳感器數(shù)據(jù),空間大數(shù)據(jù)挖掘和知識發(fā)現(xiàn),利用時空化城市大數(shù)據(jù)計算模型與方法及動態(tài)欣喜的實(shí)時分析技術(shù)。
另外,建議明確提出建設(shè)地理空間大數(shù)據(jù),旨在實(shí)現(xiàn)地理空間信息與可空間關(guān)聯(lián)的各類信息的融合和分析決策,另外研究大數(shù)據(jù)獲取、組織、管理、分發(fā),還有跨部門、跨領(lǐng)域的合作機(jī)制及市場運(yùn)作模式,還有與空間大數(shù)據(jù)的隱私保護(hù),大家知道現(xiàn)在我們的隱私基本上沒有了,因?yàn)槟阍诰W(wǎng)上行為全部在后臺顯示。同時,大數(shù)據(jù)對于傳統(tǒng)地理空間信息全過程產(chǎn)生了深刻的影響,特別是對現(xiàn)有信息的程度有關(guān)聯(lián)性。
世界原來是二元空間,人類社會和物理世界,三十年來,信息力量的迅速壯大,已成長除世界世界、人類社會兩級之外的新一級,也就是信息世界,人類離不開信息,信息也離不開人類。任意兩級的互動,都可以對第三級的發(fā)展產(chǎn)生重大影響,甚至對國家產(chǎn)生巨大影響。既然數(shù)據(jù)對人類社會生存、生產(chǎn)活動發(fā)展這么重要,所以信息必須開放。
計算機(jī)從發(fā)現(xiàn)到發(fā)明只用了70年,而工業(yè)革命經(jīng)歷了三百年,現(xiàn)在目前工業(yè)和制造業(yè)的結(jié)合,與信息技術(shù)結(jié)合產(chǎn)生了工業(yè)制造的革命,所以地理信息行業(yè)沒有理由不和信息技術(shù)結(jié)合,如果一個行業(yè)不和現(xiàn)在的信息技術(shù)結(jié)合必然會落后?,F(xiàn)在農(nóng)業(yè)現(xiàn)代化是和工業(yè)技術(shù)分不開的,建筑行業(yè)都與工業(yè)技術(shù)離不開,如果工業(yè)技術(shù)和信息業(yè)結(jié)合的話制造業(yè)發(fā)展也落后,信息的處理和欣喜的應(yīng)用還有很大的距離,尤其是觀念的局限性,我們一定要打破觀念的局限性,從傳統(tǒng)思維框架走向現(xiàn)在的信息思維來考慮發(fā)展。
{{item.content}}