甲骨文公司副總裁斯蒂芬·哈根報(bào)告實(shí)錄:
我也想感謝中國,以及GGIM共同聯(lián)合主辦了這個(gè)論壇。我的幻燈片是挺多的,但是因?yàn)橐M(jìn)行上傳,所以我跳過一些幻燈片,留更多的討論時(shí)間。
首先我想說一下我和吳教授以及武漢大學(xué)聯(lián)合開展了研究項(xiàng)目進(jìn)行了合作,我們很高興。我們現(xiàn)在說一下阿波羅11的計(jì)劃,可以說所有基站都不如我們的手機(jī),因?yàn)槲覀兊氖謾C(jī)相當(dāng)于一萬各基站的數(shù)據(jù),所以我們現(xiàn)在不用擔(dān)心計(jì)算的能力了,因?yàn)槲覀儸F(xiàn)在要處理的是大數(shù)據(jù)的情況。也就是說,我們一方面要面對(duì)數(shù)據(jù)的巨大的量,然后包括數(shù)據(jù)的變化速度多快,包括我們有不同的眾籌,包括有不同的數(shù)據(jù)來源,像這些城市的地圖都用到了這些多元的數(shù)據(jù)。另外我們還有視頻、音頻、臉書還有twitter等等這些軟件。今天我們都講了Zettabytes是最大的,我們現(xiàn)在制訂的數(shù)據(jù)就是300Zettabytes這種級(jí)別。那么我們現(xiàn)在還沒有政策怎么應(yīng)對(duì)這么大量的數(shù)據(jù)。這就是我們要說可持續(xù)發(fā)展,可持續(xù)發(fā)展實(shí)現(xiàn)地理數(shù)據(jù)是在核心之處,所以我們要與時(shí)俱進(jìn),從系統(tǒng)的交易和不同的格式,以博客等形式實(shí)時(shí)更新大數(shù)據(jù),就像吳教授剛才說的所有的實(shí)時(shí)數(shù)據(jù)流。那么我們的體系到底選擇用什么樣的數(shù)據(jù)呢?我們必須要有篩選和選擇,不能復(fù)制,要選擇相應(yīng)的數(shù)據(jù)進(jìn)行可視化的更改,因?yàn)槲覀兛赡苡幸恍┧^天真的使用者,他們對(duì)復(fù)雜的體系不能操作,所以你必須給要他們提供可視化的這種地圖。比如說加入歷史的數(shù)據(jù)、歷史的數(shù)據(jù)庫,還要加入這種安全性,因?yàn)槟阕鳛檎块T有可能不是所有的數(shù)據(jù)都能讓他們說去。所以我想說我們?cè)谶@種電網(wǎng)中,我們必須要有快速的一個(gè)體系決策,不需要人為地進(jìn)行延遲的決策,而需要這種自動(dòng)的決策體系。
我們有這樣的軟件可以獲取數(shù)據(jù),然后ISOTC211的標(biāo)準(zhǔn),我們可以整合這樣的數(shù)據(jù),帕斯卡兩天前也提到這方面的問題。我們來自于各個(gè)源頭,得到了很多數(shù)據(jù)傳感器,人類提供的數(shù)據(jù)、各種機(jī)器的數(shù)據(jù)。上了他們的服務(wù)器中,它們的格式也都不一樣,我們可能要制定相應(yīng)的標(biāo)準(zhǔn),但是因?yàn)槲覀冇胁粩嗟男碌膫鞲衅鞯某霈F(xiàn),我們的標(biāo)準(zhǔn)跟不上,那我們?cè)撛趺崔k呢?我們要有非常簡單的作為人為使用或者理解比較容易的模式,所以我們要審視一下原數(shù)據(jù)。我們的研究就是加入了一個(gè)原數(shù)據(jù)的層次,這個(gè)也就是說叫RDF原數(shù)據(jù)層次。比如這里有個(gè)物體我們起一個(gè)名字,另一個(gè)物體起另一個(gè)名字,也許你有同樣的物理物體,但是它可能被不同的用戶起了4-5個(gè)名字,那么我們通過原數(shù)據(jù)的層次,我們就說我通過這個(gè)層次的篩選我知道這是同一個(gè)物體,盡管它的名字不一樣。當(dāng)我?guī)Ыo他用戶的時(shí)候,我會(huì)給用戶用一個(gè)名字來展示。所以就是以同意的方式來向用戶展示。在地理信息中這樣的技術(shù)已經(jīng)存在了。比如我們看一下哪各行業(yè)已經(jīng)做了這方面的解決方案了,大家可能都知道,我們的醫(yī)療衛(wèi)生領(lǐng)域已經(jīng)做到了這一點(diǎn)。比如說你作為一個(gè)醫(yī)生,你的醫(yī)院必須要以患者的情況來做決策,比如說你有同一個(gè)腫瘤問題、癌癥問題,你既有腫瘤掃描也有X光,也有其他的研究,那么這種結(jié)果必須要轉(zhuǎn)述成同一種的標(biāo)準(zhǔn)和記錄,這樣的話無論是醫(yī)生和護(hù)士都遵循這個(gè)標(biāo)準(zhǔn)來檢查你的狀況。還有一個(gè)叫用于基因醫(yī)療領(lǐng)域的SNOWMED,這是一個(gè)全球的標(biāo)準(zhǔn),是基因腫瘤學(xué)所用的,比如DNA分析方面的。因?yàn)檫@個(gè)癥狀是以人類器官具體進(jìn)行描述,都不用醫(yī)學(xué)術(shù)語進(jìn)行展示。我們?cè)诳臻g角度,在地理信息角度也應(yīng)該這么做,我們都是非常努力解決非常困難的問題,但是我們需要用這樣的圖形的形式解決這個(gè)問題。我們?cè)谡勔话偃f或者五千萬的傳感器,但是我們這里提到的是一萬一的基準(zhǔn),為什么有一萬億呢?下一步可能會(huì)達(dá)到十萬億的基準(zhǔn),在座的各位都出臺(tái)了相應(yīng)的標(biāo)準(zhǔn)。還有我們搞情報(bào)的部門,他們都想追蹤所有的大數(shù)據(jù),知道個(gè)人在做什么事情,他們?cè)诟墒裁?。所以呢,在這種萬億的情況之下,我們?cè)趺礃幽軌蜻M(jìn)行更好的追蹤,也就是說我們所有的傳感器、所有的數(shù)據(jù)我們可以把它們關(guān)聯(lián)在一起,可以進(jìn)行詮釋,這就是我們能做的事情。
瓦妮莎剛才的幻燈比我這個(gè)好,這就是把開放式的數(shù)據(jù)進(jìn)行連接,這是我們?cè)瓟?shù)據(jù)的一個(gè)圖形,加注了所有的眾源數(shù)據(jù)進(jìn)行聯(lián)系。我們大家都提到了云和眾源的情況,我們提到平臺(tái),在平臺(tái)上怎么分解或者整合我們的數(shù)據(jù),我們既有了眾源數(shù)據(jù)進(jìn)來,一般都以這種方式進(jìn)來,比較分散、發(fā)散的。我提到“云”這個(gè)詞,云服務(wù)、公共云,像亞馬遜、微軟、IBM、谷歌它們都有公共云,也就是說把你所有的能源都上傳到云里頭。我們也可以跟其他的一樣提供這種公共云,另外還有私有云。像政府部門它們需要它們自己的私有云,還有不能泄露信息,比如醫(yī)院也一樣,你也希望你的銀行也有私有云,他們的技術(shù)是一樣的,只不過適用的地點(diǎn)不一樣。另外還有安全方面、保護(hù)方面。
想談一下開源的情況,前面的發(fā)言人都講了很多了開放源的情況。我們并不是說開放源不好,有很多開放源的平臺(tái),有的時(shí)候如果我們硬件太多的話,現(xiàn)在需求是越來越下降了,但是軟件的成本和服務(wù)的成本卻是越來越增長了,所以隨著開源的發(fā)展,這個(gè)幻燈片看起來有點(diǎn)有趣。我們有一輛車,但是有很多的組件、部件、零部件,這就和開源一樣,你自己拿到數(shù)據(jù)源,自己要組織這輛車進(jìn)行測(cè)試,所以開源組裝的過程中和這個(gè)車是一樣的,你的勞動(dòng)力的成本是非常高的,你可以發(fā)現(xiàn)勞動(dòng)力的成本比以前更多了,特別我希望今天就要把這個(gè)車組裝好,下午要開車回家。還有這樣的情況,開源是唯一正確的方式,給大家舉個(gè)例子,我和聯(lián)合國人居署談到,你給他們提供自愿的編程,我們下載開源的軟件,雖然這些都不花錢,但是很多情況下我們需要在你工作的區(qū)域向用戶展示一下他是怎么運(yùn)行的,不要浪費(fèi)時(shí)間,我們?cè)诤芏嗟胤桨阉袠邮轿募?,就是我們從原形樣式開始,不要考慮太多最后要達(dá)到什么樣的目的,只要開始了漫漫征程,我們就可以了。這是一個(gè)游戲的過程,我們是最后要給大家提供唯一的一個(gè)平臺(tái),我們可以把數(shù)據(jù)流、視頻流都加注這里面進(jìn)行實(shí)時(shí)加速,包括安全性還有深入的分析放到不同的云上,公共云、私有云,這是最后的結(jié)果。但是我們這個(gè)過程結(jié)束就完了,我們要從開源開始,從樣式文件開始,也就是這個(gè)世界一個(gè)開源的世界。謝謝大家的關(guān)注!
{{item.content}}