“智慧城市”大數(shù)據(jù)時(shí)空融合密碼

泰伯網(wǎng)
佚名
國(guó)家發(fā)改委和中央信息辦在智慧城市建設(shè)規(guī)劃中,將“時(shí)空基礎(chǔ)設(shè)施”建設(shè)的組織任務(wù)分配給(原)國(guó)家測(cè)繪地理信息局,很多城市啟動(dòng)了“智慧城市時(shí)空大數(shù)據(jù)與云平臺(tái)”項(xiàng)目。 在《智慧城市時(shí)空大數(shù)...

國(guó)家發(fā)改委和中央信息辦在智慧城市建設(shè)規(guī)劃中,將“時(shí)空基礎(chǔ)設(shè)施”建設(shè)的組織任務(wù)分配給(原)國(guó)家測(cè)繪地理信息局,很多城市啟動(dòng)了“智慧城市時(shí)空大數(shù)據(jù)與云平臺(tái)”項(xiàng)目。

在《智慧城市時(shí)空大數(shù)據(jù)與云平臺(tái)建設(shè)技術(shù)大綱(2017版)》中,明確:“時(shí)空基礎(chǔ)設(shè)施作為智慧城市的重要組成,既是智慧城市不可或缺的、基礎(chǔ)性的信息資源,又是其他信息交換共享與協(xié)同應(yīng)用的載體,為其他信息在三維空間和時(shí)間交織構(gòu)成的四維環(huán)境中提供時(shí)空基礎(chǔ),實(shí)現(xiàn)基于統(tǒng)一時(shí)空基礎(chǔ)下的規(guī)劃、布局、分析和決策。”

對(duì)以上目標(biāo),筆者完全認(rèn)同。同時(shí),筆者認(rèn)為——在“信息資源提供”和成為“交換共享與協(xié)同應(yīng)用的載體”兩者之中,后者更為重要,時(shí)空作為數(shù)據(jù)融合共享的載體是天然的。我們一起剝絲抽繭,討論一下時(shí)空大數(shù)據(jù)在智慧城市中的應(yīng)用模式。

01.支撐時(shí)空決策,是時(shí)空大數(shù)據(jù)的存在價(jià)值

關(guān)于“大數(shù)據(jù)”的描述,筆者認(rèn)同Teradata首席分析專(zhuān)家Bill Franks在《駕馭大數(shù)據(jù)》中表達(dá)的觀點(diǎn):沒(méi)有一種數(shù)據(jù)叫做“大數(shù)據(jù)”,“大”和“數(shù)據(jù)”都不重要,使用數(shù)據(jù)的方法才重要。我們無(wú)需爭(zhēng)論哪些數(shù)據(jù)屬于大數(shù)據(jù)和時(shí)空大數(shù)據(jù),所有的數(shù)據(jù)都在時(shí)空中,也都是大數(shù)據(jù),只要用大數(shù)據(jù)的方法去使用。

收集和使用數(shù)據(jù)的方法取決于需要解決的問(wèn)題,我們把工作任務(wù)分為兩類(lèi),一類(lèi)是事務(wù)性任務(wù),需要精確采集、記錄事實(shí)信息和處置過(guò)程,比如土地所有權(quán)發(fā)證、工程測(cè)量、辦理銀行存款、電子商務(wù)交易;一類(lèi)是決策類(lèi)任務(wù),例如土地規(guī)劃、應(yīng)急指揮、營(yíng)銷(xiāo)策略制定等,需要收集多維度數(shù)據(jù)進(jìn)行綜合分析。

大數(shù)據(jù)的應(yīng)用目標(biāo)是支持決策類(lèi)任務(wù),而非事務(wù)性工作。事務(wù)性工作是數(shù)據(jù)產(chǎn)生的源頭,其積累的數(shù)據(jù)成果,經(jīng)過(guò)抽取、融合后方可成為支撐大數(shù)據(jù)分析的輸入。大數(shù)據(jù)分析不必、也不能直接面向原始業(yè)務(wù)數(shù)據(jù)。

順便說(shuō)一下大數(shù)據(jù)和云平臺(tái)的關(guān)系。云平臺(tái)的本質(zhì)是計(jì)算資源和存儲(chǔ)資源的虛擬化,是大數(shù)據(jù)實(shí)施的適宜支撐環(huán)境,但非必須。云平臺(tái)能力并不等同于大數(shù)據(jù)能力,兩者的關(guān)系類(lèi)似于“結(jié)婚和買(mǎi)房”。

02.數(shù)據(jù)融合,是時(shí)空大數(shù)據(jù)的核心能力

智慧城市首先強(qiáng)調(diào)數(shù)據(jù)共享,各地紛紛成立“大數(shù)據(jù)局”匯集數(shù)據(jù),此舉就可以消除“信息孤島”了嗎?一位資深地方信息中心主任半開(kāi)玩笑地說(shuō):以前是“煙囪式”的數(shù)據(jù)調(diào)用,現(xiàn)在將一堆煙囪捆在一起集中排放,污染更加嚴(yán)重。

數(shù)據(jù)如果無(wú)法融合,共享便失去意義。

數(shù)據(jù)融合有兩種,一種是以人為線(xiàn)索。比如,將一個(gè)人在公安、社保、工商、稅務(wù)等多個(gè)部門(mén)的數(shù)據(jù)打通,實(shí)現(xiàn)信息互通。這是辦公流程的優(yōu)化,事務(wù)性工作的效率提升,嚴(yán)格講不屬于大數(shù)據(jù)的范疇。在商業(yè)大數(shù)據(jù)領(lǐng)域,通過(guò)人的行為數(shù)據(jù)進(jìn)行“客戶(hù)畫(huà)像”,制定個(gè)性化的營(yíng)銷(xiāo)策略,應(yīng)屬于大數(shù)據(jù)應(yīng)用范疇。

另外一種融合,便是時(shí)空融合,目的是支撐城市管理者的時(shí)空決策,例如:土地規(guī)劃、產(chǎn)業(yè)布局規(guī)劃、交通治理、環(huán)境治理、應(yīng)急指揮等等,基本邏輯是“何時(shí)、何地、何為”。時(shí)間和空間即是所有數(shù)據(jù)的共同特征,又是所有智能的基礎(chǔ),基于時(shí)空的數(shù)據(jù)融合是必然途徑。

數(shù)據(jù)融合需要線(xiàn)索,在商業(yè)大數(shù)據(jù)中,圍繞著“人”為線(xiàn)索形成“客戶(hù)畫(huà)像”;在時(shí)空大數(shù)據(jù)中,需要定義“地理實(shí)體”進(jìn)行數(shù)據(jù)融合,形成“地理畫(huà)像”。

03.基于“地理實(shí)體”的數(shù)據(jù)融合

在《智慧城市時(shí)空大數(shù)據(jù)與云平臺(tái)建設(shè)技術(shù)大綱(2017版)》中,明確要求建設(shè)“地理實(shí)體”數(shù)據(jù):以地形圖為基礎(chǔ),對(duì)境界、政區(qū)、道路、水系、院落、建筑物、植被等內(nèi)容進(jìn)行實(shí)體化,并賦予唯一編碼,作為與其它行業(yè)和專(zhuān)題數(shù)據(jù)進(jìn)行關(guān)聯(lián)的基礎(chǔ)。

地理實(shí)體是占據(jù)一定空間的地物或者現(xiàn)象,地理實(shí)體定義及編碼的目標(biāo)是“通過(guò)編碼交換空間信息”,交換的內(nèi)容是指附著在空間上的屬性信息,例如土地性質(zhì)、人口統(tǒng)計(jì)、經(jīng)濟(jì)指標(biāo)等等。實(shí)施的關(guān)鍵是:建立編碼與空間范圍的對(duì)應(yīng)關(guān)系并使之成為統(tǒng)一標(biāo)準(zhǔn),例如全國(guó)統(tǒng)一的郵政編碼和行政區(qū)劃。

編碼是溝通效率最高、不易產(chǎn)生歧義且管理效率最高的手段,比如身份證號(hào)、樓棟號(hào)、學(xué)籍號(hào)、地類(lèi)代碼等。用編碼代表空間范圍也是一種常用手段,如標(biāo)準(zhǔn)圖幅號(hào)、投影帶號(hào)、電話(huà)區(qū)號(hào)等。

用地理編碼作為數(shù)據(jù)的空間關(guān)聯(lián)線(xiàn)索,可以避免多尺度、多投影、多格式地圖數(shù)據(jù)整合所帶來(lái)的繁瑣工作。

但是,空間單元本質(zhì)上是業(yè)務(wù)管理單元,每個(gè)部門(mén)都有各自的單元?jiǎng)澐趾途幋a標(biāo)準(zhǔn),并在業(yè)務(wù)運(yùn)行和信息系統(tǒng)建設(shè)中貫徹執(zhí)行。郵政部門(mén)劃定郵政編碼、教育部門(mén)劃定學(xué)區(qū)、交通部門(mén)劃定道路分段、國(guó)土部門(mén)劃定地塊、城管部門(mén)劃定城管網(wǎng)格、公安部門(mén)劃定片警轄區(qū)……。

不同領(lǐng)域的空間業(yè)務(wù)單元?jiǎng)澐植町愋院艽螅ゲ幌嗳?,不可能設(shè)計(jì)出一套適合所有行業(yè)的劃分規(guī)則;即使存在完美方案也難以推廣,會(huì)涉及業(yè)務(wù)規(guī)則調(diào)整和信息系統(tǒng)重建,統(tǒng)一的、唯一的編碼無(wú)從談起,將編碼作為數(shù)據(jù)關(guān)聯(lián)線(xiàn)索也就無(wú)法落實(shí)。

在“大數(shù)據(jù)局”模式下,各部門(mén)提交原始業(yè)務(wù)數(shù)據(jù),必會(huì)由數(shù)據(jù)規(guī)格多樣而帶來(lái)數(shù)據(jù)融合困境,“煙囪”依舊;而制定一個(gè)統(tǒng)一空間標(biāo)準(zhǔn),強(qiáng)制推廣到各個(gè)部門(mén),業(yè)務(wù)規(guī)則沖突必然導(dǎo)致障礙重重;只有在所有業(yè)務(wù)的底層,設(shè)計(jì)一個(gè)共同的融合架構(gòu),才可能從根本上解決數(shù)據(jù)融合的問(wèn)題。

04.基于空間網(wǎng)格的地理實(shí)體定義和編碼方法

有沒(méi)有一種方法,既不改動(dòng)各領(lǐng)域的業(yè)務(wù)單元?jiǎng)澐郑帜軌驅(qū)崿F(xiàn)“通過(guò)編碼交換空間信息”的目標(biāo)呢?

答案就是基于空間網(wǎng)格的地理實(shí)體定義和編碼方法。第一步,設(shè)計(jì)一套全域覆蓋的多級(jí)基礎(chǔ)空間網(wǎng)格,并賦予唯一編碼。設(shè)定最小網(wǎng)格尺寸,按四叉樹(shù)逐級(jí)向上合并生成上一級(jí)網(wǎng)格,網(wǎng)格編碼作為網(wǎng)格在計(jì)算機(jī)中的存儲(chǔ)形態(tài)。

第二步,用網(wǎng)格集合定義地理實(shí)體,網(wǎng)格集合編碼作為地理實(shí)體編碼。不同行業(yè),不同尺度的地理實(shí)體,選擇不同層次的網(wǎng)格集合來(lái)定義。例如:用1米網(wǎng)格記錄建筑物信息,用2米網(wǎng)格記錄土地利用現(xiàn)狀,用100米網(wǎng)格記錄人口數(shù)量,用1公里網(wǎng)格記錄空氣質(zhì)量,用5公里網(wǎng)格記錄氣象信息。

地理實(shí)體編碼由所覆蓋“基礎(chǔ)網(wǎng)格編碼”組合生成,最完整的編碼是把所有覆蓋網(wǎng)格的編碼連接在一起,也可進(jìn)行編碼壓縮避免過(guò)長(zhǎng)。這樣,解析編碼即可獲得地理對(duì)象的組成網(wǎng)格,進(jìn)而獲得地理實(shí)體的覆蓋范圍。如下圖示意,可根據(jù)需要的空間精度選擇合適層次的網(wǎng)格,網(wǎng)格越小,編碼越長(zhǎng),也越接近原始精度。

事實(shí)上,在大數(shù)據(jù)應(yīng)用中,并不需要原始精度的業(yè)務(wù)數(shù)據(jù),也不需要原始數(shù)據(jù)的完整內(nèi)容,而是根據(jù)應(yīng)用分析和決策支持的需要進(jìn)行抽取和簡(jiǎn)化,而空間網(wǎng)格是空間簡(jiǎn)化的適宜方式。如果需要原始數(shù)據(jù),通過(guò)網(wǎng)格索引調(diào)用即可。

由于編碼只與地理實(shí)體的覆蓋網(wǎng)格有關(guān),而與業(yè)務(wù)內(nèi)容無(wú)關(guān),此編碼可自動(dòng)生成;同一領(lǐng)域的業(yè)務(wù)單元?jiǎng)澐衷诳臻g上不重疊,編碼的唯一性可以保證;當(dāng)某一領(lǐng)域的空間業(yè)務(wù)單元調(diào)整時(shí),數(shù)據(jù)共享融合系統(tǒng)無(wú)需改動(dòng)。

如用戶(hù)的數(shù)據(jù)為GIS數(shù)據(jù),解析圖形即可獲得編碼;如用戶(hù)數(shù)據(jù)為表格數(shù)據(jù),解析其中地名地址信息即可生成編碼,只需提前生成標(biāo)準(zhǔn)的地名地址網(wǎng)格編碼;對(duì)于智能感知數(shù)據(jù),也可選擇合適的網(wǎng)格級(jí)別進(jìn)行空間化標(biāo)定。

通過(guò)一個(gè)輕量化的數(shù)據(jù)抽取工具,對(duì)接到不同行業(yè)的業(yè)務(wù)系統(tǒng)中,即可以自動(dòng)生成形式為“地理實(shí)體編碼+屬性數(shù)據(jù)”交換數(shù)據(jù),由于所有地理實(shí)體基于相同的基礎(chǔ)空間網(wǎng)格生成,基礎(chǔ)網(wǎng)格是不同地理實(shí)體溝通的橋梁,各種空間分析可利用“編碼計(jì)算”完成,利用地理編碼進(jìn)行多源異構(gòu)數(shù)據(jù)的共享、交換、協(xié)同和融合得以實(shí)現(xiàn)。

05.基礎(chǔ)時(shí)空框架與時(shí)空網(wǎng)格數(shù)據(jù)倉(cāng)庫(kù)

在李德仁院士的論文《從數(shù)字地圖到空間信息網(wǎng)格——空間信息多級(jí)網(wǎng)格理論思考》(2003)中,明確指出:“空間數(shù)據(jù)種類(lèi)繁多、數(shù)據(jù)格式各異、存在多種比例尺、多種空間參考系和多種投影類(lèi)型。這給需要使用空間數(shù)據(jù)的用戶(hù)帶來(lái)了很大的困難,不利于空間信息的共享。究其原因,主要在于GIS是面向空間數(shù)據(jù),特別是地圖數(shù)據(jù)的,而不是直接面向空間信息的。” 空間信息網(wǎng)格使空間應(yīng)用直接面向空間信息,走出地圖的束縛。

智慧城市時(shí)空大數(shù)據(jù)平臺(tái)需要建立基礎(chǔ)空間網(wǎng)格,作為空間基礎(chǔ)設(shè)施;將連續(xù)的時(shí)間離散化,形成多尺度基礎(chǔ)時(shí)間網(wǎng)格,是以時(shí)間為線(xiàn)索進(jìn)行數(shù)據(jù)檢索和融合的基礎(chǔ)框架;還需建立標(biāo)準(zhǔn)的地名地址網(wǎng)格對(duì)象,是地名地址空間范圍的網(wǎng)格表達(dá),是基于基礎(chǔ)空間網(wǎng)格的公共網(wǎng)格集合。“基礎(chǔ)時(shí)空網(wǎng)格+地名地址網(wǎng)格對(duì)象”組成了智慧城市“基礎(chǔ)時(shí)空框架”,是大數(shù)據(jù)時(shí)空融合的底層支撐。

基礎(chǔ)時(shí)空框架與具體數(shù)據(jù)無(wú)關(guān),網(wǎng)格劃分是靜態(tài)的,不會(huì)因城市擴(kuò)張、行政區(qū)劃合并、撤消、分割等情況而改變,不同時(shí)間的信息網(wǎng)格具有空間可比性,可方便地進(jìn)行時(shí)序分析。同時(shí),各種量化的統(tǒng)計(jì)指標(biāo)都基于共同的基礎(chǔ)時(shí)空框架,也便于不同行業(yè)的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行時(shí)空對(duì)比分析。

從不同行業(yè)數(shù)據(jù)庫(kù)中抽取出來(lái)的網(wǎng)格數(shù)據(jù)匯集到一起,形成了“時(shí)空網(wǎng)格數(shù)據(jù)倉(cāng)庫(kù)”。數(shù)據(jù)倉(cāng)庫(kù)是面向決策過(guò)程的、面向主題的、集成的、穩(wěn)定的、不同時(shí)間的時(shí)空網(wǎng)格數(shù)據(jù)集合,是實(shí)現(xiàn)時(shí)空決策分析的數(shù)據(jù)基礎(chǔ)和支撐環(huán)境。在數(shù)據(jù)倉(cāng)庫(kù)之上,構(gòu)建若干時(shí)空決策分析服務(wù),形成支撐智慧城市時(shí)空大數(shù)據(jù)決策支持分析的完整架構(gòu)。

在基礎(chǔ)時(shí)空框架的支撐下,時(shí)空大數(shù)據(jù)平臺(tái)可提供基于網(wǎng)格的公用基礎(chǔ)數(shù)據(jù)資源;各行業(yè)之間在框架內(nèi)基于網(wǎng)格交換信息;更重要的是,有共同基因的網(wǎng)格數(shù)據(jù)匯聚到一起后,智慧城市的各項(xiàng)時(shí)空決策得以高效務(wù)實(shí)地進(jìn)行。

總結(jié)

智慧城市時(shí)空大數(shù)據(jù)與云平臺(tái)建設(shè)中,數(shù)據(jù)類(lèi)型和數(shù)據(jù)范圍擴(kuò)展以及運(yùn)行環(huán)境的云平臺(tái)升級(jí),僅完成了“基礎(chǔ)信息資源提供”的目標(biāo),而利用時(shí)空網(wǎng)格體系構(gòu)建基礎(chǔ)時(shí)空框架和數(shù)據(jù)倉(cāng)庫(kù),突破數(shù)據(jù)融合瓶頸,才能成為“交換共享與協(xié)同應(yīng)用的載體”,實(shí)現(xiàn)“基于統(tǒng)一時(shí)空基礎(chǔ)下的規(guī)劃、布局、分析和決策”,才能稱(chēng)得上智慧城市的“時(shí)空基礎(chǔ)設(shè)施”。

THEEND

最新評(píng)論(評(píng)論僅代表用戶(hù)觀點(diǎn))

更多
暫無(wú)評(píng)論