國內外政府數據開放平臺調查與分析
摘要:政府數據開放對于提高政府信息化效益、確保社會公眾知情權、推動國家經濟增長具有重要意義;而政府數據開放平臺建設則是其中的關鍵環節。國內外學者針對政府數據開放及開放平臺構建開展了較為廣泛的研究,文章對目前研究現狀(以圖書情報領域刊文為例)予以簡介并評析。接著選取國內外政府數據開放較為先進、完善的國家(美、英、澳、日)和城市(上海、北京、深圳)為研究對象,對其政府數據開放平臺進行了調查,并對調查結果加以對比分析,找出相同和差異之處。結論認為,我國政府數據開放與國外相比尚存在一定的差距,應該進一步加強政府數據開放及開放平臺的理論研究和實踐探索。
1 引言暨目前國內研究現狀簡介———基于2017年圖書情報領域刊文的分析
政府是大量信息資源和數據的擁有者;而要挖掘和實現這些原始數據集的價值則需要政府向社會公眾開放數據資源,推動整個國家資源的優化配置。政府數據開放在政治上可以提高政府的透明度和滿意度,增強民眾對政府的公信力;在經濟上可以促進社會創新和新興產業發展,實現產業升級,推動經濟增長。因而,政府數據開放關系到國計民生,對于確保社會公眾的知情權、助推國家經濟的騰飛具有重要意義。
國際上(以美、英為代表)積極開展政府數據開放的相關理論研究和開放平臺的實踐探討,并取得了較大成就。國外政府數據開放的相關研究側重點在于解決具體的實際問題,研究主題主要集中在:開放政府數據的功能與利用、評價;政府數據開放的基礎設施建設;政府數據開放項目的實踐等。我國的政府數據開放行動也是勢在必行。從實踐上來看,2015年“數據開放共享”被確立為我國大數據戰略的核心,我國也將于2018年底建立國家級政府數據開放平臺;如何更好地建設數據開放平臺成為我國政府數據開放的關鍵環節。令人感到欣慰的是,貴陽市采取措施推動政府數據的開放、共享和利用,確保政府數據優先向社會公眾開放;制訂的《貴陽市政府數據共享開放條例》也已于今年5月1日起施行。河北省政府提出,要推進政府數據的開放共享,到2018年底前建設政府統一數據開放平臺。從理論上來看,我國學者圍繞“政府數據開放”這一主題積極開展相關研究,取得了較為豐碩的研究成果。圖書情報界也不例外,筆者特選取2017年圖情刊物發表的最新文獻加以描述。首先值得一提的是,我國圖書館學核心期刊、CSSCI來源刊(核心版)《圖書與情報》2017年第1期開辟專題“國外政府數據開放的政策保障與啟示”,分別介紹了美國、英國、澳大利亞、巴西、丹麥這5個國家政府數據開放的有關政策和法規保障,并從多個方面分析其對我國的有益啟示;接著又在第2期載文探討政府數據開放的評估指標特征及其模式。筆者對其他非專題發表的文獻進行初步歸類,其主要內容涉及:政府數據開放平臺模型和框架構建;國內外開放政府數據平臺元數據標準研究;政府數據開放保障和運行機制;政府數據開放與個人隱私權保護及網絡輿情監督;國外政府數據開放相關政策及對我國的啟示;其他問題,如政府數據開放的障礙、對策、檢索方法及變革等。
由上可以看出,我國圖書情報界積極開展“政府數據開放”的理論研究和實踐探索,取得了一定的研究成果;這些研究對于推進我國的政府數據開放、探討數據開放平臺的實現具有較大的理論參考價值和現實指導意義。筆者并不盲目跟隨,而是運用比較研究方法,從“國內外政府數據開放平臺的調查”入手,并對結果加以分析(目前研究文獻暫無該方面的直接報道)。研究的目的在于拋磚引玉,引發更多學者對“政府數據開放”問題的關注,為我國的政府數據開放平臺建設提供參考借鑒;同時,增強圖書情報界與政府之間的關聯度,擴大圖書館的影響力,提升其社會價值。
2 國內外政府數據開放平臺調查
2.1 調查要素
數據開放平臺作為政府數據開放的重要內容,對其調查分析是研究各國政府數據開放現狀不可缺少的部分。本文對于國外平臺的調查以美國、英國、澳大利亞、日本這4個處于數據開放先進水平的國家政府數據網為例,國內則以上海、北京、深圳這3個國內較為完善的數據開放平臺為例。
政府數據開放平臺的調查基于以下幾個基本要素而進行:1)數據對象與組織:包括開放數據的數量、類型、來源、下載格式。2)開放平臺的網站結構與分布:包括數據檢索、網站模塊分布、數據分享互動與用戶反饋、網站數據更新頻率、數據使用授權信息。3)是否提供API接口:API做為網站應用程序編程接口,它的開放使應用程序與開發人員無需訪問源碼或理解網站內部工作機制,就可以調用和開發網站的數據資源。因此開放API的站點能為第三方的開發者提供良好的社區支持,吸引更多的技術開發人員參與到數據開發與再利用之中。4)是否支持RSS訂閱:RSS可以作為數據開放平臺與其他站點之間共享數據信息的一種簡易方式。同時作為簡易信息聚合技術,RSS訂閱會收集和組織平臺用戶定制的數據信息,按照用戶希望的格式、地點、時間和方式,直接傳送到用戶的計算機上。這將大大促進數據開發者的工作效率,保證用戶對數據更新的關注,提高用戶獲取數據信息的時效性和準確性。
2.2 國外政府數據開放平臺調查
2.2.1 美國政府數據開放網
從美國的政府數據開放平臺(www.data.gov)網站搜集相關信息得知(注:為了節省文章篇幅,網站主頁圖省略,以下同):該平臺截至2017年5月開放數據集195206個,數據基本上都來源于政府公共部門,提供的數據下載格式為CSV、HTML、XML、RDF等可機讀格式。
在網站布局上:“數據搜索”框下方提供了農業、氣候、消費者、生態系統、教育等14項數據主題分類,總體包含了數據、分類、影響、應用軟件展示、擴展、互動6個主要類目。在擴展類目下提供使用開放數據的應用程序的展示區,公眾可以通過IOS平臺或Andriod平臺下載這些應用程序,了解政府數據開放所能提供的服務和相應的功能,推動對政府開放數據創新應用的開發。該網站基本每日保持著開放數據的更新。并有官方的博客和Twitter,其中官方Twitter擁有2.51萬的關注量;在互動類目下提供用戶提問與twitter互動,保持與數據用戶的互動聯系。
網站下方About類目下提供4項授權信息聲明:①政府網站原始數據日志不能用于其他目的,并按照國家檔案和記錄管理指南進行定期銷毀。②嚴格禁止未經授權的上傳信息或更改本政府網站服務信息,如果違反將可能受到懲罰。③通過www.data.gov提供的美國聯邦數據是免費且無限制的。政府雇員在其雇用范圍內創造的數據和內容不受美國的國內版權保護。④通過www.data.gov訪問的數據沒有、也不應該包含對其最終用途的控制。一旦數據從機構的網站下載,政府就不能保證其質量和及時性。此外,美國政府不能對www.data.gov通過檢索的數據進行任何分析。數據檢索方式以關鍵詞檢索、基于地圖位置的檢索為主;數據檢索內容以相關性、名稱的升序或降序、最后修改日期等進行檢索排序,檢索結果以主題、主題分類、數據集類型、標簽等進行分類分面。
在API的開放上,網站目錄由CKAN(強大的開源數據平臺之一)提供支持,CKANAPI包含有關數據集的元數據。通過CKAN的支持為用戶提供所有數據的API接口,允許所用用戶通過API對調取的數據進行開發利用。同時Data.gov為API利用提供了GitHub托管平臺的支持,該平臺擁有超過900萬的開發用戶,可以隨時為www.data.gov用戶在API的使用上提供幫助。RSS訂閱上,美國的政府數據開放平臺支持RSS技術以及數據信息的訂閱,并提供相應的網站代碼以供不同種類RSS閱讀器的使用。
2.2.2 英國政府數據開放網
從英國的政府數據開放平臺(data.gov.uk)網站搜集相關信息得知:該平臺截至2017年5月提供開放數據集43021個,提供下載格式包括CSV、RDF、XLSM、XML、NII等可機讀格式。數據來源于公共部門、私企和部分高等教育機構。
網站布局和結構上,主頁提供了包括商業和經濟、環境、地圖等12個數據主題,網站包括數據、APP應用、互動、登錄4項主要類目;APP應用下提供了412個關于政府數據APP的應用。在互動上設置了官方博客,同時在博客互動、網站論壇和評論等功能上采用Drupal系統運行,從而為用戶提供完善的站點分析工具和協同共享平臺,實現用戶與網站之間的雙向互動。該平臺數據每周進行更新。
在網站FAQ附錄下提供了兩項明確數據授權聲明:①網站上的信息是開放的且可再利用,允許私人和其他第三方網站向平臺提供數據信息。②通過data.gov.uk提供的數據和信息的授權可以在單個數據集記錄(元數據)的“許可”或“約束”字段中描述的條件下獲得,除非另有說明;在data.gov.uk上發布的所有數據集記錄(元數據)都是根據開放式政府許可進行許可的。
數據檢索上,data.gov.uk采用短語檢索和字段檢索,采取以名稱升降為標準的排序方式,以NII數據集、API、執照、主題、資源格式等這些項目進行結果分類分面。da?ta.gov.uk也是基于CKAN數據管理系統進行搭建的,網站API開放只面向注冊用戶,API的開放還屬于試用期,只提供健康與交通兩項主題的開放數據。提供GitHub平臺的服務功能。同時該網站支持RSS訂閱。
2.2.3 澳大利亞政府開放數據網
從澳大利亞的政府數據開放平臺(www.data.gov.au)
網站搜集相關信息得知:截至2017年5月提供開放數據集49904個,提供下載格式包括SHP、SLD、WMS、WFS、GeoJSON等可機讀格式,數據來源都是本國政府部門。
網站結構上,主頁未提供數據主題分類,在數據類目下只提供了商業、經濟、環境、科學等8項數據分類,總體上包括數據集、組織、網站統計等8個主要類目,在應用類目下提供了42個關于開放數據的運用軟件。其中工具包類目中為用戶提供了相應的技術與法律政策上的應用支持,以協助用戶對開放數據的開發使用;www.data.gov.au還通過統計模塊向用戶開放了網站整體運行情況。
但www.data.gov.au沒有社交媒體的選項設置,僅提供了用戶反饋調查和用戶提問的網站模塊,在數據的互動共享上略顯欠缺。平臺數據保持每周更新,該平臺準許用戶在瀏覽器上禁用cookie。使用授權上,www.data.gov.au的About類目下提供了兩點聲明:①對于其所提供的第三方鏈接數據沒有相應的下載授權。②尊重和保護用戶的隱私,網站上的所有開放數據依照開放許可協定授予所用用戶下載和使用的權力。
www.data.gov.au同樣是基于CKAN數據管理系統進行網站搭建,對用戶開放所有數據的API,無其他API支持服務;但提供RSS訂閱服務。
2.2.4 日本政府開放數據網
從日本政府數據開放平臺(www.data.go.jp)網站搜集相關信息得知:截至2017年5月提供開放數據集18717個,數據來源除政府部門外還包括科研機構和大型企業,提供XLMS、CSV、PDF、HTML等可機讀下載格式,網站還同時提供日語和英語兩種語言服務。
網站結構分布上,首頁未對數據種類進行主題分類,在數據類目下將數據分為商業、安全、運輸教育等9項主題。網站總體劃分為注意事項、數據、數據庫列表等6個主要類目。數據檢索data.go.jp采用關鍵詞檢索和基于地圖位置的檢索,按照數據的相關性和搜索量進行排序,按照數據集、組織、格式、主題分類進行搜索結果分面。互動上提供了用戶數據報告以收集數據用戶的相應反饋,并提供了用戶數據信息上傳通道,允許用戶向網站提供數據信息。但沒有社交媒體的互動,官方開設的twitter賬戶沒有實時的更新動態,并處于休停狀態。
數據使用授權上,在網站的注意事項類目下提供的授權信息聲明上顯示:data.go.jp根據日本“行政機關保護個人信息法”,網站對部分收集的數據不予授權。其他不在信息法保護內的數據以開放協定為標準,任何用戶都可基于data.go.jp的授權進行自由下載和使用。data.go.jp以CKAN數據管理系統搭建,并提供多種類型API,例如組織、數據重置、資源和標簽API。使用API以JSON、RDF格式獲取元數據,提供所有開放數據的API接口。支持RSS訂閱服務。
2.3 國內政府數據開放平臺調查
2.3.1 北京政務數據資源網
北京市政務數據資源網www.bjdata.gov為北京市政府在2012年搭建的數據開放平臺,提供北京市政務部門可開放的各類數據的下載與服務,是我國較早開放的地方政府數據開放平臺。
www.bjdata.gov.cn截至2017年5月提供了559個數據集,數據來源主要是北京市政府下轄的44個政府機構。大多數數據只提供單一的CSV下載格式。只允許注冊用戶對數據進行下載和API接口接入。
該網站首頁提供了數據、接口、定向數據、應用、工具、互動交流等8個一級類目,在數據類目下對數據主題進行了詳細的分類,包括經濟建設、交通服務、旅游住宿、宗教信仰、醫療健康等18項數據主題分類。并有基于網站開放數據開發的APP應用展示和下載模塊,其中提供APP應用共16個。在互動交流上設有問卷調查、建議、提交APP應用等幾項設置,但互動應用較少,大多數反饋與建議都是2014-2015年的。
www.bjdata.gov的網站信息模塊中提出了如下幾項授權信息:①用戶有權免費獲取本網站所提供的所有政務數據資源,享有數據資源的非排他使用權。但不得轉讓在本網站中獲取的各種數據資源。②本網站所有內容的所有權歸北京市人民政府所有。數據檢索采用關鍵詞和短句子進行檢索,以日期、大小、相關度進行數據排列。網站數據更新頻率雖然保持著每日更新。但只提供靜態文件類API接口,同時需要API唯一標識碼在調用政府網站的API接口時進行身份認證。該網站沒有RSS訂閱服務以及相關的API支持應用。但在工具類目下提供了數據搜索、分析和可視化工具,以方便用戶對開放數據的開發利用。
2.3.2 上海市政府數據服務網
上海市政府數據服務網datashanghai.gov為我國第一個地方政府數據開放平臺。截至2017年5月提供了數據集919個,數據全部來源于上海市政府下轄的各個政府機構。提供了CSV、XLS、XLSX3種可機讀下載格式。網站在數據的評價上采取五星評分,允許用戶對使用的數據進行質量評分。
網站布局上,在主頁提供了經濟建設、交通安全、社會發展等12項數據主題分類,同時還包括了數據、應用、接口、移動應用、地理信息、互動交流6個主要類目,在應用類目提供了60個基于開放數據利用的APP應用。更新頻率上保證了每日的實時更新,數據大多為2017年的最新數據。在互動交流上包含了需求調查和調查問卷兩項,但用戶交流反饋較少,大多為2015年的網站互動信息。
datashanghai.gov的使用條款下包含使用授權信息有如下幾項:①通過DataShanghai成功注冊并完成認證的用戶,對現有已開放數據享有免費訪問、獲取、傳播和增值利用的權利,依申請類開放數據依特定條件享有免費訪問、獲取和增值利用的權利。②DataShanghai保留對部分數據加工產品收費訪問及收費獲取的權利。③DataShanghai可能會鏈接到其他網站,當您在訪問和下載這些數據的時候,請以該網站收費政策的告知內容為準。datashanghai.gov.cn提供了所有數據的API接口,但在數據下載和API接口使用上只面向注冊用戶。在API使用上還需要對不同公開程度的數據進行相應的公開申請。不提供RSS訂閱服務以及API的支持應用。
2.3.3 深圳市政府數據開放平臺
深圳市政府數據開放平臺opendata.sz.gov.cn建成于2016年,網站各項數據服務較為完善。截至2017年5月,提供了數據集441個,僅提供CSV下載格式,數據來源于市政府各機構以及下轄各區政府部門。
網站布局上,opendata.sz.gov首頁提供了道路交通、文化娛樂、就業服務等15項數據主題分類,同時還包括了數據下載、數據接口、移動應用、交流互動以及新增的2017年城市數據創新大賽的大賽入口共5個主要類目。在移動應用類目下提供了20個使用網站開放數據的APP應用。
在互動交流上提供了數據需求、咨詢建議、問卷調查3個互動類目,但沒發現任何用戶響應和反饋信息。open?data.sz.gov沒有對數據授權信息進行相應的聲明或闡述,在API接口使用上所有數據都需要進行申請調用API。數據下載只面向注冊用戶,但對未注冊用戶提供了數據預覽功能。該網站也沒有RSS訂閱服務。
3 調查結果對比分析
3.1 國內外政府數據開放平臺之相同點
根據調查結果分析,得出以下相同點:①國內外政府數據開放平臺的數據來源大多以政府機關數據為主,開放數據涉及的領域大多相似,以民生經濟、公共服務、科技教育為主要內容。②在數據開放網站上的布局和結構上大多相似,網站主頁以數據檢索功能為主要部分,主要類目都包含了數據主題、相關應用展示、交流互動以及開放接口這幾項。③國內外數據開放平臺基本都提供了APP應用以及API接口向用戶開放網站的架構,以增加用戶的粘性,加快數據的再利用。④國內外數據開放平臺在網站附加模塊上基本都有對數據授權的聲明和闡述。⑤國內外數據開放平臺的開放數據大多提供了用戶注冊,并通過Cookies對數據使用者進行身份辨別和信息監控。
3.2 國內外政府數據開放平臺之不同點
首先,我國尚未有國家級的政府數據開放平臺,這一點是與美、英等數據開放水平較高國家的最大不同,也是存在的差距。其次,在地方政府數據開放平臺方面,與國外的相比也存在以下不同:
1)數據檢索上,由于我國地方政府數據開放平臺缺乏數據組織標準,導致數據組織格式多樣化。同時數據缺乏必要的語義關聯,極大地影響數據檢索的準確度和效率。而國外政府數據開放平臺絕大部分有統一的數據檢索標準,且格式規范,方便檢索。
2)在用戶互動上,國外平臺大多有官方社交媒體,通過社交媒體與用戶進行實時互動,同時還支持用戶向網站按規定提供數據資源,實現雙向互動。而我國地方政府平臺在互動交流上僅停留于表面,只有問卷調查和用戶咨詢提問兩項交流類目。這兩種方式滯后性極強,對用戶的反饋回應緩慢,甚至長達1~2年沒有更新過互動交流類目,數據質量也無法得到保障。
3)國內平臺大多需要注冊才能下載數據資源和調用API,不利于公民廣泛地參與到開放數據的利用。國外平臺大多數只有在用戶上傳數據信息時才需要進行注冊。
4)國內平臺基本沒有RSS訂閱服務,RSS訂閱功能的缺失,將直接影響到用戶體驗。缺乏面向用戶的數據信息簡易聚合,對于了解用戶需求以及擴大數據利用群體是十分不利的,在這個層面來講訂閱功能顯得愈發重要。另外,我國自媒體時代的到來也為訂閱共享提供了一定的技術支持和保障,因此,借鑒國外平臺的先進經驗,實現該服務是可行的。
5)國內平臺都缺乏開放性的授權協定,大多數數據授權對用戶有各種使用權限制。國外平臺在數據授權上大多有數據開放許可協議的支持,從而保證了用戶在數據開放和利用上的自由性和創造性。
6)國內平臺提供數據下載格式單一,與國外多樣化的下載格式相比差距較大。
4 策略建議與研究展望
大數據和“互聯網+”環境下,邁向政府數據開放是更好地實現政府信息公開、提高政府辦事效率的必然信息化發展進程。而政府數據開放平臺的建設則是數據開放中的關鍵所在。通過調查分析發現:無論是對于“我國政府數據開放”的理論研究還是開放平臺之實踐探索都與美、英等國外較發達國家相比存在一定的差距。筆者對我國政府數據開放平臺的建設提出一些對策建議:
①創新觀念,尋求大數據和“互聯網+”環境下的積極思維方式,政府各部門應做好數據開放工作,統籌協調,著力構建政府數據開放平臺;并建立統一的數據調控中心。以便實現數據開放與共享。
②我國的政府數據開放可以借鑒發達國家的有益經驗,但應突出自己的特色。可由地方政府在數據開放上率先試點,推進體制改革和搭建政府數據開放平臺,然后逐步由地方向中央加以推進政府數據開放。
③制定和健全與我國政府數據開放相關的法律,如政府信息公開相關法律、政府數據安全保護、個人隱私權保護相關法律等,確保社會公眾的知情權和隱私權不受侵犯;提高安全防范意識。可以借鑒美國的數據安全分級制度,對政府數據實施有針對性的保護。
我國學者應該更進一步開展政府數據開放的研究;特別是政府數據開放平臺的框架構建和持續建設將成為未來的研究重點和熱點。
(參考文獻:略)