數據是什么?是金子,也就是錢??!
最近統(tǒng)計來看,全國已經有三百多家大數據公司,但在大數據發(fā)展初期這個情況下,國內大數據交易的現狀是:供不應求!所以各種形式的數據交易公司都出來“賣數據”賺錢了;
還有個趨勢是,無論是國內、國外,大數據集中在大廠中,更可氣的是還通過兼并使數據公司越來越少,構成商業(yè)壁壘。so,數據聚集在一小部分企業(yè)手中,創(chuàng)業(yè)公司縱使有好的想法,拿不到足夠大的數據也無濟于事。這么看來,數據就是命啊!
所以,在這幾天舉辦的第九屆中國大數據技術大會上,也特意開了數據市場及交易分論壇,給大家答疑解惑。在此摘一些觀點來分享。
其實,國內大數據交易的現狀除了供不應求,還非常不均衡。
具體說來,數據堂副總裁肖永紅介紹了數據的四個特點:
第一個特點是頭重腳輕?;ヂ摼W企業(yè)和高科技企業(yè)在大數據產業(yè)里面起領跑作用。因為他們有大量的用戶數據,比如百度,有大量用戶搜索數據;比如阿里,掌握了全國海量的電商行為數據,比如騰訊,也掌握了全部的社交數據。有了這些數據以后,就可以“攜數據以令諸侯”。(這個重要系醒表現在:阿里已經在和一些地方政府、甚至和國家層面合作;現在可以根據每年雙十一,或者淘寶的交易量,反過來推測中國經濟運行的狀況。)
第二個特點,目前大數據產業(yè)分布偏重在應用環(huán)節(jié)。
第三特點,應用領域行業(yè)分布還不夠廣,集中于電商行業(yè),在傳統(tǒng)行業(yè)非常少。
第四特點,缺乏綜合性的數據聚合流通平臺。雖然這一年兩年內冒出了很多,但是遠遠不夠。
當然,了解了數據特點,就能更好地尋找數據源。那么數據都在哪里,如何收集?
對應上文所說,首先是互聯網企業(yè)。很多數據都是在各個行業(yè)領域的IDC或者數據中心的服務器上面;
其次,在電信運營商領域。大家已經意識到,運營商的用戶行為數據特別是移動用戶的行為數據,非常有價值;
并且,科技部和財政部在四五年前,提出了一個全國科學數據共享基礎工程,圍繞人口健康、交通科學,以及地理、地球、氣象等方面,已經做了很多科研和科學領域的數據共享平臺;
針對傳統(tǒng)行業(yè)數據收集,可以利用眾包的形式,以及利用傳感器記錄、采集線下分散的數據;
另外最近還有一個趨勢,很多高校和科研機構也在收集大量的數據,因為他們做項目也需要大量的數據支撐;
另一方面,現在很多個人、公司都在找數據,也愿意花錢買,所以無論是官方的還是企業(yè)的數據交易市場,在今年格外火爆。
因此,另外一塊就是數據源變現的形式。這幾年商業(yè)數據或者政府大數據變現項目也有大量數據。
比如官方的,如北京市政務數據資源網、九次方在“中國數都”貴陽籌建“貴陽大數據交易所”、中關村“數?!贝髷祿灰灼脚_、北京軟交所旗下“北京大數據交易服務平臺”,以及各地風起云涌的大數據交易平臺、交易所,如亞信和武漢市政府長江大數據交易所,都是開放了一些官方數據,由政府背書,但還是沒有配套法律規(guī)范。
企業(yè)層面,有登上新三板的數據堂,以及百度API Store 聚合平臺、聚合數據。
但是,數據交易需求雖然很大,但是畢竟沒有配套法律規(guī)范。因此,在交易流通中存在很多問題。中國信息通信研究院高級工程師韓涵總結,數據流通交易面臨兩個極端:一是黑市交易無序流動,二是數據凍結無法流動。
首先,來看看數據交易流程中會遇到什么問題?
來自亞信數據的龔靜介紹,總結來說,包括四個方面:尋找成本,需要很快的去找到對方;實施成本,數據流通過程中涉及到很多協(xié)議、數據格式,需要方便的工具來做協(xié)議的轉換;信任成本,需要監(jiān)管渠道,中介不會竊取數據;外部成本,即隱私數據要得到保護。
因此,為了規(guī)范交易流程來保護各方利益,目前數據流程模型,大體來說有三種:
第一種是最簡單的,數據供需雙方直接進行交互。但流通中四個成本都非常高。
第二種,加入數據中介。尋找成本變低了,但信任成本增高了。
第三種流通模型,是再引入一個產權人的角色??梢员U系谌嚼?,降低外部成本。
所以,每一方的利益都能夠得到保障,數據流動才能真正在全社會流轉起來。
其次,針對數據壁壘問題,怎么破?
最近有一個詞匯比較流行——數據的民主化,像政治上的民主,能夠做到數據的民主,用數據激發(fā)創(chuàng)新。還有共享經濟,包括對數據價值的共享,亞信也提出了一個想法:數據去中心化。
意思是,在數據流動的過程當中,整個數據不會經過任何一方,而是直接在數據流動的參與方之間進行流動。這種數據去中心化的數據流通方式,和P2P下載、電話交換網的模式類似:參與方的認證、計費、公證的環(huán)節(jié),可以由數據中介平臺來完成。完成之后,在數據需求方和數據提供方之間進行數據的流動。
此外,完善的流程還需要保護數據隱私。
因此,平臺還要使數據可用不可見。數據雙方各把加密之后的數據放到這個數據交易的中介平臺上來,在這個平臺上進行碰撞,碰撞之后,把這個結果進行解密,返還給雙方,然后再把數據銷毀;數據版權要保護起來。當有侵犯到你版權的數據在市場上流動時候,你可以通過平臺來發(fā)現它。
- 世間將再無松下電視:松下官宣解散家電子公司并徹底放棄電視機業(yè)務
- 雅迪集團與南都電源簽署協(xié)議:攜手共繪固態(tài)電池未來藍圖
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉入資金提現免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領先技術與深度整合是關鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關注
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。