大數(shù)據(jù)策略會(huì)失敗嗎?是時(shí)候該討論一下這個(gè)問(wèn)題了。企業(yè)才剛剛掌握如何集成ERP(企業(yè)資源規(guī)劃)及其他業(yè)務(wù)應(yīng)用來(lái)消除業(yè)務(wù)流程中妨礙效率的孤島。面向服務(wù)架構(gòu)、軟件即服務(wù)、云計(jì)算及其他現(xiàn)代化解決方案在協(xié)助企業(yè)實(shí)現(xiàn)大型應(yīng)用集成過(guò)程中都發(fā)揮了一定的作用。但是如今,在大量數(shù)據(jù)的環(huán)境中組織正面臨新的一系列挑戰(zhàn)。更清楚地說(shuō),它不是一條數(shù)據(jù)流。它是由許多獨(dú)立的數(shù)據(jù)流組成的,使數(shù)據(jù)互相分離或者就像以前的企業(yè)應(yīng)用那樣將孤立起來(lái)。
這不是因循守舊
這些數(shù)據(jù)中有許多都不像那些企業(yè)用處理的數(shù)據(jù)那樣。在大規(guī)模結(jié)構(gòu)化數(shù)據(jù)環(huán)境中,數(shù)據(jù)激增所面臨的大部分挑戰(zhàn)都可以通過(guò)擴(kuò)展、冗余及分析而得到解決。大數(shù)據(jù)時(shí)代,以上這些挑戰(zhàn)僅僅是企業(yè)必須解決的小部分問(wèn)題。如今收集到的數(shù)據(jù)類(lèi)型來(lái)源非常廣泛。數(shù)據(jù)通過(guò)嵌入式傳感器、RFID芯片、箱子和音像供給、文檔和圖像文件、圖像等其他方式而傳輸?shù)綌?shù)據(jù)庫(kù)中。社交媒體會(huì)改變數(shù)據(jù)應(yīng)有的形象。這還不包括業(yè)務(wù)伙伴之間所共享過(guò)的大數(shù)據(jù)。
組織不再描述或者規(guī)定數(shù)據(jù)所要展現(xiàn)的形式。實(shí)際上,如果嘗試這樣做,會(huì)大大地降低數(shù)據(jù)本身的價(jià)值。企業(yè)僅能預(yù)測(cè)一定數(shù)量的潛在情節(jié)或者反應(yīng)。無(wú)論他們創(chuàng)建了多少?gòu)?fù)選框或者數(shù)據(jù)文件,總會(huì)有數(shù)據(jù)溢出的現(xiàn)象。從競(jìng)爭(zhēng)的角度來(lái)說(shuō),忽視那些非傳統(tǒng)數(shù)據(jù)的后果是極具破壞性的。最近麥肯錫全球研究院進(jìn)行了一項(xiàng)研究,題目為:大數(shù)據(jù)是創(chuàng)新、競(jìng)爭(zhēng)、生產(chǎn)率領(lǐng)域的下一個(gè)研究方向,研究表明如果企業(yè)未能充分利用現(xiàn)有的數(shù)據(jù),那么該企業(yè)將虧損數(shù)千億美元。
關(guān)系數(shù)據(jù)庫(kù)僅能提供部分解決方法
由于數(shù)據(jù)量大而且種類(lèi)不同,因此采用工具和技術(shù)管理非結(jié)構(gòu)化數(shù)據(jù)就變得非常困難。非關(guān)系型NoSQL、XML以及關(guān)鍵/數(shù)值數(shù)據(jù)存儲(chǔ)都可以協(xié)助企業(yè)解決多數(shù)大數(shù)據(jù)的可伸縮性和可訪問(wèn)性問(wèn)題。例如Hadoop這樣的解決方案使用MapReduce及Hive Query Language,為企業(yè)提供管理大數(shù)據(jù)的一個(gè)起點(diǎn),并獲取商業(yè)情報(bào)。如MongoDB和Cassandra這樣的NoSQL數(shù)據(jù)庫(kù)管理系統(tǒng)已經(jīng)實(shí)現(xiàn)Hadoop集成,使客戶獲得至少一個(gè)客戶端接口或者覆蓋連接不同的數(shù)據(jù)流變得更加容易一些。
如今數(shù)據(jù)本身在企業(yè)中變得更加靈活。并行流程及智能數(shù)據(jù)將JitterBit這樣的工具分塊應(yīng)用,將其設(shè)計(jì)成允許數(shù)據(jù)從一個(gè)應(yīng)用程序傳輸?shù)较乱粋€(gè)應(yīng)用程序,并保證傳輸?shù)臄?shù)據(jù)質(zhì)量。這種通過(guò)數(shù)據(jù)類(lèi)型及應(yīng)用進(jìn)行的集成對(duì)于時(shí)間敏感的企業(yè)活動(dòng)來(lái)說(shuō)非常重要,這些活動(dòng)中也會(huì)涉及即時(shí)分析。一般地,這種形式的分析必須查詢當(dāng)前數(shù)據(jù)和歷史數(shù)據(jù),來(lái)識(shí)別新趨勢(shì)。這就是SQL經(jīng)常再次發(fā)揮作用的原因。
SQL、NoSQL以及大數(shù)據(jù)技術(shù)
新型數(shù)據(jù)的來(lái)臨并不是否定過(guò)去幾十年精心收集并整理出來(lái)的業(yè)務(wù)數(shù)據(jù)。SQL數(shù)據(jù)存儲(chǔ)中的內(nèi)部企業(yè)數(shù)據(jù)可以解釋大數(shù)據(jù)與其他數(shù)據(jù)在精確性及相關(guān)性之間的差異。多數(shù)組織發(fā)現(xiàn)他們?nèi)匀恍枰獮榱似髽I(yè)數(shù)據(jù)而保持SQL結(jié)構(gòu),來(lái)支持企業(yè)最佳業(yè)務(wù)實(shí)踐。將一切數(shù)據(jù)變?yōu)榉墙Y(jié)構(gòu)化格式并不是集成,這僅僅是趨同化處理。與此同時(shí),試圖迫使結(jié)構(gòu)化數(shù)據(jù)向非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)變也都是白費(fèi)力氣的努力。
從企業(yè)角度來(lái)說(shuō),集成的目標(biāo)并不是關(guān)注數(shù)據(jù)結(jié)構(gòu)化而是關(guān)注組織化。像新型Oracle Data Integrator這樣的工具試圖通過(guò)加載和轉(zhuǎn)換數(shù)據(jù)的Hadoop來(lái)尋找平衡點(diǎn),所以,結(jié)合傳統(tǒng)企業(yè)數(shù)據(jù)就更容易進(jìn)行分析。分析流程中,這種方法使得來(lái)自多種信息源及存儲(chǔ)中的數(shù)據(jù)相融合,此時(shí)就更需要數(shù)據(jù)集成。這種折中的方法使得原始數(shù)據(jù)比最初的狀態(tài)更加自由,維持這種隱含價(jià)值可能更適合于未來(lái)分析的新方法。
- 李斌西藏行談"加氧"爭(zhēng)議:電動(dòng)車(chē)長(zhǎng)途出行痛點(diǎn)待解
- 戴爾峰會(huì)聚焦企業(yè)轉(zhuǎn)型:全棧創(chuàng)新如何驅(qū)動(dòng)韌性增長(zhǎng)
- 戴爾科技:全棧創(chuàng)新如何支撐企業(yè)韌性增長(zhǎng)
- 理想新車(chē)系銷(xiāo)量低開(kāi)高走:是營(yíng)銷(xiāo)套路還是真創(chuàng)新?
- 階躍星辰視頻團(tuán)隊(duì)突遭裁撤并入京東 公司回應(yīng)引關(guān)注
- 寒武紀(jì)股價(jià)止?jié)q轉(zhuǎn)跌 市場(chǎng)觀望情緒升溫
- 快手可靈AI首尾幀內(nèi)測(cè):一鍵生成電影感片頭片尾
- 英特爾前員工泄密微軟獲刑 緩刑兩年罰金近25萬(wàn)
- 微信刷掌支付加盟傳聞不實(shí) 官方回應(yīng)仍處內(nèi)測(cè)階段
- 小鵬P7刷新24小時(shí)耐力紀(jì)錄,雷軍點(diǎn)贊背后藏何玄機(jī)?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。