日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

東方國(guó)信:7個(gè)步驟讓大數(shù)據(jù)開(kāi)口說(shuō)話

 qinjy2008 2016-05-11

  【IT168 評(píng)論】“讓數(shù)據(jù)開(kāi)口說(shuō)話”,并不是一件容易的事。如同人類要想開(kāi)口說(shuō)話,信息的輸入、儲(chǔ)存、加工、處理,最終把思想以一種合適的方式表達(dá)出來(lái),需要經(jīng)過(guò)一個(gè)復(fù)雜的化學(xué)反應(yīng)過(guò)程。對(duì)計(jì)算機(jī)系統(tǒng)而言,要想讓數(shù)據(jù)開(kāi)口說(shuō)話,也要經(jīng)過(guò)一個(gè)復(fù)雜的電子信息處理過(guò)程。在數(shù)據(jù)量呈爆炸式增長(zhǎng),數(shù)據(jù)類型呈多樣化表現(xiàn),數(shù)據(jù)價(jià)值日益受到重視的大數(shù)據(jù)時(shí)代,這個(gè)過(guò)程會(huì)變得更加復(fù)雜,應(yīng)用也會(huì)更加廣泛。

  東方國(guó)信,一家堅(jiān)持了18年自主研發(fā)之路的IT企業(yè),正在試圖通過(guò)一個(gè)完整的解決方案讓大數(shù)據(jù)開(kāi)口說(shuō)話。

  2014年8月7日,東方國(guó)信在北京召開(kāi)了一次產(chǎn)品發(fā)布會(huì),公司董事長(zhǎng)兼總經(jīng)理管連平宣布推出針對(duì)各行業(yè)大數(shù)據(jù)的“端到端的完整解決方案”,囊括了多達(dá)20多種產(chǎn)品。我們知道,看似或零碎、或雜亂的數(shù)據(jù),要想變成對(duì)企業(yè)業(yè)務(wù)有價(jià)值的決策參考信息或營(yíng)銷建議,需要經(jīng)歷數(shù)據(jù)采集、存儲(chǔ)、處理、加工、管理、監(jiān)控、分析、展現(xiàn)等多道工序。東方國(guó)信的這20多種產(chǎn)品幾乎在每道工序上都有所涉及。

東方國(guó)信:7個(gè)步驟讓大數(shù)據(jù)開(kāi)口說(shuō)話
▲東方國(guó)信大數(shù)據(jù)產(chǎn)品線

  如此布局,東方國(guó)信也要面對(duì)來(lái)自O(shè)racle、IBM、SAP、Cloudera、EMC、SAS等多家國(guó)際巨頭的競(jìng)爭(zhēng),因?yàn)檫@些廠商在上述工序已經(jīng)有一些非常有代表性的全球領(lǐng)先產(chǎn)品?!爸苯訉?duì)標(biāo)國(guó)際巨頭進(jìn)行自主研發(fā)”,東方國(guó)信的信心來(lái)自哪里?

  “來(lái)自三個(gè)方面,一是針對(duì)大數(shù)據(jù)這種新技術(shù),大家都在起步階段,國(guó)內(nèi)外的差距比較小,;二是中國(guó)的客戶更看重高投資回報(bào)率,注重性價(jià)比;三是國(guó)際廠商的產(chǎn)品對(duì)中國(guó)市場(chǎng)的適應(yīng)性不強(qiáng),比如一些功能用不上,不適合中國(guó)本土用戶的使用習(xí)慣,而國(guó)外廠商又很難改變產(chǎn)品策略?!睎|方國(guó)信規(guī)劃咨詢總監(jiān)李云峰博士表示,“所以我們有底氣進(jìn)行自主研發(fā)?!?/p>

  下面,我們來(lái)看看東方國(guó)信的產(chǎn)品組合是如何一步步讓那些枯燥的大數(shù)據(jù)開(kāi)始說(shuō)話的。根據(jù)李云峰博士的專題介紹,筆者將其歸納為7個(gè)步驟:

  第一步:數(shù)據(jù)采集

  把數(shù)據(jù)采集上來(lái),這是首要基礎(chǔ),無(wú)論是網(wǎng)站的用戶訪問(wèn)日志,運(yùn)營(yíng)商網(wǎng)絡(luò)設(shè)備端口信息,銀行的交易記錄,高爐里的溫度數(shù)據(jù)等等,只有采集起來(lái),才有進(jìn)行下一步的可能。東方國(guó)信提供的Dprobe大數(shù)據(jù)采集設(shè)備從網(wǎng)絡(luò)接口采集數(shù)據(jù),可以為運(yùn)營(yíng)商的智能管道應(yīng)用、政府的網(wǎng)絡(luò)安全監(jiān)管等領(lǐng)域?qū)崿F(xiàn)海量數(shù)據(jù)的實(shí)時(shí)采集,通過(guò)硬件加速和軟件相結(jié)合的方式,可以實(shí)現(xiàn)單臺(tái)設(shè)備每秒10G的采集速度,遠(yuǎn)遠(yuǎn)高于傳統(tǒng)x86方案的每秒3G,而且功耗只有1/8,體積只有1/6。

  第二步:數(shù)據(jù)存儲(chǔ)

  在硬件層面,根據(jù)不同應(yīng)用環(huán)境對(duì)于計(jì)算能力和存儲(chǔ)能力的不同要求,東方國(guó)信推出了三種大數(shù)據(jù)專用設(shè)備:計(jì)算存儲(chǔ)均衡型、計(jì)算密集型和存儲(chǔ)密集型。比如對(duì)于銀行環(huán)境中身份證掃描圖像這種非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ),由于容量大,業(yè)務(wù)流轉(zhuǎn)過(guò)程中也需要在線存取,就需要一種高性比、可擴(kuò)展的方案來(lái)支撐。

  第三步:數(shù)據(jù)處理

  今天對(duì)于大數(shù)據(jù)的存儲(chǔ)和處理,一般會(huì)想到使用Hadoop技術(shù)。Hadoop也已發(fā)展成為繼Linux之后最成功的開(kāi)源軟件之一,成本低廉,擴(kuò)展靈活。但問(wèn)題在于,這種原生于互聯(lián)網(wǎng)生態(tài)環(huán)境中的技術(shù),要想用到傳統(tǒng)企業(yè)計(jì)算環(huán)境,卻并非易事。開(kāi)源的Hadoop之所以不能直接用于企業(yè)信息系統(tǒng),就在于其需求、服務(wù)、研發(fā)和運(yùn)維體系都不同于互聯(lián)網(wǎng)應(yīng)用,比如訪問(wèn)網(wǎng)頁(yè)時(shí)允許一定程度上的出錯(cuò)和數(shù)據(jù)丟失,但在銀行轉(zhuǎn)帳時(shí)如果出錯(cuò),其后果就可能是災(zāi)難性的了。據(jù)中科院計(jì)算所副研究員查禮博士介紹,要想在企業(yè)環(huán)境中使用Hadoop,必須滿足幾個(gè)條件:兼容關(guān)系模型和SQL語(yǔ)言,完善關(guān)系模型產(chǎn)品與Hadoop“混搭”的架構(gòu),增強(qiáng)系統(tǒng)運(yùn)維和數(shù)據(jù)處理工具,軟硬一體優(yōu)化配置硬件效能,集成開(kāi)源社區(qū)Hadoop最新版本等。

  對(duì)此,東方國(guó)信專門(mén)開(kāi)發(fā)了面向企業(yè)環(huán)境的Hadoop發(fā)行版,在底層的數(shù)據(jù)壓縮技術(shù)、行列混合數(shù)據(jù)存儲(chǔ)、圖形化運(yùn)維管理工具等方面做了增強(qiáng),使得這種源于互聯(lián)網(wǎng)的大數(shù)據(jù)技術(shù)也能適用于傳統(tǒng)企業(yè)環(huán)境。

  據(jù)李云峰介紹,東方國(guó)信還開(kāi)發(fā)了MPP分布式數(shù)據(jù)庫(kù),融合了Hadoop平臺(tái)和MPP架構(gòu)的優(yōu)勢(shì),滿足從TB級(jí)到PB級(jí)的海量數(shù)據(jù)存儲(chǔ)和分析。其價(jià)值在于,這些數(shù)據(jù)可以分布在數(shù)百臺(tái)普通服務(wù)器上,并能夠被大量并發(fā)用戶高速訪問(wèn),從而滿足數(shù)據(jù)密集型行業(yè)日益增大的數(shù)據(jù)分析、挖掘、備份和即席查詢的需求。

  第四步:數(shù)據(jù)加工

  數(shù)據(jù)加工的關(guān)鍵在于找到數(shù)據(jù)之間的關(guān)聯(lián)性,這些零散的信息關(guān)聯(lián)在一起才能產(chǎn)生價(jià)值。比如在運(yùn)營(yíng)商環(huán)境中的“用戶畫(huà)像”,就是把某個(gè)用戶的上網(wǎng)行為數(shù)據(jù)、關(guān)系鏈、交易信息、搜索數(shù)據(jù)等關(guān)聯(lián)在一起,才得以實(shí)現(xiàn),進(jìn)而可以為這個(gè)用戶提供更精準(zhǔn)的個(gè)性能服務(wù)。李云峰談到,東方國(guó)信解決方案的核心點(diǎn)在于通過(guò)云化ETL(提取-轉(zhuǎn)換-加載)平臺(tái)實(shí)現(xiàn)了數(shù)據(jù)的統(tǒng)一規(guī)范,并可實(shí)現(xiàn)橫向擴(kuò)展,滿足對(duì)PB級(jí)數(shù)據(jù)的加工處理。

  顯然,統(tǒng)一數(shù)據(jù)管理對(duì)于擁有多家子公司、多個(gè)系統(tǒng)的企業(yè)來(lái)說(shuō)更為關(guān)鍵,否則即便是一個(gè)最簡(jiǎn)單的KPI指標(biāo),從不同的系統(tǒng)調(diào)出來(lái)都會(huì)大相徑庭,導(dǎo)致企業(yè)領(lǐng)導(dǎo)無(wú)法決策。通過(guò)ETL工具來(lái)整合這些來(lái)自不同“孤島”系統(tǒng)的數(shù)據(jù),經(jīng)過(guò)轉(zhuǎn)換、清洗等步驟,讓數(shù)據(jù)具備了開(kāi)口說(shuō)話的能力。

  除了ETL工具,元數(shù)據(jù)管理工具則可以弄清楚數(shù)據(jù)的來(lái)源、含義、類型等,進(jìn)一步提高數(shù)據(jù)質(zhì)量。數(shù)據(jù)質(zhì)量平臺(tái)可以實(shí)現(xiàn)全生命周期的質(zhì)量監(jiān)控和審核,保障數(shù)據(jù)的完整性、準(zhǔn)確性、一致性和及時(shí)性。正是通過(guò)數(shù)據(jù)的加工,進(jìn)而讓數(shù)據(jù)建模、數(shù)據(jù)分析挖掘成為可能,大數(shù)據(jù)也才能正常說(shuō)話,而不是胡言亂語(yǔ)。

  第五步:數(shù)據(jù)分析

  數(shù)據(jù)分析的目的是在海量的數(shù)據(jù)中挖掘出有價(jià)值的信息。李云峰談到,東方國(guó)信的探索式分析工具,可以將幾十億條明細(xì)數(shù)據(jù)用思維導(dǎo)圖的方式進(jìn)行分析,以更直觀的豐富視圖來(lái)展示結(jié)果,從而深入洞察數(shù)據(jù)之間的關(guān)聯(lián)性及潛在影響。在這一方面,東方國(guó)信的首眼點(diǎn)是,速度要快,而且分析的結(jié)果要方便共享,以展現(xiàn)給不同需要的人。至此,大數(shù)據(jù)平臺(tái)已經(jīng)準(zhǔn)備好了要說(shuō)的內(nèi)容了。

  第六步:數(shù)據(jù)展現(xiàn)

  數(shù)據(jù)分析出來(lái)的結(jié)果往往會(huì)用于決策參考或輔助營(yíng)銷。東方國(guó)信通過(guò)自助報(bào)表的方式來(lái)構(gòu)建展現(xiàn)過(guò)程,允許業(yè)務(wù)端的用戶在終端對(duì)數(shù)據(jù)進(jìn)行存取和個(gè)性化展現(xiàn),這可以理解為大數(shù)據(jù)說(shuō)話時(shí)非常靈活的表達(dá)方式。其中三個(gè)最典型的應(yīng)用是統(tǒng)計(jì)報(bào)表、即席查詢、OLAP分析,比如按時(shí)間、地域來(lái)關(guān)聯(lián)分析以找到有用的信息。

  當(dāng)然,針對(duì)不同的人,大數(shù)據(jù)要說(shuō)的話也是不一樣的。以東方國(guó)信的一大重要客戶中國(guó)聯(lián)通為例,針對(duì)內(nèi)部的公司高層、分析人員、一線客戶經(jīng)理,以及外部的行業(yè)客戶、咨詢機(jī)構(gòu),大數(shù)據(jù)平臺(tái)所呈現(xiàn)出來(lái)的內(nèi)容也是豐富多彩,各不相同。正是基于東方國(guó)信的個(gè)性化定制工具以及自助報(bào)表,使得大數(shù)據(jù)在中國(guó)聯(lián)通獲得了極為廣泛的實(shí)際應(yīng)用價(jià)值。

  第七步:移動(dòng)應(yīng)用

  在移動(dòng)互聯(lián)網(wǎng)時(shí)代,如果能把數(shù)據(jù)分析的結(jié)果推送到手機(jī)或iPad上面,顯然會(huì)進(jìn)一步提高業(yè)務(wù)效率。東方國(guó)信已經(jīng)將自助分析能力擴(kuò)展到了移動(dòng)設(shè)備,方便用戶快速的看到自己喜歡的各種分析圖表。

  比如,中國(guó)聯(lián)通位于各地的一些一線客戶經(jīng)理,可能之前的職業(yè)是幼兒園的老師、護(hù)士,甚至不會(huì)使用EXCEL表,而“掌上營(yíng)銷”這樣一款應(yīng)用,無(wú)疑是為她們配上了一個(gè)“貼身的分析師”,隨時(shí)隨地查看自己客戶的動(dòng)態(tài),根據(jù)分析結(jié)果判斷哪些客戶可能會(huì)流失,哪些客戶需要生日問(wèn)候,從而更快速地采取行動(dòng)。

  可見(jiàn),“讓大數(shù)據(jù)開(kāi)口說(shuō)話”,看似簡(jiǎn)單,卻是個(gè)復(fù)雜的系統(tǒng)工程。不同于其他廠商針對(duì)于單一產(chǎn)品的發(fā)力,東方國(guó)信此次推出的是一站式的解決方案,涉及產(chǎn)品眾多。其實(shí)在筆者看來(lái),今天的大數(shù)據(jù)領(lǐng)域并不缺乏技術(shù)層面的創(chuàng)新,市場(chǎng)上已經(jīng)有很多不錯(cuò)的產(chǎn)品或技術(shù)出現(xiàn),但能用好的并不多,真正缺乏的是應(yīng)用層面的創(chuàng)新和落地。東方國(guó)信的大數(shù)據(jù)產(chǎn)品線聚合了很多先進(jìn)的技術(shù),如Hadoop、ARM服務(wù)器、流式計(jì)算、數(shù)據(jù)建模、移動(dòng)計(jì)算等等,但其生命力還在于跟電信、金融等各行業(yè)業(yè)務(wù)實(shí)踐的深度結(jié)合。畢竟,一個(gè)人要想說(shuō)話,光有嘴巴是不行的,還需要耳朵、腦袋……以及源源不斷的信息輸入。大數(shù)據(jù)系統(tǒng)要想發(fā)揮出自身的價(jià)值,實(shí)時(shí)、準(zhǔn)確地說(shuō)得有見(jiàn)地的話,亦然!

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多