大數(shù)據(jù)在硅谷炙手可熱,拿融資自然也不再話下,拿到千萬級美元融資的也有不少,不久前大數(shù)據(jù)分析云服務GoodData就獲得了Intel Capital領投的2750萬美元。據(jù)華爾街日報消息,機器學習平臺 GraphLab 剛剛改名Dato,并獲得了 1850 萬美元新融資,投資方為 Vulcan Capital 、Opus Capital 、New Enterprise Associates、Madrona Venture Group。此前他們曾獲得680萬美元融資。
GraphLab 提供了一個完整的平臺,讓客戶能夠使用可擴展的機器學習系統(tǒng)進行大數(shù)據(jù)分析。簡單來說,就是從別的應用程序或者服務中抓取數(shù)據(jù),讓機器學習這個模型,并將學到的知識作為基礎,自動地進行準確的預測和決策制定。這么講挺抽象,我們還是具體舉幾個例子吧??赡茏詈美斫獾木褪敲裰鲊艺拿褚庹{(diào)查,可以通過社交網(wǎng)絡、媒體等提取數(shù)據(jù),分析出民眾到底在關心什么,分析出哪些區(qū)域的哪些問題必須關注、解決。其實,生物醫(yī)學研究團隊也會使用 GraphLab,主要是來分析臨床記錄,從而預測病人的病情發(fā)展趨勢。零售業(yè)可以做價格預測、用戶推薦;金融服務業(yè)可以做詐騙預警;市場公司則可以通過情緒分析鎖定關鍵客戶?,F(xiàn)在 GraphLab 的客戶已經(jīng)包括 Zillow、Adobe、Zynga、Pandora 等。
那為什么是 GraphLab(現(xiàn)在應該叫 Dato 了)會獲得這么多客戶的青睞呢? 其實,將原始數(shù)據(jù)轉(zhuǎn)化為決策依據(jù),并作出預測,這個過程還是很復雜的。往往需要大量的數(shù)據(jù)處理工具,收集、清洗數(shù)據(jù),再建模分析,得出結(jié)論,進行展示;還需要大量的數(shù)據(jù)科學家或同樣知識淵博的軟件工程師來配合完成。既耗時費力,還投入不菲。所以 GraphLab 這樣的平臺,可以讓毫無編程經(jīng)驗的數(shù)據(jù)科學家,快速地將理念轉(zhuǎn)化為生產(chǎn)環(huán)境可以使用的產(chǎn)品,提高企業(yè)的生產(chǎn)效率,自然受歡迎。值得一提的是,Dato 現(xiàn)在能處理各種數(shù)據(jù)類型。
GraphLab 的創(chuàng)始人 Carlos Guestrin 是機器學習界國際公認的大牛,曾被 Popular Science 雜志評為 2008 年 “Brilliant 10”,還獲得過美國青年科學家總統(tǒng)獎。2008 年在卡耐基梅隆大學帶著兩個學生研發(fā)了 GraphLab 的原型,2012 年被 Jeff Bezos 游說去了華盛頓大學。
在 Madrona Ventures 和 NEA 的資金支持下,2014 年 3 月創(chuàng)辦了 GraphLab,并以測試版的形式推出了第一個商業(yè)版。2013 年 10 月,增加了機器學習功能,推出了新版本。現(xiàn)在的 GraphLab 已經(jīng)不僅僅是圖譜分析了,更是一家基于 AI 的大數(shù)據(jù)公司,能夠處理各種數(shù)據(jù)類型,所以公司也改名叫 Dato 了。
在美國現(xiàn)在的大數(shù)據(jù)公司主要有四類:
數(shù)據(jù)的擁有者、數(shù)據(jù)源:特點是業(yè)務優(yōu)勢能收集到大量數(shù)據(jù),就像煤老板壟斷一個地區(qū)的礦一樣。其實大多數(shù)有能力產(chǎn)生或收集數(shù)據(jù)的公司都屬于這類型,比如Vantage Sports和收集了PB級數(shù)據(jù)的包子鋪。
大數(shù)據(jù)咨詢:特點是非常技術,提供從基礎設施規(guī)劃建設維護到軟件開發(fā)和數(shù)據(jù)分析等的服務,但不擁有數(shù)據(jù),比如Cloudera這家不到500人的startup是最著名的Hadoop架構(gòu)咨詢公司。
做大數(shù)據(jù)工具的:比如AMPLab出來的Databricks和Yahoo人主導的Hortonworks。
整合應用型:特點是收集擁有或購買一些數(shù)據(jù),然后結(jié)合AI來解決更多實際的痛點。
像 Dato 這種做整合應用型的大數(shù)據(jù)公司才有可能有希望。未來是 AI 的,而 AI 的食物是數(shù)據(jù)。就像很多產(chǎn)業(yè)鏈一樣,最困難且最有價值的創(chuàng)新往往發(fā)生在接近最終用戶的那端,比如 iPhone。大數(shù)據(jù)行業(yè)最有價值的部分在于如何利用機器去處理數(shù)據(jù)得到洞見,影響組織和個人的行為,從而改變世界。收集和整理數(shù)據(jù)在未來會變得標準化和自動化,而利用 AI 進行分析的能力會變得更為關鍵。
[36氪,作者: 小石頭] |
|
來自: openlog > 《業(yè)界風云》