在當(dāng)初Rokid同期眾測的產(chǎn)品里,Rokid真的是最低調(diào)的那個。 特別是跟Rokid同期眾測的360兒童機(jī)器人那么顯眼,而Rokid的標(biāo)簽又是“音樂機(jī)器人”,LZ潛意識里就把Rokid當(dāng)成是玩具級別的播放器了,根本沒點(diǎn)進(jìn)去看(而從沒詳細(xì)寫過科技產(chǎn)品原創(chuàng)、從沒中過科技產(chǎn)品眾測的LZ能成功申請到Rokid,也真的是驚喜萬分)。 直到收到群發(fā)的微信提醒,特意去查看了下Rokid的眾測詳情,首先就被價格嚇到了,市場價5280元(希望眾測報告里把價格放前面的值友看過來)。 作為一款真正將人工智能帶入家庭的Home A.I產(chǎn)品,Rokid 集聲紋、面部和動作識別于一體,實時感知外界聲音和燈光,動動嘴就能控制智能家電;基于深度學(xué)習(xí),Rokid為家庭量身制定音樂、新聞等內(nèi)容服務(wù),進(jìn)行智能化推送,讓家庭生活更加高效且充滿樂趣。 這是Rokid的眾測頁面的商品介紹里的第一段話。“深度學(xué)習(xí)”“聲紋、面部和動作識別”“控制智能家電”“智能化推送”……區(qū)別于眾測商品的標(biāo)題“Rokid 若琪 音樂機(jī)器人”,大概這一段話的描述,才是Rokid創(chuàng)造者的初心。而這些,也深深地吸引著LZ去申請這個眾測,甚至是第一個申請不上也很想買一個的產(chǎn)品,來看看“中國造”的機(jī)器人到底做到了何種程度。 注1:Rokid,是“Robot” “Kid”的合稱,中文名“若琪”,是一位女生。眾測報告的文字部分提及到本次眾測產(chǎn)品時都會用“Rokid”,僅僅是因為英文單詞在一堆漢字里更容易辨識,方便閱讀。 注2:本文較長,長到一向抵制寫長文的LZ都壓不短了,想看重點(diǎn)的建議跳著看圖片和視頻,以及最后的總結(jié)。 0、大有來頭的Rokid團(tuán)隊眾測頁面的介紹很迷幻,不過LZ迫切想知道Rokid的科技部分是如何實現(xiàn)的,以及是誰發(fā)明了Rokid。而在了解了Rokid創(chuàng)始人及其團(tuán)隊之后,讓LZ愈加對Rokid有了期待。Rokid三位創(chuàng)始人有:
CFO和CEO都大有來頭,而LZ最感興趣的還是核心創(chuàng)始人Misa:阿里巴巴M工作室的名字就來自Misa的首字母,比較有名的產(chǎn)品是一淘火眼,以及隨后手機(jī)淘寶利用增強(qiáng)現(xiàn)實技術(shù)AR的“抓蝴蝶”。隨后LZ翻看了Misa幾年來的微博,除了工作相關(guān)的微博外也有不少有趣的內(nèi)容,工作之外的興趣大概是星戰(zhàn)、樂高和機(jī)車。 想要更多了解Misa關(guān)于機(jī)器人設(shè)計理念的值友,建議看一下下面這個視頻《人和機(jī)器的邊界》,是Misa在天貓賣完第一批Rokid后的一個presentation: ps:視頻里的Misa遠(yuǎn)看有點(diǎn)像韓寒,樣子酷酷的。 聊了這么多了,下面開始正文。 1、開箱其實在確認(rèn)參加眾測的當(dāng)天下午眾測君就已經(jīng)發(fā)了順豐快遞,通常第二天早上九點(diǎn)左右就能收到,但是那天不知道什么原因,下午東西才到自提點(diǎn),開箱時已經(jīng)是晚上了。 物流箱是家電那種加厚的五層瓦楞紙,大概50cm高,物流箱里面還有黑色的產(chǎn)品包裝箱,兩個箱子之間用厚厚的瓦楞紙做護(hù)角,安全性滿分。 產(chǎn)品箱的其中一邊是一次性封口貼,手撕即可不需要小刀,開啟比較方便。 開箱過程不贅述了,參見動圖。 配件很簡單,除了機(jī)器本體就只有電源線、三包憑證和使用說明。 2、溫潤如玉、美輪美奐——Rokid初接觸先來個擺拍(頭圖候補(bǔ)): 下面慢慢介紹: 剛從包裝盒里出來的Rokid就深得北鼻歡心,要不是LP拉著好幾次差點(diǎn)撲上去。不過之前看過很多Rokid美照的LZ對此無感,早就做好上午開箱的LZ,自然迫不及待地想要趕快開機(jī)體驗。下面是首次開機(jī)視頻: 視頻中沒有記錄掃描二維碼綁定設(shè)備的過程,這是掃描之前拍的一張照片。 開機(jī)后不一會兒,開始自動更新系統(tǒng)了。這時候LZ就靜靜地欣賞Rokid,腦海里冒出了小時候看《圣斗士星矢》里的奧丁藍(lán)寶石。編輯照片的時候LZ滿腦子都是“太美了”,然而真實的Rokid比照片還要美。 下面詳細(xì)介紹Rokid的組成: 2.1 整體Rokid大體上由兩部分組成,頭部和底座。重量(不含電源)為4.0kg(實測),三圍為250×213×345mm(官方數(shù)據(jù))。 正好電視柜旁邊還有點(diǎn)空間,旁邊的大象擠一擠,就把家安這兒了。 上面這張照片是Rokid的俯視圖,基本是橢圓形,底部比頭部大一圈,點(diǎn)亮?xí)r頭部背面的亮度(上圖白色區(qū)域)要比頭部正面更亮一點(diǎn)。 Rokid頂部的攝像頭區(qū)域是觸控的,可以喚醒Rokid或者讓她休眠;左右兩側(cè)也是觸摸控制,分別調(diào)節(jié)亮度和音量——頂部控制很靈敏精準(zhǔn),兩側(cè)觸控則不太好用。 2.2 攝像頭頭部的頂部為高清攝像頭。 攝像頭的像素為1300W,采用最新的分區(qū)高動態(tài)范圍曝光(SME-HDR)背照式感光傳感器,具備錄制60幀/秒的1080P視頻的能力,另外未來還可以通過攝像頭進(jìn)行視頻聊天、人臉和手勢識別等——嗯,目前為止,除了開機(jī)掃描二維碼綁定設(shè)備外,攝像頭還沒什么用武之地。 2.3 DLP數(shù)字投影機(jī)首先得承認(rèn),看到眾測頁面這段的介紹時,LZ誤以為是世嘉Homestar那種星空投影燈的效果 投影機(jī)在Rokid的頭部內(nèi),采用TI的DLP數(shù)字投影技術(shù),搭配有全色域LED陣列,壽命可達(dá)3萬小時。 定制化的光路和非球面光學(xué)鏡片組,可將交互表情、圖像等信息投射到雙曲率顯示表面上,盡量做到清晰、柔和、不失真。 Rokid的顏色有多色可選,投射出來的效果都很美。 Rokid的亮度在明亮環(huán)境下會稍顯不足。 黑暗環(huán)境下做氛圍燈效果很不錯,特別是這個桃紅色。 投影機(jī)投射出來的畫面遠(yuǎn)看很靈動,清晰度也足夠日常使用。 不過湊近看的話投射畫面還是會比較模糊,畢竟投影不能跟數(shù)碼產(chǎn)品的視網(wǎng)膜屏比。 ps:這不是LZ拍糊了。 最后再上幾張不同圖案的“星·情”: 其實圖案是千變?nèi)f化的,不過LZ是對稱黨于是就選了這幾張。白色投影燈光下玉石般的機(jī)身,Rokid有種攝人心魄的美。 2.4 麥克風(fēng)陣列Rokid的麥克風(fēng)在底座的上部,靠近頭部位置。 8顆高靈敏度數(shù)字MEMS麥克風(fēng)組成了全向圓形陣列;采用Rokid智能AEC算法消除自身音源,實現(xiàn)放音的同時,360度全向拾取外界語音命令;使用Rokid研發(fā)的beamforming算法進(jìn)行空域降噪處理,有效拾音距離可達(dá)5米;采用Rokid研發(fā)優(yōu)化的DNN(深度神經(jīng)網(wǎng)絡(luò))算法語音激活,綜合提高在復(fù)雜環(huán)境下的語音交互的準(zhǔn)確性和流暢性。 語音控制需要精準(zhǔn)的收音和優(yōu)秀的降噪,全方位的麥克風(fēng)、Rokid團(tuán)隊自行研發(fā)的降噪等算法也讓整體的語音交互表現(xiàn)很優(yōu)異。 2.5 音響系統(tǒng)Rokid的音響系統(tǒng)在底座內(nèi),整個底座的側(cè)面都是音響的鋁合金箱體。面板上方的圓環(huán)是發(fā)光區(qū)域,而當(dāng)你跟Rokid對話時,聲音尋向技術(shù)會讓朝向你的方向亮起燈來。
以上是Rokid的官方介紹,后面相關(guān)章節(jié)有對音質(zhì)的介紹;至于手感和做工,完全沒得挑。 2.6 電源適配器電源適配器個頭不小,做得非常美,就像一塊白色的鵝卵石。 適配器背面有四個膠墊,既能防滑又能防止劃傷,用了幾天有點(diǎn)臟了。背面還給出了一些基本信息,輸出是15V/4A。使用過程中大概1小時充電25%,相比于2600mAh的電池,充電速度可是夠慢的。 對了,Rokid底座的底面有一圈和這個相同材質(zhì)的膠墊,防滑效果滿分。 2.7 APP第一次開機(jī)時Rokid就會提醒你下載Rokid的APP,然后通過Rokid頂部的攝像頭來掃描手機(jī)里APP生成的二維碼來實現(xiàn)手機(jī)和設(shè)備的綁定。 除了綁定設(shè)備,還有不少設(shè)定需要在APP端實現(xiàn),也有不少設(shè)置需要APP才能實現(xiàn)。 這就是APP的主頁,Rokid處在開機(jī)狀態(tài)的話手機(jī)會自動連接Rokid,然后就可以通過APP控制Rokid了。 Rokid有四種音效,只能通過APP調(diào)節(jié)?!罢!焙汀疤鹈馈钡牟顒e不太大,“蠟筆小新”低沉的聲音和“機(jī)器人”的機(jī)械聲音有時會聽不清,總體看還是默認(rèn)的“正?!弊詈糜?。 除了四種音效外,還可以自定義音質(zhì),不過LZ沒在這方面做過多嘗試。 在APP中,你可以查看當(dāng)前是不是出于最新版本,需不需要給Rokid升級——不同于成熟的APP,還在成長期的Rokid需要你的每一次及時升級,一定能給你帶來驚喜——不過聯(lián)網(wǎng)時Rokid就會提示升級,APP這里更大的意義在于可以看到每次系統(tǒng)升級優(yōu)化了哪些方面,實現(xiàn)了哪些功能,得知后可以第一時間去使用。 燈光的顏色和亮度可以在APP端調(diào)節(jié),也可以直接對Rokid語音控制調(diào)節(jié);屏保有四種主題,要變換主題或者待機(jī)時間,就只能通過APP了。 桃紅色看著就很甜美。 LZ最常用的還是白色,比較耐看。 這個是時鐘屏保,秒針(表盤左下)就像流星一樣沿著圓圈緩緩劃過。 連續(xù)無操作大概13秒(沒錯,反復(fù)計時后發(fā)現(xiàn)不是10s也不是15s)后,或者對Rokid說一聲“沒事了”,Rokid就會進(jìn)入待機(jī)狀態(tài),投影也會投射屏保動畫。Rokid共有四種屏保效果,分別是Fantasy、藍(lán)色星空、水母和時鐘,只能通過APP來更換。 下面就是這四種屏保的動圖: 動圖沒看過癮的,可以看這個一分鐘的視頻: APP里還可以查看Rokid的使用說明,其他APP的應(yīng)用將穿插在相關(guān)章節(jié)來介紹。 如果Rokid關(guān)機(jī)(長按開關(guān)機(jī)鍵關(guān)機(jī),而非觸摸頂部或者語音“關(guān)機(jī)”)的話,APP就無法連接設(shè)備,APP里的種種功能按鈕也就消失了。 2.8 其他Rokid頭部的背面是“Rokid”的logo,印在一塊圓形鋁合金面板上,周邊同樣可以發(fā)光。 開關(guān)機(jī)鍵和電源插口在底座的后方。 需要說明的是,通過語音或者觸摸攝像頭區(qū)域只能讓Rokid暫時休眠,如果要徹底關(guān)機(jī),需要長按開關(guān)機(jī)鍵(再開啟時也是長按這枚按鍵)。 最后附上Rokid配置表。前面介紹的攝像頭、投影機(jī)和麥克風(fēng)等硬件很吸引人,這里的亮度傳感器、觸控傳感器、接近傳感器、電子羅盤、陀螺儀等如此多的傳感器也讓人對Rokid的成長有所期待。 另外小吐槽一下:Exynos 5410是三星S4用過的CPU,略顯陳舊,不知隨著Rokid的功能升級會不會顯現(xiàn)出疲態(tài);2600mAh的鋰電大概支持1.5h-2h的使用時間,也只能讓你偶爾享受下無線的快感或者臨時救急,電源線是萬萬離不了的;目前Rokid使用的是安卓4.4,不知以后能不能吃上棒棒糖甚至棉花糖。 3、差強(qiáng)人意的語音交互Rokid沒有鍵盤和鼠標(biāo),沒有觸摸屏,幾乎所有的操作都是通過語音控制的——盡管還可以通過手機(jī)APP操作,但誰拿著智能手機(jī)還用筆呢(LZ不是在黑誰)。 先用一個20分鐘的視頻展示一下使用過程吧: 注:視頻里Rokid的聲音沒做任何處理。這個視頻主要是對Rokid語音交互的一些測試,以及下一節(jié)要介紹到的內(nèi)容的展示。 首先,你要喚醒Rokid。機(jī)器人不可能24小時待命,你需要讓Rokid知道她要在什么時候聽你說話。喚醒的方式很簡單,只要喊“若琪”就可以了。Misa和整個團(tuán)隊在簡化喚醒上面花了很大工夫,相比于“嘿,Siri”的三音節(jié),“若琪”的兩音節(jié)真的省了不少事。而當(dāng)你跟Rokid連續(xù)對話時,后面就不用每句話都帶著“若琪”了。譬如你問“若琪,今天天氣怎么樣?”,待Rokid回答之后,你免去“若琪”直接說“那后天呢?”,Rokid也可以順利拾音、分析,并告知你后天的天氣。Rokid這種理解上下文的能力,也讓人機(jī)交流更加自然。 總的來說,Rokid語音識別很準(zhǔn)確,特別是中文普通話和英文,基本都能準(zhǔn)確識別,日常對話、點(diǎn)個歌或者其他內(nèi)容還是沒問題的(LZ不會方言沒能測試)——這里舉個例子,家里一歲半多的孩子說出的“若琪,關(guān)機(jī)”都可以讓Rokid關(guān)機(jī)了 另外,Rokid的拾音距離也很遠(yuǎn),日常生活中五米之內(nèi)問題都不大(當(dāng)然環(huán)境噪音越大識別起來越困難)。比較安靜時LZ從廚房對著客廳喊話,距離大概七八米,Rokid也可以準(zhǔn)確識別。目前Rokid尚不具備遠(yuǎn)場識別的能力,不過據(jù)說正在研發(fā)當(dāng)中? 平時Rokid放在電視柜上,電視里播放電視劇時的對話也不會有太多干擾,LZ實測過Rokid對于錄制的人聲干擾可以很好的排除: 但是,對于環(huán)境中真實的人聲,Rokid無法很好地區(qū)分開來。譬如如果LZ正在跟Rokid對話,一旁重復(fù)LZ說話的北鼻或者其他人的對話,會讓Rokid一直拾音,然后大概是語音識別后語義不明,Rokid就沒有任何回復(fù)或者作出個不相干的回復(fù)了。另外對于一些“嚴(yán)肅”的問題,Rokid就顯現(xiàn)出了能力不足的問題。譬如面對“地球的直徑是多少”,Rokid的回答就是“心有多大,地球就有多大”這般插科打諢的回答。如果Rokid能像Siri那樣,可以聯(lián)合搜索引擎并利用起投影機(jī)來顯示搜索信息,那將能滿足更多需求。 既然是語音控制,那其中就包含語音識別(把輸入的聲音信號轉(zhuǎn)化為文字)和語義識別(轉(zhuǎn)化完后理解這些文字),也就是先要聽見說什么,然后聽懂說什么。聽懂了之后,就需要對話管理系統(tǒng)做出反應(yīng),以及前兩個過程的逆過程。在語義識別這方面,Rokid做得還真不賴,反應(yīng)也很智能,特別是無聊時的侃大山 LZ:我明天穿長袖還是穿短袖啊? Rokid:明天貌似不會很冷,穿個薄點(diǎn)的長袖吧。 LZ:我明天穿裙子可以嗎? Rokid:好尷尬,我對穿什么衣服沒什么經(jīng)驗(然后顯示明天的天氣) LZ:磊猴啊 Rokid:真喜歡你說話時這股濃濃的港式魚蛋味 LZ:我難受 Rokid:肯定是心事太多了,跟我說說吧 LZ:豬肉燉粉條 Rokid:好吃嗎? LZ:(晚上十一點(diǎn))今天天氣怎么樣? Rokid:這個點(diǎn)你問我今天的天氣,你逗我呢?!/大晚上的問我這個問題,我是不會告訴你今天是晴天的。(然后顯示今天的天氣) LZ:你怎么這么漂亮啊? Rokid:你羨慕不來的,我這是天生麗質(zhì)難自棄 LZ:美國總統(tǒng)是誰? Rokid:現(xiàn)在是奧巴馬,未來就不知道了 LZ:鋤禾日當(dāng)午 Rokid:鋤禾是誰,當(dāng)午又是誰? LZ:白日依山盡 Rokid:依山盡是誰,黃河又為何后入海流 LZ:床前明月光 Rokid:舉頭望太陽/地上鞋兩雙 LZ:挖掘機(jī)技術(shù)哪家強(qiáng)? Rokid:中國山東找藍(lán)翔 LZ:你冬天穿不穿秋褲??? Rokid:保暖褲和棉褲是用來干嘛的 LZ:你覺得蘋果手機(jī)怎么樣 Rokid:價格偏貴,但用的人也不少哦 LZ:我想吃蘋果 Rokid:蘋果是我的,西瓜也是我的 LZ:我得去買束玫瑰花 Rokid:現(xiàn)在去買玫瑰花應(yīng)該能便宜點(diǎn)吧 LZ:啟動自我毀滅程序 Rokid:再見(關(guān)機(jī)了) LZ:你去自爆吧 Rokid:我覺得我的心涼颼颼的 4、豐富的資源庫通過Rokid,你可以收聽音樂、廣播、故事,你還可以向她咨詢天氣、日期、匯率等等,前一節(jié)的視頻做了語音交互的演示,這一節(jié)通過圖片和文字做一些詳細(xì)介紹。 4.1 天氣、時間、日期、鬧鐘這些都是基礎(chǔ)功能中的基礎(chǔ)了,Rokid實現(xiàn)起來自然游刃有余。 你可以問Rokid今天的天氣。 你可以問Rokid未來幾天的天氣,而如果你剛問了關(guān)于天氣的問題,那么只需要問“未來一周呢?”,而省略“天氣”這個關(guān)鍵詞——這種對話對人類來說很容易理解,但對于機(jī)器人的語義識別,就遠(yuǎn)遠(yuǎn)比直接問“未來一周的天氣”要困難多了,也足見Rokid的智能化程度。 詢問時間這種事當(dāng)然是小case了。 忘了日期也是常有的事,轉(zhuǎn)身問下Rokid就好啦。 有些地區(qū)的人或者老人更在意陰歷(農(nóng)歷),這事兒問Rokid,不光是幾月幾號,連今年的天干地支都知道了。 睡前跟Rokid說一聲,明天/一周/工作日的鬧鐘就都定好啦。 起床時間有變?跟Rokid說一聲就能取消/更改。 4.2 音樂Rokid接入的是蝦米音樂,如果你想聽某首歌,只需要對Rokid說“我想聽XXX”或者“播放XXX”。 一段時間使用下來,音樂是LZ使用頻率最高的應(yīng)用了。 例如對Rokid說了歌名,投影機(jī)會投射出歌名、歌手和專輯圖片(如果有的話)。 短暫顯示歌曲信息后,投影機(jī)會開始投射所謂的“星·情”,確實挺美的。 歌曲播放過程中你可以讓Rokid收藏/取消收藏、播放下/前一首、音量大/小一點(diǎn)、亮/暗一點(diǎn),或者直接喊一聲“若琪”,就會暫時退出播放??傊@期間你可以下達(dá)任何,不僅是歌曲,其他內(nèi)容也是一樣。 至于Rokid的音響,前面已經(jīng)介紹了參數(shù),值友可以看下面這個視頻感受下: 相機(jī)錄制視頻的采音效果比較捉急,視頻中效果欠佳。LZ平時用羅技的UE boom mini,對比之下感覺Rokid的音響效果非常好——首先360°音響可以營造出表現(xiàn)力很強(qiáng)的音場,特別是在十幾二十來平米的小空間中央放一個Rokid;低頻有力,中高頻也不乏力,解析力中規(guī)中矩——怪不得眾測頁面的標(biāo)題會定位于“音樂機(jī)器人”,這5000塊的定價,恐怕音響部分會占去不少成本。總之,如果你喜歡聽音樂,經(jīng)常聽中英文歌曲,想躺在沙發(fā)上或者洗著菜時隨時“起music”,Rokid滿足你綽綽有余。對于LZ來說有點(diǎn)麻煩的是,用“若琪”讓Rokid退出播放后,如果幾秒鐘沒有其他指令,或者只是進(jìn)行了一些平常對話之后,會繼續(xù)回到之前的(LZ已經(jīng)想終止了的)音樂播放,這時候需要特別說一下“停止播放”來徹底終止。 關(guān)于歌曲庫,點(diǎn)播中英文歌曲沒問題,這主要是因為Rokid對中英文優(yōu)秀的語音識別能力和曲庫的完備,而且也很智能。譬如說“播放《天空》”,Rokid會播放天空的《記住我的心》;而如果說“播放王菲的《天空》”,就會播放LZ想聽的王菲的《天空》——但是,對于喜歡ACG的LZ來說,點(diǎn)起歌來就有點(diǎn)捉襟見肘了。譬如LZ讓Rokid“播放《新世紀(jì)福音戰(zhàn)士》的主題曲”,然后Rokid播放了楊千嬅的《新世紀(jì)福音戰(zhàn)士》,還是粵語歌。什么?你沒聽說過這首歌,LZ也是第一次聽到好嘛,整個人都斯巴達(dá)了 前一節(jié)的視頻中也顯示了點(diǎn)日文歌曲時經(jīng)常是答非所問,幸好Rokid每兩周就會進(jìn)行一次系統(tǒng)更新,而最新的一次更新中,終于有了藍(lán)牙功能。不過在使用藍(lán)牙的過程中還是遇到了種種問題,在第一天發(fā)現(xiàn)更新了藍(lán)牙之后,就用手機(jī)嘗試了連接: 確實成功連接藍(lán)牙了,也成功播放了手機(jī)里的歌曲,但是播放過程持續(xù)卡頓,完全沒法聽,而且語音控制Rokid停止播放后再播放其他內(nèi)容(譬如繪本),藍(lán)牙播放無法停止,Rokid還是會同時播放兩個內(nèi)容。第二天又嘗試了用iPad藍(lán)牙連接,剛開始連接成功后順利播放,但斷開后再連接又出現(xiàn)了問題,也再沒進(jìn)行其他測試,可以查看下面這個測試過程的視頻: 正如藍(lán)牙的名稱“ROKID-TEST233”,藍(lán)牙功能尚在測試階段,靜候更新吧233。4.3 “聽書”“故事”和“繪本故事”通過APP首頁的“內(nèi)容”,你想聽的資源都能找得到。 “內(nèi)容”一欄有兩級菜單,第一級菜單(左上圖)里把內(nèi)容分了“聽書”“故事”和“繪本故事”;第二級菜單(右上圖及下面兩張圖)里則是各自類別龐大的內(nèi)容庫。 有多龐大? “聽書”的類別下有21個標(biāo)簽分類,包括:資訊、情感生活、相聲評書、教育培訓(xùn)、百家講壇、廣播劇、戲曲、電臺、IT科技、校園、汽車、旅游、電影、游戲、有聲書、綜藝娛樂、外語、兒童、健康養(yǎng)生、商業(yè)財經(jīng)、歷史人文。 “故事”的類別下有7個標(biāo)簽分類,包括:熱門故事、睡前故事、兒歌、故事集、成語故事、童話故事、英文故事。 “繪本故事”的類別下有9個標(biāo)簽分類,包括:奇妙科學(xué)、心靈成長、英文專欄、親近自然、異想天開、探險奇遇、認(rèn)識世界、愛的魔力、藝術(shù)啟迪。 而每一個標(biāo)簽分類下面,都還有幾十個甚至上百個專輯,可以充分滿足家中所有人的需求——特別是孩子的,不僅三個大類中兩個是給他們準(zhǔn)備的(故事和繪本故事),甚至“聽書”的“兒童”下面也有有多達(dá)232個專輯——看來以后可以少買很多兒童類圖書了。 下面是使用視頻,很簡單,只要對Rokid說“若琪,我要聽XXXX”就可以了: 唯一要注意的是,“XXXX”必須是那個專輯的準(zhǔn)確名稱。譬如如果你想聽“聽書-資訊-克強(qiáng)時刻”,對著Rokid說“我想聽‘克強(qiáng)時刻’”就可以了,而視頻中我說成了“我想聽‘克強(qiáng)時間’”就不可以。所以面對Rokid偌大的內(nèi)容庫,最初上手時APP還是挺重要的,畢竟你不可能知道而且記得住Rokid可以播放的所有內(nèi)容的名稱。你只需要在APP點(diǎn)擊該專輯,就可以播放、停止或者調(diào)節(jié)音量。等熟悉了常聽的專輯名時,就可以輕松地單靠語音隨時聽到想聽的內(nèi)容了。 翻看時竟然在繪本里找到了《我討厭媽媽》,這可是在家里被LP封印了的繪本 當(dāng)然,現(xiàn)在毀眼睛的手機(jī)、平板、電視、早教機(jī)什么的太多了,用Rokid給孩子講繪本時也要注意Rokid亮度不要太高、房間明亮、使用距離足夠遠(yuǎn)和不要讓小孩用太久。 4.4 游戲和廣播Rokid還可以玩flappy bird,你只需要對Rokid說“我要玩小鳥”(Rokid的開發(fā)團(tuán)隊,你們需要去污粉了 另外,Rokid還可以收聽廣播,包括當(dāng)?shù)氐膹V播已經(jīng)國家廣播,可以直接通過頻段點(diǎn)播,或者通過Rokid左右兩邊的觸控區(qū)域來調(diào)臺。 這兩個應(yīng)用在前面的視頻中都有展示,不再贅述。 4.5 其他iOS 10已經(jīng)把Siri開放給了第三方開發(fā)者,現(xiàn)在用戶已經(jīng)可以讓Siri實現(xiàn)更多的功能,譬如叫車、訂餐。Siri在變得越來越強(qiáng)大,但即使是這樣的Siri也還是處在一個若有若無的位置(周圍很多蘋果手機(jī)用戶甚至從來沒用過Siri)。 而Rokid作為主要通過語音來交互的智能設(shè)備,語音交互和聯(lián)通其他應(yīng)用的能力就更是要成為“成長”的重點(diǎn)。通過語音來輸入,通過投影機(jī)來顯示,期待Rokid早日連通打車、訂餐等更多生活應(yīng)用。 5、Rock Your Home——聯(lián)結(jié)智能家居5.1 語音操控智能家居上周的原創(chuàng)話題之一就是#智能家居#,看了幾個參加話題的原創(chuàng),唯一的感覺就是——強(qiáng)行智能。LZ絕對沒有貶義,只是目前家居產(chǎn)品的智能化程度還很低,基本都以手機(jī)操控為中心。很多所謂的智能還不及動動手指頭來得直接便捷,或者只不過是安放工具,并不算真正意義上的“智能”,因而我們能實現(xiàn)的智能化程度也就很低。 Rokid的賣點(diǎn)之一、也是申請眾測時吸引LZ的地方之一,就是Rokid可以跟智能家居聯(lián)動——通過和Rokid語音對話,實現(xiàn)直接控制智能設(shè)備的目的。 目前Rokid可以聯(lián)動的智能家居品牌包括飛利浦(Hue)、Lifesmart(燈、燈帶、窗簾、空氣凈化器、入墻開關(guān)、插座)和Broadlink(SP、SP mini),括號里是這些品牌里支持和Rokid聯(lián)動的產(chǎn)品——嗯,目前支持的就這么多了,據(jù)客服說Rokid正在跟小米談,總之最大的問題還是支持的智能設(shè)備不夠多。 你可以直接對Rokid說“搜索智能設(shè)備”,然后Rokid會搜索在同一個WiFi下支持的智能設(shè)備。 APP端可以看到Rokid連接了哪些智能設(shè)備。除了直接對Rokid語音控制外,也可以通過APP來遠(yuǎn)程控制。 LZ沒有Lifesmart和飛利浦的智能設(shè)備,只有兩個Broadlink的插座,和Broadlink的聯(lián)動過程非常簡單:首先,你要在APP端對智能設(shè)備命名,好讓Rokid“認(rèn)識”這個插座,譬如LZ把旁邊這個插座命名為“地?zé)簟保蝗缓?,把地?zé)艚釉诓遄?,地?zé)舯3珠_啟狀態(tài);這樣,你只需要對Rokid說“打開地?zé)簟被蛘摺瓣P(guān)掉地?zé)簟眮砜刂?,而不需要撥動地?zé)舻拈_關(guān),也不需要操作手機(jī)的APP。 開燈關(guān)燈什么的也沒太多必要演示,大家可以看看Misa在優(yōu)酷po的兩個視頻,包括開關(guān)燈、開窗、開電扇、開空調(diào)等: 5.2 聯(lián)動命令而在APP端,你還可以自定義Rokid對語音命令的聯(lián)動執(zhí)行,下面是兩個例子: 第一個聯(lián)動是睡前,想在對Rokid說晚安后讓她先關(guān)閉床頭燈,然后自己關(guān)機(jī),每個命令都有3秒的執(zhí)行間隙;第二個聯(lián)動是回家后,希望對Rokid說了“我回來啦”之后,她能自動播放收藏的歌曲。下面是視頻演示: 當(dāng)然這兩個只是簡單的例子,你可以在指令列表里添加一長串的指令,這樣只需要一個命令就可以得到一大串的反饋,譬如:你進(jìn)門說一句“我回來了”,Rokid就打開地?zé)?,自動播放收藏的歌曲,打開空調(diào),關(guān)閉窗簾……但是,你的家電要么需要是機(jī)械開關(guān)的(幾乎絕跡),要么需要出廠就植入了智能芯片(很少)——所以這個想法很好,Rokid本身的設(shè)計也沒問題,唯一的問題就是,沒有足夠多的智能設(shè)備去方便地利用。 Broadlink、Lifesmart、小米等品牌都有自己的一套智能家居產(chǎn)品,但相互之間又不能互通,這給消費(fèi)者的自由選擇和搭配使用帶來了很大的不便。如果智能家居產(chǎn)品不能有一個統(tǒng)一的平臺和標(biāo)準(zhǔn),而通過Rokid能把他們都聯(lián)動起來,那將會是Rokid的一大賣點(diǎn)。 ps:對于一些比較長的指令,特別是包含長英文的指令,設(shè)定個比較短的指令就很好用了,新技能get√。 6、研發(fā)中的一些功能6.1 封印中的眼睛——關(guān)于人臉識別譬如聞名于《最強(qiáng)大腦》的人臉識別機(jī)器人水哥王昱珩跟人臉識別機(jī)器人的對戰(zhàn): ![]() 又譬如最近的熱聞: ![]() 跟水哥對戰(zhàn)的機(jī)器人以1:2落敗,而大學(xué)教師的基于深度學(xué)習(xí)的課堂行為分析模型目前也只有“happy(高興)”和“neutral(一般)”兩種表情設(shè)定(另外判別準(zhǔn)確度也未可知),這都說明了目前人臉識別技術(shù)還有非常大的優(yōu)化空間。 目前Rokid的攝像頭并沒有被利用起來,未來將能實現(xiàn)視頻通話的功能。當(dāng)然目前更沒有人臉識別的能力,但既然團(tuán)隊都放出話來了,LZ自然也很期待Rokid未來的優(yōu)化。 6.2 封印過半的耳朵——關(guān)于語音識別和聲紋識別語音識別和聲紋識別的相同點(diǎn)都是分析和處理采集到的語音信號;而兩者又有巨大的不同:聲紋識別的目的是識別語音來源的身份,因此技術(shù)重點(diǎn)在于從語音信號中提取個人聲紋特征;而語音識別的目的是識別語音的內(nèi)容,更注重于提取語音來源中的語義。 一句話,語音識別是為了聽出說話的內(nèi)容,聲紋識別是為了聽出是誰說的話。 聲紋識別 iPhone將指紋識別推廣給了世人,深入到了每個人的日常生活;三星Note 7也開啟了大廠的虹膜識別的道路。 聲紋識別,區(qū)別于虹膜、指紋等其他生物識別技術(shù),有著天然的優(yōu)勢:使用方便,不需要到達(dá)特定的位置或者進(jìn)行特定的操作。同時,聲紋識別也有很多需要解決的問題:聲音來源會受到身體狀況、語氣等影響而有輕微變化,聲音采集設(shè)備精度的要求,以及包括其他人聲等環(huán)境噪音的干擾。因此,聲紋識別的應(yīng)用環(huán)境最好是在一個相對安靜的環(huán)境,避免過多干擾,這樣來看家庭、學(xué)校等就是很合適的場景了。而Rokid正是定位于家庭,很適合使用聲紋識別技術(shù)。 但是,Rokid目前并沒有聲紋識別的能力,本段討論結(jié)束 語音識別 準(zhǔn)確率:從測試視頻可以看出,Rokid的語音識別在安靜環(huán)境、單一聲源下,識別準(zhǔn)確率很高。只是有時候說話太快或者用詞不標(biāo)準(zhǔn),會讓Rokid有點(diǎn)莫名其妙。當(dāng)然,你需要說普通話。 反饋時間:在語音控制的對話中,通常會把命令控制在一句話、幾個字里,所以Rokid準(zhǔn)確拾音后,反饋的速度很快。 音源消除:Rokid自身有這樣一種機(jī)制,譬如如果Rokid正在用很大的音量播放音樂,你并不需要用蓋過音樂聲音的嗓門兒去對著Rokid喊,而只是需要比平時稍大一點(diǎn)的聲音去命令即可——嗯,還是要稍微大一點(diǎn)。 前面提到了,在日常嘈雜環(huán)境中,特別是有多人同時說話(特別是干擾聲音來自真人說話而非來源于電視),Rokid會一直拾音到所有人說話間斷,然后混亂到?jīng)]有回應(yīng),或是反饋一個無意義的回應(yīng)。而如果Rokid具備聲紋識別的能力,就可以從“若琪,……”之后Rokid只識別并錄入這個人的命令,從而避免引起拾音混亂。 6.3 深度學(xué)習(xí)可能是LZ對Rokid的宣傳有什么誤解,看到“基于深度學(xué)習(xí),Rokid為家庭量身制定音樂、新聞等內(nèi)容服務(wù),進(jìn)行智能化推送,讓家庭生活更加高效且充滿樂趣”的宣傳語時,誤以為Rokid可以逐漸“記住”使用者的喜愛和偏好。 譬如很多音樂APP都可以實現(xiàn)的“猜你喜歡”,LZ本以為Rokid可以做到使用一段時間之后,再對她說“我要聽歌”,就可以根據(jù)播放歷史曲目或者收藏曲目來做推薦,直接播放使用者有很大概率會喜歡聽的歌曲——然而,并不能。LZ每天都會用Rokid播放音樂,而在眾測報告截止的最后一天對Rokid說了“我要聽歌”之后,播放的還是LZ絕對不會想聽的歌曲,連切了五首歌結(jié)果也是一樣。 最基本的,LZ想像Siri那樣告訴Rokid LZ是誰、以后怎么稱呼,然而Rokid也并不能做到這一點(diǎn)。于是LZ關(guān)于“深度學(xué)習(xí)”咨詢了Rokid客服,得到的回復(fù)是,“如果你問了Rokid一個問題,她說不知道,那么過幾天你再問,她可能就回答上來了,這個就是Rokid的深度學(xué)習(xí)”。 LZ當(dāng)時真的是“只要微笑就好了吧”的表情,客服這答復(fù)怎么有點(diǎn)人工加入對話腳本的意思。 7、結(jié)語正如LZ在眾測頁面的回復(fù)的一樣,這個機(jī)器人值得評測的地方也太多太多了 優(yōu)點(diǎn)1、外形美翻了。不管是開機(jī)時美輪美奐的顯示效果,還是關(guān)機(jī)時的靜若處子,Rokid都是一個絕佳的裝飾品。 2、音響效果出眾。不虧是眾測的“音樂機(jī)器人”。 3、交互方式簡單,0學(xué)習(xí)成本 4、語音指令響應(yīng)速度快、識別能力出眾。 5、內(nèi)容庫豐富,能滿足全家人的需求。 不足1、兩側(cè)觸控區(qū)域不太容易操作,不管是調(diào)節(jié)音量和亮度,還是玩Flappy bird,以至于LZ從來都是用語音來調(diào)節(jié)音量和亮度。 2、CPU陳舊。 3、不能很好排除真實人聲的干擾。 4、待機(jī)時間短。大概是因為Rokid定位于家庭機(jī)器人,所以待機(jī)方面沒做太多考慮。其實別的都還好,畢竟在家使用會一直插著電源,只是偶爾聽音樂時想把Rokid放在客廳中間,讓360°發(fā)聲的發(fā)燒級音箱發(fā)揮一下,拖根線就不是很方便了。 5、部分尚在研發(fā)中的功能體驗不佳(譬如藍(lán)牙),app端的部分控制也會偶有失靈,還需要不少優(yōu)化工作。 6、聯(lián)動智能家居表現(xiàn)有待改善。當(dāng)然這個鍋不能都讓Rokid背,主要是智能家居產(chǎn)品太少了,而Rokid也在不斷擴(kuò)展可以聯(lián)動的產(chǎn)品范圍。 7、聲紋識別、人臉識別、遠(yuǎn)場識別、深度學(xué)習(xí)、開放SDK連通更多應(yīng)用……其實這不能算是不足了,只是目前這樣一個消費(fèi)級產(chǎn)品的出現(xiàn)還有些費(fèi)力。當(dāng)初LZ就對Rokid的廣告持懷疑態(tài)度,不過本著對創(chuàng)始人的信心還是抱有信心,相信Rokid這個還是kid的Robot一定會繼續(xù)成長——這也是標(biāo)題“不完全”的由來,因為Rokid本身還不能算完成品。 大概還是有人會吐槽售價,但是這配置、這功能,真的值回票價了。 建議1、建立一個官方微信群或者QQ群。對于還在研發(fā)階段的Rokid,用戶幾乎每天都能發(fā)現(xiàn)大大小小的問題,每個問題都打電話既不便于用戶反饋,也不便于開發(fā)者收集信息。而有這樣一個交流平臺之后,用戶不僅能迅速反饋遇到的問題,還能相互交流使用心得,給出未來研發(fā)方向的建議,而Rokid開發(fā)人員也可以從中迅速發(fā)現(xiàn)和解決問題,還可以收集用戶使用感受方面的信息。 2、以后能有硬件更換機(jī)制。目前的配置能不能應(yīng)對Rokid的成長?如果說有的硬件還是應(yīng)對起來“吃不吃力”的問題,那有的硬件就是“能不能”的問題了。希望開發(fā)團(tuán)隊在開發(fā)新技能的同時,可以考慮老用戶的升級問題——因為現(xiàn)在太多功能還在開發(fā)當(dāng)中,甚至有很多技術(shù)在科研領(lǐng)域都尚未完善,而Rokid的CPU、安卓4.4都讓人有些擔(dān)憂,如果僅靠升級系統(tǒng)無法做到功能的升級,硬件能力不足以支撐或者不能支持新的功能,那是不是可以有償提供兼容的替換配件或者提供寄修服務(wù)。 3、恰當(dāng)方式的宣傳。LZ搜索Rokid的信息時,除了新X的一個眾測有幾個用戶的眾測報告外,就只有幾個門戶網(wǎng)站的新聞介紹,甚至有些信息還是在X乎找到的;而視頻信息,最多的也就是優(yōu)酷上Misa的自頻道發(fā)布的視頻了,而且都是AV畫質(zhì)的測試性視頻,對消費(fèi)者的吸引力負(fù)分。如果Rokid還準(zhǔn)備開啟新一輪的銷售,如果數(shù)量還是只有幾百臺,那賣出去恐怕不是問題。但如果Rokid想做成一個成功的話題性產(chǎn)品,那么吸引眼球的營銷還是必須的。 這兩個軟銀機(jī)器人Pepper的廣告,一個借用了偶像(堺叔)的光環(huán),一個利用生活化的場景很容易引起觀眾共情,都讓人看過之后對Pepper念念不忘,會想去和其他人聊Pepper的功能和特性,讓這個產(chǎn)品深深地扎根在觀看過的人的腦海里。4、比以上更重要的是,種種既定“黑科技”的實現(xiàn)。 8、后話開頭Misa的《人和機(jī)器的邊界》的主要觀點(diǎn),就是人和機(jī)器的邊界已經(jīng)沒有那么清晰了。這一點(diǎn)表現(xiàn)最明顯的就是我們對手機(jī)的依賴,Siri、Echo等語音助手在不斷蛻變,智能家居慢慢地普及開來…… Misa在presentation還提到了另外一個問題,當(dāng)前科技的邊界。他認(rèn)為科技產(chǎn)品的步子不能太大,要探索當(dāng)前科技發(fā)展的邊界,然后在這個邊界附近來做。Rokid所描繪的聲紋識別、人臉識別、遠(yuǎn)場識別、深度學(xué)習(xí)、聯(lián)動智能家居……都很美好,但是每一樣都觸及到了當(dāng)前科技的邊界,集如此多難點(diǎn)于一身的產(chǎn)品很炫酷、很超越時代,做起來也無比艱辛。希望Rokid團(tuán)隊能義無反顧地把Rokid做好,并作出更好的產(chǎn)品——他們需要技術(shù),更需要大量時間和資金的投入。 最近一兩年來,家庭陪護(hù)機(jī)器人產(chǎn)品就像雨后春筍般冒出來,而蘋果、谷歌、微軟、亞馬遜、百度等大公司也都投入了大量人力、財力來進(jìn)行相關(guān)技術(shù)和產(chǎn)品的研發(fā),譬如亞馬遜剛剛推出了二代Echo Dot,谷歌未來將推出的Google Home,越來越多的消費(fèi)級家庭機(jī)器人(如果這些都算機(jī)器人的話)正在向我們走來。 正如Pepper那則宣傳片結(jié)尾傳達(dá)的信息“SFじゃない”,曾經(jīng)出現(xiàn)在我們文學(xué)、電影等SF作品中的機(jī)器人,將不再只是存在于SF。 |
|