在 AI 的加持下,錄音筆仿佛有了開掛的「人生」: 最高支持 10 米遠距離拾音,可過濾 4 萬余種真實噪音;可根據(jù)用戶語言習慣個性化轉寫,語音轉寫準確率達 98%;還能區(qū)分不同人聲,做重點標記,自動提煉摘要。 它還能充當你的翻譯官,支持 63 種語言的對話翻譯,以及同聲傳譯。 你可以用它做會議錄音、聽課記錄、采訪,也可以用它與不同國家的游客交流,甚至可以拿著它刷美劇。 沒錯,這正是搜狗新推出的新款 AI 錄音筆 S1。它的背后,不單單是一款硬件,更是搜狗 AI 能力的集合。
搜狗公司 CEO 王小川道出了他們做 AI 硬件的目的,「隨著 AI 技術的進步,我們希望用戶能更自由的表達,用你的聲音、表情或肢體來表達,機器就可以理解,這些我們能做到的時候,就算達到了一個技術高度?!?/section> 01、搜狗 AI 錄音筆是如何煉成的? 從搜狗輸入法到語音交互、機器翻譯,再到 AI 硬件,這背后有著深刻的搜狗 AI 發(fā)展邏輯。 早在 2016 年,當時搜狗沒有做 AI 硬件,而是做了語音開放平臺「知音引擎」,嘗試技術輸出。 但當時各路語音平臺紛紛涌現(xiàn),方案上沒有誰真正不可替代,客戶往往在多家間來回切換。另一方面,通用技術平臺體驗并不理想,加上 AI 行業(yè)處于早期,軟件免費的思路還停留在很多人心中。 因此從 2017 年下半年開始,搜狗開啟 AI 硬件的探索,沉淀技術,打磨硬件與場景。 2018 年上半年,搜狗推出探索之作——AI 翻譯機和 AI 錄音筆。如今 AI 硬件,已和輸入法、搜索一樣,是搜狗的幾大重要戰(zhàn)略之一。 接著 2019 年 3 月,搜狗又推出一款小巧的 AI 錄音筆 C1,它具備了最新產品的雛形,支持語音轉寫、云端分享、中英同傳等多種 AI 功能。 更重要的是,C1 的出現(xiàn)讓略顯疲態(tài)的錄音筆行業(yè)鮮活了起來。經過用戶一段時間的使用,搜狗對用戶行為數(shù)據(jù)深入分析后,第一次呈現(xiàn)了用戶的真實畫像。
搜狗 AI 錄音筆 E1 接下來是高效整理。結合使用場景,搜狗做了一些非常實用的功能點,讓人印象深刻的是「敲重點」和智能摘要技術。 當你在聽課或者參加會議時,突然聽到一句神來之筆或者金句,「敲重點」就派上用場了。S1 有一個專用「M」鍵,按一下,它就會將這句話標記為重點。 面對一篇萬字長文,如何能快速獲取其關鍵信息。正是出于這種考慮,搜狗推出智能摘要功能,但其效果如何呢? 陳偉坦言,在 AI 錄音筆中提取摘要,遠大于學術研究中的摘要生成問題,因為錄音筆是在噪聲環(huán)境下,語音識別難以保證 100% 的準確率,從噪音文本中整理出符合文章語意的摘要是相當困難的。 因此在技術路線上,搜狗沒有使用生成模型,而是采用抽取式的摘要能力,基于原文找到關鍵詞,再通過排序算法,從文章中抽取關鍵句,形成摘要,保證足夠的精度。 此外,AI 錄音筆 S1 還能支持 5 人內的人聲分離,從而在文稿中自動分段呈現(xiàn)??紤]到掌聲、笑聲、點贊等節(jié)點可能會出現(xiàn)一些重點或金句,它還會自動識別并重點標記。 除了錄音筆所需要的服務外,搜狗還將 AI 翻譯能力內嵌其中。 目前搜狗 AI 錄音筆 S1 支持 63 個語種的在線翻譯,9 種離線翻譯。在對話過程中,S1 還具備自由對話功能,能夠自動識別說話人是否講完,進而呈現(xiàn)翻譯結果,無需手動操作。 此外,它還具備同聲傳譯功能,你可以帶著它聽英文演講、報告,屏幕上就會同步翻譯中文字幕。 種種服務背后,正如搜狗 CTO 楊洪濤所言,AI 錄音筆是為了讓人們更自由的表達,而這背后所用到的技術,相當多是對搜狗原有技術體系的復用,并針對硬件做更好的 AI 優(yōu)化。 03、AI 加持,行業(yè)呈現(xiàn)「新藍?!?/strong> 與搜狗 AI 錄音筆迭代一同上演的是,錄音筆行業(yè)的洗牌與變革。 錄音筆是一個相對狹小的傳統(tǒng)市場,過去 20 年間沒有太多變化,隨著智能手機集成功能的持續(xù)豐富,它面臨被手機替代的風險。 因此我國錄音筆每年銷量在 400 多萬臺徘徊,增長基本停滯,市場多被索尼、愛國者、紐曼等硬件廠商占據(jù)。 隨著搜狗 AI 錄音筆 C1 推出,市場格局開始出現(xiàn)變化。2019 年 6 月,它便成為京東錄音筆類目單品銷量冠軍、天貓錄音筆類目單品銷售額冠軍,隨后 11 月又拿下天貓京東雙平臺單品總銷量冠軍。 更為重要的是,AI 錄音筆的出現(xiàn),在主流電商平臺上,讓原本趨于平緩甚至下滑的錄音筆品類訪客數(shù)據(jù)明顯上升,既有的市場天花板正在被打破,行業(yè)呈現(xiàn)「新藍海」。
到 2020 年一季度,AI 錄音筆的銷量已占據(jù)整個錄音筆市場的 35%,行業(yè)變革正在上演。 與此同時,行業(yè)逐漸意識到 AI 優(yōu)質服務的重要性,不少公司主動找到搜狗,甚至包括一些硬件上的競爭對手,詢問能否購買搜狗的 AI 能力。 對于搜狗而言,盡管在硬件上取得一定成績,但很難一家獨大。因為在 C 端硬件市場,即使是最大的玩家,也很難占據(jù) 50% 以上的市場份額。但軟件不同,后者可以發(fā)揮網絡效應,一家獨大。 內外部因素碰撞下,搜狗決定再往前邁一步,開放 AI 錄音筆背后的聽寫服務。去年 8 月,搜狗聯(lián)合愛國者、紐曼、索尼錄音筆、萬城集團等錄音筆行業(yè)頭部企業(yè),成立 AI 創(chuàng)新聯(lián)盟,將搜狗 AI 能力開放給業(yè)界。 傳統(tǒng)錄音筆以硬件為主的商業(yè)模式也正在被打破,「硬件+服務」的新型收益模式正在形成。 搜狗 CTO 楊洪濤稱,「過去傳統(tǒng)硬件主要是賣毛利,未來我們希望探索一種服務化模式,通過 AI 能力向用戶提供更多增值服務,擴展傳統(tǒng)商業(yè)模式的空間。」 在 AI 錄音筆身上,我們看到兩條不斷交織的線,一條是搜狗 AI 的演進線,在「自然交互+知識計算」的指引下,從最初的語音識別發(fā)展到機器翻譯、搜狗分身,再到如今的多模態(tài)交互。 另一條是 AI 硬件變革線,將 AI 能力不斷注入硬件中,升級一個行業(yè),而錄音筆只是第一個。