趕上了互聯(lián)網(wǎng)浪潮的當(dāng)代人,每當(dāng)有任何困擾,第一反應(yīng)都是打開搜索引擎。 什么叫做“硬核相親”,什么是“pick一下”,“達(dá)達(dá)主義”,“隱形貧困人口”——你都默默搜索過,不想被時(shí)代與話題拋棄。也許只有這樣暗自努力,才能讓生活與社交看起來毫不費(fèi)力。 但搜索引擎無法解決一切。 信息爆炸時(shí),“大而全”不見得是一件好事,除了紛亂的資訊與競價(jià)廣告,搜索引擎能給的真的不多。更多的有效信息散落在專業(yè)網(wǎng)站與各色細(xì)分App中,其內(nèi)容含金量相對(duì)高,時(shí)效性強(qiáng),無用信息少,是web時(shí)代那些先天不足的網(wǎng)頁無法比擬的。如果說搜索引擎是一個(gè)巨大的雜貨市場,站內(nèi)搜索就像一個(gè)簡潔的購物中心,可它的體驗(yàn)…… 文獻(xiàn)庫搜索曾是許多人的心病,關(guān)鍵詞太少搜出1000多篇論文,輸入太精準(zhǔn),卻提示“沒有更多的搜索結(jié)果”。 旅行時(shí),聽到了街頭藝人唱過一首歌,只依稀記得旋律,回來后絞盡腦汁想出了歌詞的近義詞——毫無疑問沒搜到。 好不容易問出小姐姐社交軟件ID,搜了發(fā)現(xiàn)有60多個(gè)重名。 需要的PPT模板在素材網(wǎng)怎么也找不到;視頻網(wǎng)站搜個(gè)冷門資源,搜索反饋要等上半天結(jié)果往往還是“404”。 找用戶,搜話題,找帖子,求推薦……在移動(dòng)互聯(lián)的大背景下,搜索無處不在。作為信息的入口,用戶唯一要求的是:在APP的內(nèi)容較多,無法完成全部展現(xiàn)時(shí),又快又準(zhǔn)找到想看的內(nèi)容。 簡單直接的訴求無法實(shí)現(xiàn),APP內(nèi)搜索難用,根本問題有3點(diǎn): 1. 響應(yīng)時(shí)間 基于MySQL數(shù)據(jù)庫進(jìn)行搜索,文檔數(shù)僅僅上萬條時(shí),若沒有索引,關(guān)鍵詞查詢就比較吃力了。如果一旦到企業(yè)級(jí)的數(shù)據(jù),響應(yīng)速度就會(huì)更加不可接受。 2. 分詞 傳統(tǒng)數(shù)據(jù)庫并不支持分詞。例如,在做中文搜索時(shí),當(dāng)搜索框輸入“四川火鍋”時(shí),數(shù)據(jù)庫通常只能把這四個(gè)字進(jìn)行全部匹配。可是在文本中,可能會(huì)出現(xiàn)“推薦四川好吃的火鍋”,這時(shí)就會(huì)無結(jié)果顯示。 3. 相關(guān)性 在用數(shù)據(jù)庫做搜索時(shí),結(jié)果經(jīng)常會(huì)出現(xiàn)一系列文檔??墒堑降资裁次臋n是用戶真正想要的呢?怎么才能把用戶想看的文檔放在搜索列表最前面呢? 這些問題,基于Elasticsearch的華為云搜索服務(wù)可以解決。 1.l Elasticsearch基于倒排索引,搜索時(shí)不用再遍歷整張表了,如當(dāng)搜索“手機(jī)”時(shí),Elasticsearch會(huì)立即返回文檔F,G,H。這樣就不用花多余的時(shí)間在其他文檔上,因此檢索速度得到了數(shù)量級(jí)的提升 2.l Elasticsearch支持中文分詞插件,直接解決了分詞搜索問題。例如當(dāng)輸入“四川火鍋”時(shí),Elasticsearch會(huì)自動(dòng)做下面兩件事:將“四川火鍋”分詞成“四川”和“火鍋”,而后查找包含這兩個(gè)詞的文檔 3.l Elasticsearch支持相關(guān)性評(píng)分。通過合理的優(yōu)化,云搜索服務(wù)能夠返回精準(zhǔn)的結(jié)果,滿足用戶的需求。返回結(jié)果會(huì)根據(jù)分?jǐn)?shù)由高到低排列。分?jǐn)?shù)越高,意味著和查詢語句越相關(guān)。例如,當(dāng)搜索“星巴克咖啡”,帶有“星巴克咖啡”的信息就要比只包含“咖啡”的信息靠前。 除此之外,云搜索服務(wù)由華為專業(yè)團(tuán)隊(duì)貼身運(yùn)維,最短時(shí)間搭建搜索功能模塊。企業(yè)使用按需付費(fèi),費(fèi)用低至 ¥0.59/小時(shí)起,包年包月最高可省51%,切實(shí)的優(yōu)質(zhì)低價(jià)! |
|