本報記者 顧建兵 上海報道
蟄伏了近5年之后,陳輝民,這位西祠胡同的創(chuàng)始人再次踏入了互聯(lián)網(wǎng)。
陳現(xiàn)在的職務(wù)是南京爬狗信息技術(shù)有限公司CEO,11月20日,經(jīng)過兩個月的測試后,他花費3年時間打造的爬狗網(wǎng)正式推出。
“跟Google等搜索引擎不同,我們的搜索信息是表格化的。”11月30日,陳輝民對記者表示,爬狗網(wǎng)是專門用來搜索分類信息的垂直搜索引擎,希望能結(jié)合全球最大的搜索引擎Google和全球最大分類廣告網(wǎng)站Craigslist兩者的優(yōu)勢。
然而,這個市場正在迅速升溫,爬狗網(wǎng)剛一誕生就面對著無比強大的對手。Google和微軟陸續(xù)宣布進入網(wǎng)絡(luò)分類廣告搜索市場。
11月16日,Google推出了醞釀已久的Google Base,用戶可以在站點上提交各種在線或離線分類廣告信息及圖片,每一條信息獲得唯一的標簽,以便和他人共享各種分類信息。目前Google Base還在測試階段,中文信息還不是很多。
微軟也正在開發(fā)網(wǎng)絡(luò)分類廣告市場,并計劃在接下來的幾周內(nèi)正式推出 “Fremont”服務(wù),用戶在上面可以賣、買或交換物品,并展示相關(guān)的信息,運營開支由搜索結(jié)果旁邊的廣告支持。
此外,美國一家本地分類廣告搜索創(chuàng)業(yè)公司Oodle已經(jīng)可以搜索到400萬個分類廣告。
垂直搜索機會
“垂直搜索引擎會是趨勢?!标愝x民對記者說,Google、雅虎已經(jīng)占領(lǐng)了通用型搜索引擎市場,這時候能夠做的就是垂直的搜索引擎。在美國,博客搜索引擎Technorati目前已能搜索到2060萬個博客;購物搜索引擎Shopzilla能夠搜索到來自6萬多個商家的近3000萬件商品;而雅虎旗下的HotJobs則是專業(yè)化的求職搜索引擎。
陳輝民坦言,他之所以選擇分類廣告搜索,是因為看到了Craigslist在美國的驚人火爆。相關(guān)調(diào)查顯示,在美國的很多大中城市,分類廣告都是報紙第一大財源,而Craigslist使舊金山灣區(qū)的報紙每年損失近6500萬美元的招聘和求職廣告收入,以及數(shù)百萬美元的商品和房地產(chǎn)廣告收入。而在我國的北京、上海等大中城市,分類廣告收入也占據(jù)著都市類報紙收入的很大份額。
2005年,eBay投資的分類廣告網(wǎng)站客集齊在國內(nèi)推出,在此前后國內(nèi)涌現(xiàn)出唯客網(wǎng)、分類哥哥等數(shù)十家分類廣告網(wǎng)站?!胺诸悘V告會逐步從報紙向網(wǎng)絡(luò)轉(zhuǎn)移?!奔蛹瘓F股份有限公司副總裁胡志東告訴記者,胡目前負責管理激動集團投資的唯客網(wǎng)。
“爬狗要做的就是讓用戶輕松的搜索到這些網(wǎng)絡(luò)分類廣告信息?!标愝x民認為,就像當初美國西部的淘金熱,“去分類廣告業(yè)淘金的人太多了,我要做的就像是給淘金的人賣水。”
“我是有互聯(lián)網(wǎng)情結(jié)的。”陳輝民說,1998年,22歲的陳同劉琥等三位伙伴在南京創(chuàng)辦了后來人氣頗旺的BBS社區(qū)——西祠胡同。
雖然西祠胡同當時相當火爆,但是并沒有能夠帶來什么收入,這段時間,陳輝民等人只好依靠銷售網(wǎng)吧計費軟件來補貼網(wǎng)站,“當時比較迷茫,看不到前途”,陳回憶說。
1999年,陳輝民決定離開西祠胡同轉(zhuǎn)而投向?qū)?a >業(yè)界,“我得去學會做‘真正’的生意”。一年多以后,西祠胡同以100萬元現(xiàn)金加100萬元股票的價格被E龍收購。同年,他把自己炒股賺來的60萬元全部投入了一家珠寶公司,此后,在滾動發(fā)展中又介入了房地產(chǎn)和化學纖維領(lǐng)域。
2002年,陳輝民找了五六個技術(shù)高手開始了搜索引擎的研發(fā),“當時感覺到國內(nèi)的所謂門戶,如新浪、搜狐只是大的ICP,他們將所有的用戶指向自己的內(nèi)容,而搜索引擎才是整個互聯(lián)網(wǎng)的門戶”,他認為未來搜索引擎必將取代門戶的地位。
憑著多年的炒股經(jīng)驗,陳輝民感覺,互聯(lián)網(wǎng)在經(jīng)歷了第一輪泡沫破裂之后,必然還會有一波復(fù)興的行情,這時進入互聯(lián)網(wǎng)業(yè)界并不算晚??恐趥鹘y(tǒng)產(chǎn)業(yè)的贏利,他在此后不斷加大搜索引擎研究的投入,R20;大概投了300多萬進去”。
但是在當時,陳輝民自己也并不知道要研發(fā)的搜索引擎最終到底會是什么樣子,“只是探索性質(zhì)的研究”。
現(xiàn)在,爬狗網(wǎng)的研發(fā)人員已經(jīng)擴充到了40多個,“明年研發(fā)隊伍要擴大一倍?!标愝x民說。
格式化表現(xiàn)
“爬狗的信息都是表格化輸出的。”陳輝民對記者說,這是爬狗跟Google最大的不同之處。
第一代的搜索引擎,如早期的雅虎,所使用的搜尋方法是:網(wǎng)頁建構(gòu)人將自己的網(wǎng)站加入搜索引擎的資料庫中,自行命名網(wǎng)站,并用幾行文字描述該網(wǎng)站;在使用者鍵入搜索關(guān)鍵詞后,搜索引擎會找出和搜索條件一樣或相近的網(wǎng)站名字或描述。不過,第一代的搜索引擎最大的缺點就是無法針對網(wǎng)頁內(nèi)容進行搜索。
以Google為代表的第二代搜索引擎就不需要輸入任何資料,而是由搜索引擎使用一個“Googlebot”的Spider(蜘蛛)程序,也就是俗稱的“爬蟲”,讓這個“爬蟲”在網(wǎng)絡(luò)上自動抓取資料,并自動將取得的結(jié)果存入資料庫中。
不過另外一個困惑也隨之產(chǎn)生,Google的搜索引擎為網(wǎng)頁搜索引擎,也就是說,使用者輸入想要的關(guān)鍵詞,Google會輸出一堆網(wǎng)站鏈接,使用者再去鏈接到這些相關(guān)網(wǎng)站進一步尋找信息,這種方式一直延續(xù)到現(xiàn)在,這種搜索方式的麻煩之處在于搜索出的結(jié)果實在太多,查找起來很麻煩。
“我們的爬蟲程序可以讀完網(wǎng)頁的全文,將使用者所需要的信息點從目標網(wǎng)站中提煉出來。”陳輝民告訴記者,爬狗由于應(yīng)用了自有知識產(chǎn)權(quán)的格式化搜索技術(shù),能把有用的信息直接從多個目標網(wǎng)站中提取出來,用表格化的形式提供給用戶,用戶在爬狗上輸入想要的關(guān)鍵字,爬狗會輸出一個鏈接,同時會輸出一個表格,包含了用戶想要的信息的各個方面。
實際上,由于爬狗已經(jīng)幫助用戶搜集整理了尋找到的信息列表,用戶就不需要花費大量時間和精力在多個網(wǎng)站上去尋找,只要看表格的內(nèi)容就可以知道是不是自己所需要的信息。
比如用戶想要找一套房子,通常情況需要通過搜索引擎搜索到多個房產(chǎn)類網(wǎng)站,然后到每一個網(wǎng)站上去尋找合適的房子。而爬狗具有搜索比較功能,能夠按照房型、面積、樓層、區(qū)位、價格等要素把符合要求的房子全部列舉出來,方便了用戶從中選擇最合適的房子。
在陳輝民看來,爬狗網(wǎng)的格式化表現(xiàn)形式是能夠同其他搜索引擎競爭的最大優(yōu)勢。
誰在拒絕爬狗?
“爬狗預(yù)計2007年上半年可以實現(xiàn)贏利,現(xiàn)在已經(jīng)有廣告收入進賬了?!标愝x民對記者說,其中南京一家房產(chǎn)中介公司德奧置業(yè)以30萬元購買了爬狗網(wǎng)南京房地產(chǎn)搜索頻道一年的廣告位,“明年估計廣告收入可以達到千萬元”。
“從明年1月份開始,爬狗將在全國招募廣告代理商?!标愝x民透露,現(xiàn)在爬狗的渠道管理團隊基本上已經(jīng)組建完畢,預(yù)計到2006年9月,爬狗將在全國發(fā)展300家廣告代理商。
同其他搜索引擎不同,由于爬狗的信息采用格式化輸出,用戶所要的基本信息在輸出的時候已經(jīng)被提了出來,“被提煉出來的信息表格通過手機屏幕就可以方便閱讀”,陳輝民認為,這是做無線爬狗的機會,在國內(nèi),手機用戶目前已經(jīng)達到了3.5億,而網(wǎng)民數(shù)量也不過1.1億,如果能把爬狗網(wǎng)的無線版做成功,其用戶數(shù)量基礎(chǔ)可以擴大3倍多。
在陳輝民看來,用戶搜索分類廣告時需要的信息其實很簡單,只要一些關(guān)鍵的信息就可以了,而手機就適合看這種比較短小的信息。
不過,隨著在線分類廣告市場的競爭加劇,在線分類廣告網(wǎng)站是否會乖乖地和搜索合作呢?在國外,Craigslist于今年10月份拒絕了Oodle對它的信息進行搜索,同樣的情形會不會出現(xiàn)在爬狗網(wǎng)身上?
陳輝民表示自己并不擔心,他認為爬狗網(wǎng)的信息收錄能給信息來源的在線分類廣告網(wǎng)站帶來流量,另外,與Craigslist擁有龐大的分類信息量不同,中國還沒有哪一家在線分類廣告網(wǎng)站的信息超過整體信息的5%,“所以就算有一兩家拒絕被收錄,也不影響爬狗網(wǎng)的效果”。
(責任編輯:romp) |