周末了,大段長篇技術(shù)文不發(fā)了,知道沒人愿意看,但是學(xué)習(xí)不能落下,畢竟我的心里只有學(xué)習(xí) 這里分享一個自然語言處理中對中文分詞支持比較好的結(jié)巴分詞庫,屬于NLP中的重量級分詞庫,我們通過下面有趣的解繞口令來學(xué)習(xí)這個庫能的基本用法 本文如題所說,用python來解繞口令,先來五組繞口令,自己試驗下,看大概怎么斷句,有沒有暈了 下面看用python來解繞口令,用到j(luò)ieba庫和pandas庫 jieba庫用來切詞,jieba.cut方法 join方法將列表中逗號替換成空格,并轉(zhuǎn)成字符串 pandas轉(zhuǎn)成dataframe二維數(shù)據(jù)結(jié)構(gòu),直觀看數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)處理分析 為了整齊些,把列表類型轉(zhuǎn)換成Dataframe二維數(shù)據(jù)類型,更直觀 整體看下來,結(jié)果除了過過和用毒毒兩個地方有誤,其他都被完美解開,是不是很棒,有興趣動手試試吧! |
|