[Python] jieba: 簡單教學




結巴實在是太簡單太好用了,官網上面的使用說明寫得很清楚,所以這裡只摘錄一些簡單的東西。

  • 安裝:

  • 斷詞:

使用 jieba.cut(),直接看例子:

結果:

  • 繁體字典:

字典位置:https://github.com/fxsjy/jieba/raw/master/extra_dict/dict.txt.big

使用方式:(就多了一行 set_dictionary)

  • 自定義字典:

自定義字典的詞性縮寫可以參考這裡:https://github.com/rudaoshi/ICTCLASTokenizer/blob/master/src/ictclas/part-of-speech.txt

範例程式碼:

  • 關鍵詞提取:

資料來源:




Be the first to comment

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.