spacy を使って固有表現抽出をしてみる

文章から「人名」「場所」「組織名」などを分類したいと思っていたんですが、やっぱり python にはいい感じのライブラリがあったようなので使ってみました。

参考

インストール

pip install spacy ginza ja-ginza

コード

import spacy
nlp = spacy.load('ja_ginza')
doc = nlp("学校の帰りに佐藤雄二さんと鈴木裕也さんと渋谷で夕食を食べました。")
# 固有表現抽出
for ent in doc.ents:
    print(f"{ent.text}: {ent.label_}")

結果

結果は下記の通りです。

佐藤雄二: Person
さん: Title_Other
鈴木裕也: Person
さん: Title_Other
渋谷: City
夕食: Time

感想

ライブラリありがとうございます。