GinZA インストール メモ

AWS の EC2 の場合はインスタンスタイプを medium (4GB) 以上で実行する
こちらも NEologd 同様 small (2GB) だとメモリ不足でエラーになった

$ pip install "https://github.com/megagonlabs/ginza/releases/download/latest/ginza-latest.tar.gz"
$ ginza
mode is C
disabling sentence separator
左派ポピュリズム
# text = 左派ポピュリズム
1       左派    左派    NOUN    名詞-普通名詞-一般      _       2       compound        _       BunsetuBILabel=B|BunsetuPositionType=CONT|SpaceAfter=No|NP_B
2       ポピュリズム    ポピュリスム    NOUN    名詞-普通名詞-一般      _       0       root    _       BunsetuBILabel=I|BunsetuPositionType=ROOT|SpaceAfter=No|NP_I


まだ 「左派ポピュリズム」は登録されてないみたい。NEologd にはあったけど
あと、Pythonだから仕方がないのかもしれないけど、処理が遅い...
MeCab では 7秒で 終わった処理に23分かかった。大量の文章を処理するときには厳しいかな