さくらインターネットにインストールした Chasen を Python から使います。
ポイント
- python_chasen-0.2を使います。
- python_chasen-0.2 は 文字コードが EUC であることが前提になっているので、UTF-8 で使うためにソースを一部修正します。
- Chasen のライブラリやヘッダファイルの位置が標準とはことなるので、setup.py にオプションを指定します。
% wget http://www.domen.cx/yusei/pub/python_chasen-0.2.tar.gz % tar xvfz python_chasen-0.2.tar.gz % cd python_chasen # ChaSen の文字コードを UTF-8 にするように変更 % vi python_chasen/chasen.c /* char *opt[2] = {"chasen", NULL}; */ char *opt[] = {"chasen", "-i", "w", NULL}; % python setup.py build_ext --include-dirs=/home/small-world/local/include --library-dirs=/home/small-world/local/lib/ % python setup.py install
ではでは