Python chasen を utf-8 で使う。

さくらインターネットにインストールした ChasenPython から使います。


ポイント

  • python_chasen-0.2を使います。
  • python_chasen-0.2 は 文字コードEUC であることが前提になっているので、UTF-8 で使うためにソースを一部修正します。
  • Chasen のライブラリやヘッダファイルの位置が標準とはことなるので、setup.py にオプションを指定します。
% wget http://www.domen.cx/yusei/pub/python_chasen-0.2.tar.gz
% tar xvfz python_chasen-0.2.tar.gz
% cd python_chasen

# ChaSen文字コードUTF-8 にするように変更
% vi python_chasen/chasen.c
/* char *opt[2] = {"chasen", NULL}; */
char *opt[] = {"chasen", "-i", "w", NULL};

% python setup.py build_ext --include-dirs=/home/small-world/local/include --library-dirs=/home/small-world/local/lib/
% python setup.py install


ではでは


参考URL
http://www.google.com/gwt/n?source=pagecreator&u=http%3A%2F%2Fwww.naik-online.com-a.googlepages.com%2Fpythonchasenutf-8