2011-07-01から1ヶ月間の記事一覧

を使った Solr インデックスからの単語の抽出

#! /usr/local/jython2.5.1/jython # -*- coding: utf-8 -*- from org.apache.lucene.store import FSDirectory from org.apache.lucene.index import IndexReader from org.apache.lucene.index import Term from org.apache.lucene.index import TermEnum …

連続した数字を1つのトークンにする

Mecab で連続した数字をトークナイズするとだいたい1文字ずつトークナイズされます。連接コストの計算結果で決まるので100%の確率ではありませんが。 $ mecab bmw318 bmw 名詞,固有名詞,組織,*,*,*,* 3 名詞,数,*,*,*,*,3,サン,サン,, 1 名詞,数,*,*,*,*,1,…

Jython から MySQL を使う方法

Jython プログラム mytest.jy #! /usr/local/jython2.5.1/jython # -*- coding: utf-8 -*- import com.ziclix.python.sql as sql if __name__ == "__main__": db = sql.zxJDBC.connect( "jdbc:mysql://localhost/データベース名", "ユーザ名", "パスワード",…

can't write index file の対処法

こんなエラーメッセージがでたときは *sys-package-mgr*: can't write cache file for 'hoge/lib/mysql-connector-java-5.0.8-bin.jar' *sys-package-mgr*: can't write index fileJython の cachedir 以下のパーミッションを 誰でも読み書きできる 777 に変…