2009-09-01から1ヶ月間の記事一覧

CJKTokenizerFactory と NGramTokenizerFactory の動作の違い

祝 Lucene2.9.0 リリース!! 2009/9/25 に Lucene2.9 がようやく正式リリースされました。 便乗して久しぶりの Solr ネタです。 この記事は Lucene2.9.0 がバンドルされている 2009/09/28版の Solr をもとに書いています。 http://people.apache.org/builds/l…

Amazon Web Service の認証方法が変わったので対応してみた

2009年の8月15日からAmazon Web Service のアクセス方法が変わりました。 具体的には秘密鍵を使った電子認証が追加された感じになってます。 Amazon から何度かメールで案内がきていたのですが 時間がなくってこの1ヶ月あまり放置していました。 今日は5連休…

テーブルのディスクサイズを調べる方法

mysql> show table status from データベース名; Data_lengthがテーブルで使用しているディスクのサイズです。 単位はバイト ではでは

Excel から CSV に変換したデータを CSVLoader を使って Solr に入れたいのだけれど、データがないカラムのカンマが省略されちゃっててエラーになる場合の対処法

Solr に入れるデータが数万件程度の場合には Excel でデータが用意されることもあると思います。 この場合には Excel から CSV に吐き出して CSVLoader でインポートするのが便利でラクチンです。 ところが Excel は行の最後のカラムに値が入ってなかったり…

vi ( vim ) で対応する括弧/カッコに勝手にカーソルが移動するのがウザイ時の対処法

環境によってなんですが vi で編集中に カーソルが 括弧の上に重なると 対応する括弧の上にもカーソルが表示されることがあります。 ボクはこれがウザイのです。そんなときは $HOME/.vimrc に以下を追加するとおとなしくなります。 let loaded_matchparen = 1…

mecab-java のテストプログラムを実行したら JVM が落ちてしまうときに試してみる価値のあること

mecab-java は MeCab を JAVA から使うためのバインディングで SWIG を使って作られています。で、その mecab-java を make して make test してみたのですが JVM ごと落ちてしまいます。 % make test env LD_LIBRARY_PATH=. java test 0.97 太郎は 名詞,一…

Red Hat Network ( RHN ) に登録して yum で update できるようにしてみた

今日の環境 Red Hat Enterprise Linux Desktop (v. 5 for 64-bit x86_64) RHEL5 Red Hat Network ( RHN ) 理由はよくわからないのですが、JVM が落ちる現象が多発するようになりました。 # # An unexpected error has been detected by Java Runtime Environ…