2009-01-01から1年間の記事一覧

Caused by: java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Date の対応方法

zeroDateTimeBehavior=convertToNull を付ける。 JDBCドライバの中で'0000-00-00'がNULLに置換される。 <dataSource driver="org.gjt.mm.mysql.Driver" url="jdbc:mysql://localhost/hoge?zeroDateTimeBehavior=convertToNull" user="hoge" password="hoge!" useUnicode="true" characterEncoding="UTF-8" /></datasource>

DELETE 文で 複数の表の参照結果を使ってレコードを削除するひとつの方法

DELETE TableA FROM TableA, TableB WHERE TableA.code=TableB.code AND TableA.type=TableBtype

検索結果をランダム random に並べる Solr1.4 RandomSortField

Solr の検索結果はスコア順にソートされるのがデフォルトですが、時にはその順位をランダムに並べ替えたいこともあると思います。 ランダムに並べ替えるには RandomSortField を使います。必要なのは schema.xml に下記の記述を追記するだけす。 既にインデ…

再現率を上げる - 取りこぼしを減らす技術について

大手SIから「検索ヒット率」が低くて困っていると言われたので 再現率を上げればよいのかと資料作って行ってみたら 実は上げたいのは精度の方だったという笑えない話で 作った資料がボツになったのでここに上げときます。 検索エンジンで取りこぼしを減らす(…

Redhat に ffmpeg をインストールしたときのメモ

ffmpeg インストールメモ コーデック関係ライブラリ のインストール # H.264エンコード用ライブラリ(x264) 映像用 x264-snapshot-20091112-2245.tar.bz2 % wget http://www.tortall.net/projects/yasm/releases/yasm-1.2.0.tar.gz % bzip2 -dc ./x264-snaps…

1.4 Enterprise Search Server 買いました

Solr 本家で 「 Solr's first book is published! 」 と紹介されていた 「Solr 1.4 Enterprise Search Server」が日本国内でもデリバリーされています。 内容は、Solrの入門書といった感じで初心者でも分かりやすいように工夫されて書かれており Solr のいろ…

schema.xml sortMissingLast とか sortMissingFirst って何? って質問されたので答えをメモ

schema.xml の データタイプの定義にオプションとして指定できる sortMissingLast と sortMissingFirst ですが これはソート対象となるフィールドに値が入っていないドキュメントを、ソート結果の最後に出すのか、最初に出すのかの指定です。 sortMissingLas…

schema.xml 数値型データタイプの前についてる t, s, p って何? て質問されたので、その答えをメモ

デフォルトで用意されている Solr の数値型データタイプには、基本形として int, float, long, double の4種類があります。 さらにそれぞれに最初に t, p , s が追加された、tint, pint, sint 等のバリエーションがあります。 schema.xmlのサンプルより抜粋 …

The High Availability Linux プロジェクト の Heartbeat を使って CentOS 4.7 64bit をHA構成化するまでのメモ

とりあえずインストールしたRPM libnet-1.1.2.1-2.rf.x86_64.rpm PyXML-0.8.3-6.x86_64.rpm gnutls-1.0.20-4.el4_6.x86_64.rpm heartbeat-2.1.3-3.el4.centos.x86_64.rpm heartbeat-gui-2.1.3-3.el4.centos.x86_64.rpm heartbeat-pils-2.1.3-3.el4.centos.x8…

UPDATE 文 で 自己相関型サブクエリを使う ひとつの方法

MySQL のマニュアルに下記の記述があります 「サブクエリは SELECT ステートメントと同じく、UPDATE ステートメントや DELETE ステートメントでも正式に使用できるので、UPDATE ステートメント内の割り当てにサブクエリを使用しても問題ありません。 しかし…

まずは ids (tableId) を取得する

Google Data Python Library を用いた Google Analytics のデータの取得についてのメモです。 Google Data Python Library は以下からダウンロードできます。 http://code.google.com/p/gdata-python-client/downloads/list Google Analytics のデータを取得…

画像を読み込ませるべきか

Web サイトのパフォーマンステストをする場合 HTML中の画像の読み込みも含めて レスポンスタイムを計りたいというニーズがあると思います。 実際にブラウザに表示されるまでの時間を計りたいということですね。 JMeter はデフォルトでは画像ファイルを読み込…

定数スループットタイマ の使い方

JMeter はデフォルトでは「ループ回数」で指定された回数分の処理を 各スレッドが休みなく働くことで できるだけはやく終わらせようとします。 単位時間あたりのリクエスト回数や リクエスト間隔などを指定したい場合には タイマを使います。 ボクが主に使う…

Ramp-up 期間 (秒) の意味

「スレッドグループ」の「Ramp-up 期間(秒)」は「スレッド数」で 指定した数のスレッドが生成されるまでの時間を指定します。 スレッド数:10 で Ramp-up 期間(秒):1 なら 0.1秒おきにスレッドが生成されます。 そして、生成されたスレッドは「ループ回数」で…

動的に パス( URL ) や パラメータの値を変えたといとき

久しぶりに JMeter を使っての負荷試験をしました。 イロイロ忘れていたのでメモです。 GET の URL をファイルから読み込んだ値で変化させる場合には 「HTTP リクエスト」の「パス」に以下のように指定します。 パス: /${__StringFromFile(C:\JMeter\categor…

CJKTokenizerFactory と NGramTokenizerFactory の動作の違い

祝 Lucene2.9.0 リリース!! 2009/9/25 に Lucene2.9 がようやく正式リリースされました。 便乗して久しぶりの Solr ネタです。 この記事は Lucene2.9.0 がバンドルされている 2009/09/28版の Solr をもとに書いています。 http://people.apache.org/builds/l…

Amazon Web Service の認証方法が変わったので対応してみた

2009年の8月15日からAmazon Web Service のアクセス方法が変わりました。 具体的には秘密鍵を使った電子認証が追加された感じになってます。 Amazon から何度かメールで案内がきていたのですが 時間がなくってこの1ヶ月あまり放置していました。 今日は5連休…

テーブルのディスクサイズを調べる方法

mysql> show table status from データベース名; Data_lengthがテーブルで使用しているディスクのサイズです。 単位はバイト ではでは

Excel から CSV に変換したデータを CSVLoader を使って Solr に入れたいのだけれど、データがないカラムのカンマが省略されちゃっててエラーになる場合の対処法

Solr に入れるデータが数万件程度の場合には Excel でデータが用意されることもあると思います。 この場合には Excel から CSV に吐き出して CSVLoader でインポートするのが便利でラクチンです。 ところが Excel は行の最後のカラムに値が入ってなかったり…

vi ( vim ) で対応する括弧/カッコに勝手にカーソルが移動するのがウザイ時の対処法

環境によってなんですが vi で編集中に カーソルが 括弧の上に重なると 対応する括弧の上にもカーソルが表示されることがあります。 ボクはこれがウザイのです。そんなときは $HOME/.vimrc に以下を追加するとおとなしくなります。 let loaded_matchparen = 1…

mecab-java のテストプログラムを実行したら JVM が落ちてしまうときに試してみる価値のあること

mecab-java は MeCab を JAVA から使うためのバインディングで SWIG を使って作られています。で、その mecab-java を make して make test してみたのですが JVM ごと落ちてしまいます。 % make test env LD_LIBRARY_PATH=. java test 0.97 太郎は 名詞,一…

Red Hat Network ( RHN ) に登録して yum で update できるようにしてみた

今日の環境 Red Hat Enterprise Linux Desktop (v. 5 for 64-bit x86_64) RHEL5 Red Hat Network ( RHN ) 理由はよくわからないのですが、JVM が落ちる現象が多発するようになりました。 # # An unexpected error has been detected by Java Runtime Environ…

Redhat Linux で サンバマウントしようとして smbmount: command not found といわれたときに試してみる価値のあること

# smbmount //192.168.11.9/disk1 /mnt/smb -o lfs bash: smbmount: command not found # mount -t cifs //192.168.11.9/disk1 /mnt/smb -o lfs ↑ おk # LANDISKをマウントしたときの例 # mount -t cifs //192.168.11.30/disk /mnt/smb -o lfs,uid=hoge,gid=…

mail コマンドでメールを送信するときに送信者アドレスに任意のアドレスを指定する方法

mail コマンドでメールを送信するときに 送信者アドレスに任意のアドレスを指定する方法です。 ボクはバッチ処理を記述したシェルスクリプトの中で エラーが起きたときにメールを送信するというのをよくやるのですが そういうときに使ったりします。 SUBJECT…

キャッシュを表示したときの文字化けを直してくれた人がいた!

Nutchの検索結果ページから (cached) をクリックすると ローカルディスクにキャッシュされたHTMLを表示させることができるのですが こいつがちょくちょく文字化けします。 UTF-8で記述されたページだけが正しく表示され このはてなダイアリーを含めeuc-jp等…

ATOK Microsoft Office 2003 SP3を導入すると、入力した文字が見えなくなったり、黒く反転して表示される

表題の現象が起きたら↓のページを参考に マイクロソフトのパッチをダウンロードして当てると直ります。 Microsoft Office 2003 SP3を導入すると、入力した文字が見えなくなったり、黒く反転して表示される Office 2003 修正プログラム パッケージの説明: 200…

任意のディレクトリから Tomcat を起動できるようになる方法

通常 Nutch のクロール結果を検索する場合には Tomcat 等のサーブレットコンテナを使うのですが、デフォルトの設定では Tomcat を Nutch のインストールディレクトリで起動しなくてはなりません。 これは Nutch のクロール結果が Tomcatを起動したディレクト…

Python のインストール - Linux で root 権限なしでも最新の Python をインストールする1つのやりかた

Pythonはroot権限がなくっても書き込み権限のある任意のディレクトリにインストールして、2つの環境変数をセットすることで使うことができるようになります。 セットする環境変数はこの2つです。 PYTHON_HOME PATH この方法を使えば複数のバージョンの Pytho…

お台場の潮風公園で実寸大のガンダムをみてきた

お台場の潮風公園で実寸大のガンダムをみてきました。 最初ガンダムがどこにいるのかわからなかったのですが バーベキュー場の横の広場にいました。 バーベキュー場からいい匂いが漂ってきています。 あと、ヨッパライも多いです... ガンダムは想像していた…

Wii スポーツ リゾート (Wii Sports Resort ) で遊んでみた。

Wii スポーツ リゾート (Wii Sports Resort ) で遊んでみました。 Wii モーションプラスのおかげでセンサー精度はかなりあがっていますね。Wii Sports にもあったゴルフやピンポンだとその差がはっきりと体感できます。 ゴルフは、ホントにゴルフっぽいスイ…