Wikipedia のテキストデータを使ってベンチマークをする! その6 Solr は MySQL より 200倍速い！ - Solr, Python, MacBook Air in Shinagawa Seaside

JMeter を使って負荷試験をしてみました。

Wikipedia のページタイトルから検索ワードを選定
- 選定ルール
  - ページタイトルから記号を含まないものだけを抽出。記号は検索式で様々な意味を持つのでそれを含まないものを選ぶ。
  - それらをユニークにする。ページタイトルはユニークではないので。
8スレッド×100ループの800クエリを実行して結果を評価する。
- 8スレッドにしたのは Solr や MySQL を動作させるサーバ側のPCがクアッドコア × 2CPU の 8 コアのため。
  - top コマンドで見る限りは MySQL は大体700%前後のCPU使用率。Solr の場合は 800% に近い CPU 使用率。
  - Solr、MySQLともにIOウェイトはほとんど発生していなかったので、CPU性能がボトルネックとなるタイプの検索であることがわかる
- 100ループにしたのは、ホントはもっとループさせたかったのだけれど100回でもMySQLの時効時間が9時間ぐらいかかったため。