Wikipedia のテキストデータを使ってベンチマークをする! その6 Solr は MySQL より 200倍速い!


JMeter を使って負荷試験をしてみました。

やってみたこと

  • Wikipedia のページタイトルから検索ワードを選定
    • 選定ルール
      • ページタイトルから記号を含まないものだけを抽出。記号は検索式で様々な意味を持つのでそれを含まないものを選ぶ。
      • それらをユニークにする。ページタイトルはユニークではないので。
  • 8スレッド×100ループの800クエリを実行して結果を評価する。
    • 8スレッドにしたのは Solr や MySQL を動作させるサーバ側のPCがクアッドコア × 2CPU の 8 コアのため。
      • top コマンドで見る限りは MySQL は大体700%前後のCPU使用率。Solr の場合は 800% に近い CPU 使用率。
      • Solr、MySQLともにIOウェイトはほとんど発生していなかったので、CPU性能がボトルネックとなるタイプの検索であることがわかる
    • 100ループにしたのは、ホントはもっとループさせたかったのだけれど100回でもMySQLの時効時間が9時間ぐらいかかったため。