Distributed Search 複数の Sol rから同時に検索することで パフォーマンスを上げる方法

Solr1.5 は クラウドの方に力を入れるらしいのですが
http://wiki.apache.org/solr/SolrCloud


複数の Solr から同時に検索する Distributed Search の機能は Solr1.3 のころから備わっています。

使い方はとっても簡単で、検索時に shards というパラメータを使って 実際に検索を行う Solr を指定するだけです。
下の例では、

  • クエリのリクエストを受け付けるのが ホスト 192.168.11.252で実際に Solr のインデックスを検索するのは 192.168.11.131 〜 133 の3台です。
  • 3つのSolrのインデックスのスキーマは全く同じです。あるフィールドの値によってドキュメントが重複しないように分割されています。
  • 正確には3つの Solr では idf の値は異なるのですが、それは気にしないことになっています...
  • 検索結果はホスト 192.168.11.252 で一つにまとめられます。
http://192.168.11.252:8080/solr/select?q=BODY%3Aipod&
shards=192.168.11.131:8080/solr,192.168.11.132:8080/solr,192.168.11.133:8080/solr&
fl=*%2Cscore&debugQuery=on

参考ページ
http://wiki.apache.org/solr/DistributedSearch
「Solr 1.4 Enterprise Search Server 」(Scaling Solr - Sharding indexes )295〜298ページ