情報処理技術者試験ネットワークスペシャリスト一発合格!!

2010年10月に受けた情報処理技術者試験ネットワークスペシャリストに合格しました。成績は以下でした。午前I : 免除午前II : 72点午後I : 65点午後II : 69点ギリギリ... でもこれで 2010年4月に受けた情報セキュリティスペシャリストと合わせて …

2010-11-18

オープンソース日本語フォント IPA フォントのインストール

CentOS

http://ossipedia.ipa.go.jp/ipafont/index.html からフォントをダウンロード以下は「IPAゴシック/IPA Gothic(Sans serif) ipag00302.zip(4.09 MB)」の例 $ mkdir ~/.fonts $ cp ipag00302.zip ~/.fonts $ cd ~/.fonts $ unzip ipag00302.zip $ fc-cache -f…

2010-11-18

matplotlib で日本語を使えるようにしてみた!

Python Linux

著作権がきちんと整理されているオープンソースの IPA フォントを使うのがオススメですが、OS にバンドルされている適当な日本語フォントがあればそれを使って表示させることもできます。後者の場合は配布時に注意した方がいいです。 IPA フォントのインスト…

2010-11-18

CGI の実行でライブラリの参照ができなくって Internal Server Error が出たときの対応

Apache

httpd.conf に LD_LIBRARY_PATH を追記して再起動する。 Listen 80 SetEnv LD_LIBRARY_PATH .:/usr/lib:/usr/local/lib:/usr/local/mysql/lib:/usr/local/mysql/lib/mysql

2010-11-17

matplotlib で時系列のグラフを書いてみた!

Python Linux

matplotlib で書くすごーく簡単な時系列グラフのサンプル #!/usr/bin/env python # -*- coding: utf-8 -*- import datetime import matplotlib.pyplot as plt import matplotlib.dates as mdates # X軸データ x = [datetime.datetime(2010,1,1), datetime.da…

2010-11-04

日付のハンドリングに便利な datetime型と文字列の相互変換

Python

datetimeには文字列から日付や時刻を取得する strptime() が使えないという記述を何回か見かけたことがありますが、最近ではstrptime() が使えます。以下は、Python 2.6.2 の実行例です。 >>> import datetime >>> d = datetime.datetime.strptime('2010-1…

2010-11-04

対決ヒット件数が多いクエリで全てのヒットドキュメントを取得するなら Solr の勝ち!

Solr Fast ESP

Fast ESP は検索にヒットしたドキュメントのうち、実際に取得できるのは 4020 ドキュメントまでです。Google が最大でも 1000 ドキュメントまでしか取得できないのと同じような感じですね。一方、 Solr はヒットしたのが何百万ドキュメントであろうと最後の1…

2010-11-02

対決ドキュメントの削除のしやすさは Solr の勝ち!

Solr Fast ESP

Solr は delete by query コマンドを使って検索条件にヒットしたドキュメントを削除することができます。 BODY フィールドに「ほげほげ」を含むドキュメントを削除する場合には <delete><query>BODY:ほげほげ</query></delete>というXMLを与えればOKです。しかし、Fast ESP には delete by …

2010-11-02

ERROR 1206 (HY000): The total number of locks exceeds the lock table size が出たときの対応

MySQL

UPDATE 文の実行中にエラーが出た。 "ERROR 1206 (HY000): The total number of locks exceeds the lock table size" InnoDB で UPDATE 文実行のためのバッファサイズが小さいらしい。 /etc/my.cnf に innodb_buffer_pool_size = 512M を追加 $ /etc/init.d/…

2010-08-17

apache インストール

久しぶりにやったのでメモ $ wget http://ftp.kddilabs.jp/infosystems/apache/httpd/httpd-2.2.16.tar.gz $ tar xvfz httpd-2.2.16.tar.gz $ cd httpd-2.2.16/ $ ./configure --enable-rewrite --enable-so --enable-ssl $ make $ su # make install # grou…

2010-08-09

Spatial Search 緯度経度を使った空間検索

Solr

現在開発中の Solr ( solr-1.5-dev )では緯度経度を使った空間検索ができるようになっています。銀座駅半径1Kmの検索例 http://192.168.11.42:8080/solr/select/?q=_val_:"recip(hsin(6378.137, vector(rad(WGS_LATLON_0_latLon), rad(WGS_LATLON_1_latLon…

2010-08-06

haproxy を使ってお手軽 HA 構成

Solr

haproxy はL7ロードバランサのソフトウェアです。これによって Solr への検索要求をタダで簡単に冗長化・負荷分散することができるようになります。 haproxy インストール $ wget http://haproxy.1wt.eu/download/1.4/src/haproxy-1.4.8.tar.gz $ cd haprox…

2010-08-02

データインポートハンドラ ( Data Import Handler ) の SQL 文中の関数が正しく実行されない場合は JDBC ドライバのバージョンを疑ってみよう

Solr

全く同じ db-data-config.xml ( データインポートハンドラの設定ファイル ) を使ったデータインポートが環境によって問題なく実行されたり、エラーになったりすることがありました。エラーになっている方は SQL文中でつかっている CONCAT() 関数がうまく実…

2010-07-15

NGramTokenizer は 1024 文字までしかパースしてくれないのでちょっと増やしてみた

Solr

修正 hi_time 様から下記のコメントいただきました。ご指摘の設定の方が洗練されていると思いますので、この記事の役割を問題の提起とhi_time 様の解決方法の紹介と変えさせていただければと思います。hi_time 様コメントありがとうございました。 hi_time …

2010-07-12

umountで"device is busy"になったときの対応方法

Linux

umount で device is busy になったときって、アンマウント対象ファイルシステムを使っているプロセスがあることが多いですよね。 # umount /mnt/nfs1 umount: /mnt/nfs1: device is busy umount: /mnt/nfs1: device is busy そんなときに、ファイルシステム…

2010-07-05

情報処理技術者試験情報セキュリティスペシャリスト一発合格!!

春に受けた情報セキュリティスペシャリストに合格しました。ヨカッタです。合格に導いてくれたこの本はナカナカのモノだと思います。ありがとう上原孝之さんありがとう翔泳社

2010-06-05

root 権限なしでインストール

MySQL

ホスティングやレンタルサーバなどで root 権限がないときの MySQL のインストールメモホームディレクトリ/local/mysql にインストール % tar xvfz mysql-5.0.75.tar.gz % cd mysql-5.0.75 % ./configure --prefix=/home/search/local/mysql --with-mysqld-…

2010-06-04

USB ディスクを使う

Linux

パーティションの作成 # fdisk /dev/sdd <- USBディスクは接続するとSCSIディスクとして自動認識されるコマンド (m でヘルプ): p Disk /dev/sdd: 1000.2 GB, 1000204886016 bytes 255 heads, 63 sectors/track, 121601 cylinders Units = シリンダ数 of 160…

2010-05-24

グラフを書こう! RedHat Linux に matplotlib をインストール

Python

RedHat Linux 上の python でグラフを書くために matplotlib をインストールしました。 Windwows 版はこちら Windows に Python と matplotlib をインストールインストールソースからインストールします。 matplotlib のインストールの前に事前に以下のイ…

2010-05-20

PHP から検索するときは使った方がいい Solr のオプション

Solr

PHP から Solr の検索をするときは solrconfig.xml に下のオプションを追加すると検索結果を受け取った後の処理がとても楽になります。 # <queryResponseWriter name="xslt" ... の下あたりに追記する  <queryResponseWriter name="php" class="org.apache.solr.request.PHPResponseWrit er"/> </queryresponsewriter></queryresponsewriter>

2010-05-19

Solr のインデックスに Python ( Jython ) から Lucene ライブラリを使ってアクセスするその２ NGramTokenizer と LowerCaseFilter を使って見る

Solr Python Jython

NGramTokenizer と LowerCaseFilter を同時に使って検索するコードのサンプルです。標準では NGramTokenizer 用の Analyzer は用意されていないので NGramAnalyzer を作成しています。 NGramTokenizer は lucene-analyzers-X.X.jar に入っているのでクラス…

2010-05-18

Solr のインデックスに Python ( Jython ) から Lucene ライブラリを使ってアクセスする。

Solr Python Jython

Python から Lucene ライブラリを使いたかったので Python の Java 実装である Jython を使って見ました。 Solr のベースとなっている Lucene は Java で記述されたライブラリなので Jython を使うと Python の文法のままで Lucene 簡単に使うことができま…

2010-04-06

Wikipedia のテキストデータを使ってベンチマークをする! その7 ロードバランサー( haproxy ) を使って Solr 2台構成にしてみた!

Solr MySQL

前回の [Solr][MySQL] Wikipedia のテキストデータを使ってベンチマークをする! その6 Solr は MySQL より 200倍速い！からSolrのサーバを1台増加させた2台構成にして性能の変化をみてみました。前回から変わった計測条件 16スレッド×50ループの800クエリを…

2010-03-26

Wikipedia のテキストデータを使ってベンチマークをする! その6 Solr は MySQL より 200倍速い！

Solr MySQL

JMeter を使って負荷試験をしてみました。やってみたこと Wikipedia のページタイトルから検索ワードを選定選定ルールページタイトルから記号を含まないものだけを抽出。記号は検索式で様々な意味を持つのでそれを含まないものを選ぶ。それらをユニーク…

2010-03-16

Wikipedia のテキストデータを使ってベンチマークをする! その5 Solr と MySQL でざっくり速度対決

Solr MySQL

せっかく Solr にデータが入ったので軽く検索速度の比較をしてみました。比較してみたこと Solr と MySQL それぞれで「ロボット」で検索するヒットする記事の数と記事10件の取得時間を調べる。 Solr、MySQL ともに設定パラメータはデフォルトのまま Solr …

2010-03-11

Wikipedia のテキストデータを使ってベンチマークをする! その4 データインポートハンドラ( DIH Data Import Handler ) を使って Solr にデータを入れる

Solr MySQL

MySQL に入れておいた WikiPedia のデータを Solr に入れます。 WikiPedia のデータを MySQL に入れる方法は↓ [Solr][MySQL] Wikipedia のテキストデータを使ってベンチマークをする! その２ Wikipedia のテキストデータを MySQL に入れる Solr のスキーマ設…

2010-03-10

Wikipedia のテキストデータを使ってベンチマークをする! その3 Solr のスキーマ設計

Solr MySQL

WikiPediaのデータを入れるための Solr のスキーマ設計です。 Wikipedia のデータ構成 [Solr][MySQL] Wikipedia のテキストデータを使ってベンチマークをする! その２ Wikipedia のテキストデータを MySQL に入れるで MySQL に入れた Wikipedia のデータ構造…

2010-03-08

FTP コマンドで FTPサーバにつないだんだけど ls とかやっても何にも表示されないときの対処方法

CentOS

Passive モードになっている可能性があります。 Passive モードじゃなくする(= Activeモードにする ) には passive コマンドを使って Passive モードを off にします。 passive コマンドはトグルスイッチになっているので、実行するたびに on と off が入れ…

2010-03-04

Wikipedia のテキストデータを使ってベンチマークをする! その２ Wikipedia のテキストデータを MySQL に入れる。

Solr MySQL

Wikipedia のデータを取得してMySQLに入れます。 Wikipedia のデータ構成 MySQL に入れる Wikipedia のデータ構造は以下の用になります。フィールドの詳細については以下を参照してください。 http://www.mediawiki.org/wiki/Page_table/ja#page_title http…

2010-03-04

Wikipedia のテキストデータを使ってベンチマークをする! その1 思い立ったこと

Solr MySQL

テキスト検索のベンチマークをしたいと思い立ちました。テストデータにはWikipediaのデータを使おうと思います。現在日本語Wikipediaのページ数は約130万ページです。 Solrに入れるときには1ページ1ドキュメントになるので 130万ドキュメントのインデック…

Solr, Python, MacBook Air in Shinagawa Seaside

2010-01-01から1年間の記事一覧

情報処理技術者試験ネットワークスペシャリスト一発合格!!

オープンソース日本語フォント IPA フォントのインストール

matplotlib で日本語を使えるようにしてみた!

CGI の実行でライブラリの参照ができなくって Internal Server Error が出たときの対応

matplotlib で時系列のグラフを書いてみた!

日付のハンドリングに便利な datetime型と文字列の相互変換

対決ヒット件数が多いクエリで全てのヒットドキュメントを取得するなら Solr の勝ち!

対決ドキュメントの削除のしやすさは Solr の勝ち!

ERROR 1206 (HY000): The total number of locks exceeds the lock table size が出たときの対応

apache インストール

Spatial Search 緯度経度を使った空間検索

haproxy を使ってお手軽 HA 構成

データインポートハンドラ ( Data Import Handler ) の SQL 文中の関数が正しく実行されない場合は JDBC ドライバのバージョンを疑ってみよう

NGramTokenizer は 1024 文字までしかパースしてくれないのでちょっと増やしてみた

umountで"device is busy"になったときの対応方法

情報処理技術者試験情報セキュリティスペシャリスト一発合格!!

root 権限なしでインストール

USB ディスクを使う

グラフを書こう! RedHat Linux に matplotlib をインストール

PHP から検索するときは使った方がいい Solr のオプション

Solr のインデックスに Python ( Jython ) から Lucene ライブラリを使ってアクセスするその２ NGramTokenizer と LowerCaseFilter を使って見る

Solr のインデックスに Python ( Jython ) から Lucene ライブラリを使ってアクセスする。

Wikipedia のテキストデータを使ってベンチマークをする! その7 ロードバランサー( haproxy ) を使って Solr 2台構成にしてみた!

Wikipedia のテキストデータを使ってベンチマークをする! その6 Solr は MySQL より 200倍速い！

Wikipedia のテキストデータを使ってベンチマークをする! その5 Solr と MySQL でざっくり速度対決

Wikipedia のテキストデータを使ってベンチマークをする! その4 データインポートハンドラ( DIH Data Import Handler ) を使って Solr にデータを入れる

Wikipedia のテキストデータを使ってベンチマークをする! その3 Solr のスキーマ設計

FTP コマンドで FTPサーバにつないだんだけど ls とかやっても何にも表示されないときの対処方法

Wikipedia のテキストデータを使ってベンチマークをする! その２ Wikipedia のテキストデータを MySQL に入れる。

Wikipedia のテキストデータを使ってベンチマークをする! その1 思い立ったこと