2011-01-01から1年間の記事一覧

MySQL-python のインストールで怒られたときにやったこと

_mysql.c:36:23: error: my_config.h: そのようなファイルやディレクトリはありません _mysql.c:38:19: error: mysql.h: そのようなファイルやディレクトリはありません _mysql.c:39:26: error: mysqld_error.h: そのようなファイルやディレクトリはありませ…

VMware で仮想ディスクを拡張してみた

手順1 VMware の仮想ディスクを拡張する VMware の仮想ディスクの拡張には vmware-vdiskmanager を使う。 vmware-vdiskmanager は VMware Player にはバンドルされていない。VMware Workstation に付随している。 vmware-vdiskmanager の使い方は -help で代…

Linux版 VMware Player に windows をインストールして アンダースコア _ アンダーバー が入力できないとき

~/.vmware/preference に下記追加xkeymap.noKeycodeMap = "TRUE" xkeymap.keycode.97 = 0x073

bash で while ループは子プロセスになっているらしい

コマンド hogehoge は存在しないので exit 1 で終了されることを期待していたのですが ループは抜けるものの最終列の exit 0が実行されてしまいます。 #! /bin/bash -xv cat << END > sku_table_list m_jan_base m_jan_kaigai END cat sku_table_list | whil…

Jubatus リリースされましたね

プリファードインフラストラクチャー の 大規模データ分散基盤技術「Jubatus(ユバタス)」が 正式にリリースされたみたいですね。http://jubat.us/ 使い方によっては Hadoop よりも役に立ちそうです。

pg_bulkload インストールして使ってみた

http://pgbulkload.projects.postgresql.org/index_ja.html # wget http://pgfoundry.org/frs/download.php/3101/pg_bulkload-3.0.2-1.pg90.rhel5.x86_64.rpm # rpm -ivh pg_bulkload-3.0.2-1.pg90.rhel5.x86_64.rpm # データベースのオーナユーザで実行 $ p…

LVM にディスク追加してみた

# vgextend VolGroup00 /dev/sdb1 No physical volume label read from /dev/sdb1 Physical volume "/dev/sdb1" successfully created Volume group "VolGroup00" successfully extended # vgdisplay --- Volume group --- VG Name VolGroup00 System ID For…

PostgreSql 9.0.4 インストールメモ

$ su - # groupadd postgres # useradd -g postgres -d /usr/local/pgsql postgres # passwd postgres $ su - postgres $ wget ftp://ftp2.jp.postgresql.org/pub/postgresql/source/v9.0.4/postgresql-9.0.4.tar.gz $ tar zxvf postgresql-9.0.4.tar.gz $ c…

データロードするときは全てのカラムにデータを入れないとダメらしい

MySQL は LOAD DATA INFILE でデータを入れるとき、全てのカラムのデータを埋める必要はないのですが、Infobright では 全てを埋めないとエラーになるようです。 ERROR 2 (HY000): Wrong data or column definition. Row: 1, field: 37.

MySQL-python をインストールしようとして mysqlclient ないよ って怒られたときに対応したこと

こんな感じで怒られた gcc -pthread -shared build/temp.linux-x86_64-2.7/_mysql.o -L/usr/local/infobright/lib/mysql -lmysqlclient -lz -lcrypt -lnsl -lm -o build/lib.linux-x86_64-2.7/_mysql.so /usr/bin/ld: cannot find -lmysqlclient collect2: l…

ProFTPD で unable to determine IP address が出たときの対応 メモ

現象 # ./proftpd start Starting proftpd: - warning: unable to determine IP address of 'hoge.localdomain' - error: no valid servers configured - Fatal: error processing configuration file '/usr/local/etc/proftpd.conf' [失敗] 対応 # vi etc/h…

インストール メモ

Infobright(インフォブライト)は、DWH(データウェアハウス)用のオープンソースデータベースです。 MySQLのストレージエンジンとして実装されているので、MySQLになじみのある場合には取っつきやすいです。 大量データを高速に検索できる一方で、更新は苦…

を使った Solr インデックスからの単語の抽出

#! /usr/local/jython2.5.1/jython # -*- coding: utf-8 -*- from org.apache.lucene.store import FSDirectory from org.apache.lucene.index import IndexReader from org.apache.lucene.index import Term from org.apache.lucene.index import TermEnum …

連続した数字を1つのトークンにする

Mecab で連続した数字をトークナイズするとだいたい1文字ずつトークナイズされます。連接コストの計算結果で決まるので100%の確率ではありませんが。 $ mecab bmw318 bmw 名詞,固有名詞,組織,*,*,*,* 3 名詞,数,*,*,*,*,3,サン,サン,, 1 名詞,数,*,*,*,*,1,…

Jython から MySQL を使う方法

Jython プログラム mytest.jy #! /usr/local/jython2.5.1/jython # -*- coding: utf-8 -*- import com.ziclix.python.sql as sql if __name__ == "__main__": db = sql.zxJDBC.connect( "jdbc:mysql://localhost/データベース名", "ユーザ名", "パスワード",…

can't write index file の対処法

こんなエラーメッセージがでたときは *sys-package-mgr*: can't write cache file for 'hoge/lib/mysql-connector-java-5.0.8-bin.jar' *sys-package-mgr*: can't write index fileJython の cachedir 以下のパーミッションを 誰でも読み書きできる 777 に変…

入門 自然言語処理

NLTK を用いた自然言語処理の入門書です。 大学の教科書として書かれたものなので比較的分かりやすい内容となっています。 翻訳ものなので、独自の言い回しがちょっと眠気を誘いますが。 12章として加えられた「Python による日本語自然言語処理」は 以下か…

3.1 は 1.4 に比べて 4割高速!!

2011年3月にリリースされた Solr3.1.0 とそれまでの最新バージョンであったSolr1.4.1 とで速度比較を行ってみました。内包している Lucene の性能が上がったためでしょうか、かなり高速化されているようです。 私の試したところ下記となりました。 レスポン…

Juman ユーザ辞書登録件数の拡大方法

Juman のユーザ辞書は デフォルトでは 999 件までしか登録できません。 この制限を変更するには trans.c を修正して make しなおすと良いようです。 % tar xvfz juman-6.0.tar.gz % cd juman-6.0 % vi makeint/trans.c /* #define MRPH_BUF_MAX 1000 <- ココ…

nz install memo

# yum yum install gcc yum install gcc-c++ yum install make yum install ncurses-devel yum install readline-devel yum install zlib-devel# MySQL tar xvfz mysql-5.0.92.tar.gz cd mysql-5.0.92 ./configure --prefix=/usr/local/mysql --with-mysqld-…

Juman のユーザ辞書の作り方

vi /home/hoge/work/jumanDic/usr.dic.utf-8 (名詞 (普通名詞 ((見出し語 涼宮ハルヒの驚愕) (読み すずみやはるひのきょうがく)) ((見出し語 涼宮ハルヒの消失) (読み すずみやはるひのしょうしつ)) ((見出し語 涼宮ハルヒの分裂) (読み すずみやはるひのぶ…

CentOS 5.5 に Python 2.7.1 と mod_python をインストールしたときのメモ

Python のインストール tar xvfz Python-2.7.1.tgz cd Python-2.7.1 ./configure CFLAGS=-fPIC --enable-shared --prefix=/usr/local vi Modules/Setup 以下をコメントをはずす zlib zlibmodule.c -I$(prefix)/include -L$(exec_prefix)/lib -lz make (zlib …

CentOS のファイアウォール機能を無効にする方法

system-config-securitylevel-tui -q --disabled --selinux='disabled'

Windows7 64bit 版で odbc を使ってデータベースに接続するための注意点

Windows7 64bit 版の odbc には 32bit と 64bit 用の2種類の設定が別々に存在しているようです。 どちらを参照するかは実行するアプリケーションによって異なるようなので、場合によっては両方それぞれに設定することも必要なようです。 デフォルトの コント…

長すぎる文字列を正規化するとセグメンテーションエラー ( segmentation fault ) になることがあるようです

全角半角の表記揺れの正規化に便利な unicodedata モジュールですが 入力する文字列が長すぎると セグメンテーションエラー ( segmentation fault ) になることがあるようです # 下記の場合 Inhoge が長い Outhoge = unicodedata.normalize('NFKC', Inhoge)…

ドキュメント数 7.7億 超えました

インデックスのデータサイズは約 3.5TB です。 Solr でもこのくらいのサイズのデータ量は保管できるという参考になれば。 OS : CentOS5.5 CPU : Xeon 6コア×4 メモリ : 62GB簡単な検索なら1秒以内で返ってきます

Juman の Python バインディング cJuman をインストールしたときのメモ

cp ../cJuman.i . swig -python cJuman.i gcc -c cJuman_wrap.c -fPIC -I/usr/local/include/python2.7 gcc -shared *.o -o _cJuman.so su install -m 644 _cJuman.so cJuman.py /usr/local/lib/python2.7/site-packages 参考ページ http://app-dist.khlog.n…

[Django]導入メモ

Python インストール wget http://www.python.org/ftp/python/2.7.1/Python-2.7.1.tgz tar xvfz Python-2.7.1.tgz cd Python-2.7.1 ./configure make su - make install Django wget http://www.djangoproject.com/download/1.2.4/tarball/ tar xvfz Django-…

4.0 で Spatial Search が進化してます。

開発中のSolr4.0のSpatialSearchを試してみました。 バンドルされているサンプルデータにも緯度経度を含んだデータが入っているので簡単に試すことができます。 最新の配布パッケージをダウンロード ( ファイル名はこちらを確認してください https://hudson.…