CaboCha の Python バインディングのインストールでエラーになったら試してみる価値のあること

Python

CaboCha の Python バインディングのインストールで下のエラーが出たときの対応法です。 python setup.py build running build running build_py running build_ext building '_CaboCha' extension gcc -pthread -fno-strict-aliasing -DNDEBUG -g -fwrapv -…

2008-12-22

Python ChaSen を CGI から使う。

さくらインターネット Python

導入した Python ChaSen を使って CGI を書いてみたのですが Shared object "libchasen.so.2" not found, required by "chasen.so" こんなメッセージが出て、うまく動きません。シェアードライブラリが見つからないといっているので LD_LIBRARY_PATH に lib…

2008-12-21

Python chasen を utf-8 で使う。

さくらインターネット Python

さくらインターネットにインストールした Chasen を Python から使います。ポイント python_chasen-0.2を使います。 python_chasen-0.2 は文字コードが EUC であることが前提になっているので、UTF-8 で使うためにソースを一部修正します。 Chasen のライ…

2008-12-21

ChaSen をインストールしてみた。

さくらインターネット

今朝、家から銀座のサーバーにログインしてコーディングしていたらターミナルに「熱くてやばいっす」的なメッセージがガンガン出まくったので慌ててサーバをシャットダウンしました。おそらく何らかの理由でサーバルームの空調が止まったのだと思います。…

2008-12-10

ヒット件数が数十万件を超えるような場合でも使える。新しくインデキシングしたドキュメントを検索結果の上位に表示する２つの方法。

Solr

新しくインデキシングされたドキュメントを検索結果の上位に表示したいというニーズは割とよくあると思います。フレッシュネスブーストと呼ばれる手法です。 Solr の場合 TIMESTAMP などの日付でソートすることもできるのですが Solr はソートがあまり上手…

2008-12-10

urlfetch.fetch ではてなキーワード API を使ってみよう。

Python Google App Engine

Google App Engine ではインターネットを経由して外部の Web ページや XML を参照したり API を使ったりするときには urlfetch モジュールを使います。通常の Python で使われる urllib の代わりですね。下のサンプルコードは、はてなキーワード API を使…

2008-12-09

Unicode で萎えそうになったとき(orz)に思い出してほしい5つのこと

Python Google App Engine

通常の CGI では環境変数 LANG や sitecustomize.py なんかでなんとなくごまかせていた Unicode と UTF-8等の使い分けも Google App Engine ではキチンと処理してあげないとエラーになっちゃいます。コーディング中に下のメッセージが出て、萎えた方も多…

2008-12-08

うひゃ検索をGoogle App Engine にポーティングしてみた

Python Google App Engine

ずーっと試さなきゃと思っていながら取りかかれずにいた Google App Engine の攻略にようやく取りかかりました。「今年の汚れは今年のうちに」作戦です。休日1日使ってうひゃ検索をGoogle App Engine にポーティングしてみました。 http://1.latest.whyase…

2008-12-05

Yahoo! 日本語形態素解析 Web サービスの Wrapper を書いてみた。ついでにうはぁ検索に組み込んでうひゃ検索にした。

Python

Python から Yahoo! 日本語形態素解析 Web サービスを使うための Wrapperを書いてみました。ついでに前回紹介させてもらった「うはぁ検索」に組み込んで Wiki とはてなと Yahoo!日本語形態素解析WebサービスとAmazon を同時に検索する「うひゃ検索」に…

2008-12-04

Wiki とはてなと Amazon を同時に検索する CGI 書いてみた

Python

先日ここで紹介させてもらった、 Amazon Web Service 用のWrapperとその後に作ったはてなキーワードAPI 用Wrapper Wiki 検索機能を合体させてWiki とはてなと Amazon を同時に検索する CGI を Python で書いてみました。それぞれの頭文字をとって wha …

2008-11-26

グラフィカルモードのログインをテキストモードのログインに変える

CentOS

テキストモードの方がメモリ等のリソースの消費量が少ないのでサーバのログインモードはテキストモードの方がオススメです。以下、設定のメモです。 # vi /etc/inittab # id:5:initdefault: ← グラフィカルモード id:3:initdefault: ← テキストモードでは…

2008-11-26

ProFTPD をインストール 64bit なのでソースからインストールしたよ

CentOS

CentOS に ProFTPD をインストールするメモです。64bit 版の CentOS を使っているので基本的にソフトの追加は rpm ではなくソースからやっています。FW の内側にある開発用サーバへのインストールなのでセキュリティ的ななんやかんやは省略しちゃってます。…

2008-11-21

Python で書いた CGI を Tomcat の上で実行できるようにする。

Python Tomcat

ボクは普段アプリケーションの実行環境として Tomcat を使っています。運用で使うちょっとしたCGIなんかも Python で書いて Tomcat の上で動かしちゃっています。以下は、Tomcat で Python で書いた CGI を実行できるようにするためのメモです。 Tomcat に…

2008-11-21

テーブルのコピー

MySQL

to_table から from_table にコピーする場合。 to_table を作る。( CREATE TABLE 文を実行する ) テーブルの構造がわからない場合は SHOW COLUMNS FROM from_table コピーを実行する。 INSERT INTO `to.db`.`to_table` SELECT * FROM `from_db`.`from_db`; …

2008-11-18

Amazon Web Service 用のWrapper書いてみた

Python

Python から Amazon Web サービスを使って商品検索をする Wrapper を書いてみました。 PyAWSというのがあってこれを使うといいよとブログで紹介している方もいたので試してみたのですが添付されていたサンプルをうまく動かせなかったり XMLのパースにminid…

2008-11-14

BootCamp + WindowsXP に ATOK2008 導入してみた

MacBook Air

最近、Windowsマシンとして動くことの多いボクの MacBook Airですが ATOK の評判がいいのと月額使用料金が300円というプライシングもあって試しに導入してみることにしました。最初の月は無料みたいです。で、インストールは普通にやればいいのですが Ma…

2008-11-13

「集合知プログラミング」のサンプルコードのGeoサーチを日本対応に修正してみた。

Python

「集合知プログラミング」はサンプルコードもたくさん載っているとても参考になる書籍なのですがすべてが日本仕様？に修正されているわけではないので部分的に日本や日本語ではそのまま使えないところもあります。 225ページ「9章高度な分類手法：カーネ…

2008-11-10

Windows に Python と matplotlib をインストール

Python

「集合知プログラミング」のサンプルコードを動かすために Windows 版の Python と matplotlib をインストールして Pythonからグラフを書けるようにしました。「集合知プログラミング」はオライリーから出ている自然言語処理等にとても参考になる書籍です…

2008-11-10

BootCamp で Windows を起動したときの Print Screen

MacBook Air

MacBook Airには「Print Screen」キーはありません。 BootCamp を使って Windows を起動してスクリーンショットを取りたいときは fn + 左shift + F11 です。F11 はキートップに F11 と書いてあるスピーカボリュームを小さくするキーそのままです。Ctrl + [ …

2008-10-18

NetApp バージョンアップもディスクの追加もノンストップで

先日、NetAppbの OS である Data ONTAP のバージョンアップとディスクの追加を行いました。 Data ONTAP のバージョンは以下となりました。 Data ONTAP Release 7.2.4L1 Model Name は N3600 でシリーズは FAS2000 です。検索エンジン Solr のインデックス…