2008-12-01から1ヶ月間の記事一覧

CaboCha の Python バインディングのインストールでエラーになったら試してみる価値のあること

CaboCha の Python バインディングのインストールで下のエラーが出たときの対応法です。 python setup.py build running build running build_py running build_ext building '_CaboCha' extension gcc -pthread -fno-strict-aliasing -DNDEBUG -g -fwrapv -…

Python ChaSen を CGI から使う。

導入した Python ChaSen を使って CGI を書いてみたのですが Shared object "libchasen.so.2" not found, required by "chasen.so" こんなメッセージが出て、うまく動きません。 シェアードライブラリが見つからないといっているので LD_LIBRARY_PATH に lib…

Python chasen を utf-8 で使う。

さくらインターネットにインストールした Chasen を Python から使います。 ポイント python_chasen-0.2を使います。 python_chasen-0.2 は 文字コードが EUC であることが前提になっているので、UTF-8 で使うためにソースを一部修正します。 Chasen のライ…

ChaSen をインストールしてみた。

今朝、家から銀座のサーバーにログインしてコーディングしていたら ターミナルに「熱くてやばいっす」的なメッセージがガンガン出まくったので 慌ててサーバをシャットダウンしました。 おそらく何らかの理由でサーバルームの空調が止まったのだと思います。…

ヒット件数が数十万件を超えるような場合でも使える。新しくインデキシングしたドキュメントを検索結果の上位に表示する2つの方法。

新しくインデキシングされたドキュメントを検索結果の上位に表示したいというニーズは割とよくあると思います。 フレッシュネスブーストと呼ばれる手法です。 Solr の場合 TIMESTAMP などの日付でソートすることもできるのですが Solr はソートがあまり上手…

urlfetch.fetch ではてなキーワード API を使ってみよう。

Google App Engine では インターネットを経由して外部の Web ページや XML を参照したり API を使ったりするときには urlfetch モジュールを使います。 通常の Python で使われる urllib の代わりですね。 下のサンプルコードは、はてなキーワード API を使…

Unicode で萎えそうになったとき(orz)に思い出してほしい5つのこと

通常の CGI では環境変数 LANG や sitecustomize.py なんかで なんとなくごまかせていた Unicode と UTF-8等 の使い分けも Google App Engine ではキチンと処理してあげないとエラーになっちゃいます。 コーディング中に下のメッセージが出て、萎えた方も多…

うひゃ検索をGoogle App Engine にポーティングしてみた

ずーっと試さなきゃと思っていながら取りかかれずにいた Google App Engine の攻略にようやく取りかかりました。 「今年の汚れは今年のうちに」作戦です。 休日1日使ってうひゃ検索をGoogle App Engine にポーティングしてみました。 http://1.latest.whyase…

Yahoo! 日本語形態素解析 Web サービスの Wrapper を書いてみた。ついでに うはぁ検索に組み込んで うひゃ検索にした。

Python から Yahoo! 日本語形態素解析 Web サービスを使うための Wrapperを書いてみました。 ついでに前回紹介させてもらった「うはぁ検索」に組み込んで Wiki と はてな と Yahoo!日本語形態素解析Webサービス とAmazon を同時に検索する 「うひゃ検索」 に…

Wiki と はてな と Amazon を同時に検索する CGI 書いてみた

先日ここで紹介させてもらった、 Amazon Web Service 用のWrapperと その後に作った はてなキーワードAPI 用Wrapper Wiki 検索機能 を合体させてWiki と はてな と Amazon を同時に検索する CGI を Python で書いてみました。 それぞれの頭文字をとって wha …