2008-12-01から1ヶ月間の記事一覧
CaboCha の Python バインディングのインストールで下のエラーが出たときの対応法です。 python setup.py build running build running build_py running build_ext building '_CaboCha' extension gcc -pthread -fno-strict-aliasing -DNDEBUG -g -fwrapv -…
導入した Python ChaSen を使って CGI を書いてみたのですが Shared object "libchasen.so.2" not found, required by "chasen.so" こんなメッセージが出て、うまく動きません。 シェアードライブラリが見つからないといっているので LD_LIBRARY_PATH に lib…
さくらインターネットにインストールした Chasen を Python から使います。 ポイント python_chasen-0.2を使います。 python_chasen-0.2 は 文字コードが EUC であることが前提になっているので、UTF-8 で使うためにソースを一部修正します。 Chasen のライ…
今朝、家から銀座のサーバーにログインしてコーディングしていたら ターミナルに「熱くてやばいっす」的なメッセージがガンガン出まくったので 慌ててサーバをシャットダウンしました。 おそらく何らかの理由でサーバルームの空調が止まったのだと思います。…
新しくインデキシングされたドキュメントを検索結果の上位に表示したいというニーズは割とよくあると思います。 フレッシュネスブーストと呼ばれる手法です。 Solr の場合 TIMESTAMP などの日付でソートすることもできるのですが Solr はソートがあまり上手…
Google App Engine では インターネットを経由して外部の Web ページや XML を参照したり API を使ったりするときには urlfetch モジュールを使います。 通常の Python で使われる urllib の代わりですね。 下のサンプルコードは、はてなキーワード API を使…
通常の CGI では環境変数 LANG や sitecustomize.py なんかで なんとなくごまかせていた Unicode と UTF-8等 の使い分けも Google App Engine ではキチンと処理してあげないとエラーになっちゃいます。 コーディング中に下のメッセージが出て、萎えた方も多…
ずーっと試さなきゃと思っていながら取りかかれずにいた Google App Engine の攻略にようやく取りかかりました。 「今年の汚れは今年のうちに」作戦です。 休日1日使ってうひゃ検索をGoogle App Engine にポーティングしてみました。 http://1.latest.whyase…
Python から Yahoo! 日本語形態素解析 Web サービスを使うための Wrapperを書いてみました。 ついでに前回紹介させてもらった「うはぁ検索」に組み込んで Wiki と はてな と Yahoo!日本語形態素解析Webサービス とAmazon を同時に検索する 「うひゃ検索」 に…
先日ここで紹介させてもらった、 Amazon Web Service 用のWrapperと その後に作った はてなキーワードAPI 用Wrapper Wiki 検索機能 を合体させてWiki と はてな と Amazon を同時に検索する CGI を Python で書いてみました。 それぞれの頭文字をとって wha …