Python
著作権がきちんと整理されているオープンソースの IPA フォントを使うのがオススメですが、OS にバンドルされている適当な日本語フォントがあればそれを使って表示させることもできます。後者の場合は配布時に注意した方がいいです。 IPA フォントのインスト…
matplotlib で書くすごーく簡単な時系列グラフのサンプル #!/usr/bin/env python # -*- coding: utf-8 -*- import datetime import matplotlib.pyplot as plt import matplotlib.dates as mdates # X軸データ x = [datetime.datetime(2010,1,1), datetime.da…
datetimeには 文字列から日付や時刻を取得する strptime() が使えないという記述を何回か見かけたことがありますが、最近ではstrptime() が使えます。 以下は、Python 2.6.2 の実行例です。 >>> import datetime >>> d = datetime.datetime.strptime('2010-1…
RedHat Linux 上の python でグラフを書くために matplotlib をインストールしました。 Windwows 版は こちら Windows に Python と matplotlib をインストール インストール ソースからインストールします。 matplotlib のインストールの前に事前に以下のイ…
NGramTokenizer と LowerCaseFilter を同時に使って検索するコードのサンプルです。 標準では NGramTokenizer 用の Analyzer は用意されていないので NGramAnalyzer を作成しています。 NGramTokenizer は lucene-analyzers-X.X.jar に入っているのでクラス…
Python から Lucene ライブラリを使いたかったので Python の Java 実装である Jython を使って見ました。 Solr の ベースとなっている Lucene は Java で記述されたライブラリなので Jython を使うと Python の文法のままで Lucene 簡単に使うことができま…
Google Data Python Library を用いた Google Analytics のデータの取得についてのメモです。 Google Data Python Library は以下からダウンロードできます。 http://code.google.com/p/gdata-python-client/downloads/list Google Analytics のデータを取得…
2009年の8月15日からAmazon Web Service のアクセス方法が変わりました。 具体的には秘密鍵を使った電子認証が追加された感じになってます。 Amazon から何度かメールで案内がきていたのですが 時間がなくってこの1ヶ月あまり放置していました。 今日は5連休…
Pythonはroot権限がなくっても書き込み権限のある任意のディレクトリにインストールして、2つの環境変数をセットすることで使うことができるようになります。 セットする環境変数はこの2つです。 PYTHON_HOME PATH この方法を使えば複数のバージョンの Pytho…
いつもはCentOSなボクですが、今回はワケあってちょっとリッチな Red Hat Enterprise Linux AS release 4 (Nahant Update 7) に実行環境を作ったのでその手順のメモです。 最初 Python をインストールしたときにちょいとハマったのが gcc のバージョンの違い…
CaboCha の Python バインディングのインストールで下のエラーが出たときの対応法です。 python setup.py build running build running build_py running build_ext building '_CaboCha' extension gcc -pthread -fno-strict-aliasing -DNDEBUG -g -fwrapv -…
導入した Python ChaSen を使って CGI を書いてみたのですが Shared object "libchasen.so.2" not found, required by "chasen.so" こんなメッセージが出て、うまく動きません。 シェアードライブラリが見つからないといっているので LD_LIBRARY_PATH に lib…
さくらインターネットにインストールした Chasen を Python から使います。 ポイント python_chasen-0.2を使います。 python_chasen-0.2 は 文字コードが EUC であることが前提になっているので、UTF-8 で使うためにソースを一部修正します。 Chasen のライ…
Google App Engine では インターネットを経由して外部の Web ページや XML を参照したり API を使ったりするときには urlfetch モジュールを使います。 通常の Python で使われる urllib の代わりですね。 下のサンプルコードは、はてなキーワード API を使…
通常の CGI では環境変数 LANG や sitecustomize.py なんかで なんとなくごまかせていた Unicode と UTF-8等 の使い分けも Google App Engine ではキチンと処理してあげないとエラーになっちゃいます。 コーディング中に下のメッセージが出て、萎えた方も多…
ずーっと試さなきゃと思っていながら取りかかれずにいた Google App Engine の攻略にようやく取りかかりました。 「今年の汚れは今年のうちに」作戦です。 休日1日使ってうひゃ検索をGoogle App Engine にポーティングしてみました。 http://1.latest.whyase…
Python から Yahoo! 日本語形態素解析 Web サービスを使うための Wrapperを書いてみました。 ついでに前回紹介させてもらった「うはぁ検索」に組み込んで Wiki と はてな と Yahoo!日本語形態素解析Webサービス とAmazon を同時に検索する 「うひゃ検索」 に…
先日ここで紹介させてもらった、 Amazon Web Service 用のWrapperと その後に作った はてなキーワードAPI 用Wrapper Wiki 検索機能 を合体させてWiki と はてな と Amazon を同時に検索する CGI を Python で書いてみました。 それぞれの頭文字をとって wha …
ボクは普段アプリケーションの実行環境として Tomcat を使っています。 運用で使うちょっとしたCGIなんかも Python で書いて Tomcat の上で動かしちゃっています。以下は、Tomcat で Python で書いた CGI を実行できるようにするためのメモです。 Tomcat に…
Python から Amazon Web サービスを使って商品検索をする Wrapper を書いてみました。 PyAWSというのがあって これを使うといいよとブログで紹介している方もいたので試してみたのですが 添付されていたサンプルをうまく動かせなかったり XMLのパースにminid…
「集合知プログラミング」はサンプルコードもたくさん載っている とても参考になる書籍なのですが すべてが日本仕様?に修正されているわけではないので 部分的に日本や日本語ではそのまま使えないところもあります。 225ページ「9章 高度な分類手法:カーネ…
「集合知プログラミング」のサンプルコードを動かすために Windows 版の Python と matplotlib をインストールして Pythonからグラフを書けるようにしました。 「集合知プログラミング」はオライリーから出ている 自然言語処理等にとても参考になる書籍です…
ドラマ「ブラッディ・マンデイ」の第1回の放送を見ました。 緊張感があってなかなかいいドラマでした。で、三浦春馬 扮する 天才ハッカー Falcon が ハッキングするときのコードをPythonで書いてるみたいでした。関東電力にアタックかけるときのコマンドが #…