TreeTaggerは英語、中国語、ロシア語他多数の言語の形態素解析をしてくれるツールです
具体的には 単語の品詞と基本形を教えてくれます
http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/ 上から下記をダウンロード $ ls english-par-linux-3.2-utf8.bin.gz install-tagger.sh tagger-scripts.tar.gz tree-tagger-linux-3.2.tar.gz $ sh install-tagger.sh $ echo 'Hello world!' | cmd/tree-tagger-english reading parameters ... tagging ... finished. Hello UH Hello world NN world ! SENT !