外国語の形態素解析をする TreeTagger インストール メモ

TreeTaggerは英語、中国語、ロシア語他多数の言語の形態素解析をしてくれるツールです
具体的には 単語の品詞と基本形を教えてくれます

http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/
上から下記をダウンロード

$ ls
english-par-linux-3.2-utf8.bin.gz 
install-tagger.sh       
tagger-scripts.tar.gz
tree-tagger-linux-3.2.tar.gz

$ sh install-tagger.sh

$ echo 'Hello world!' | cmd/tree-tagger-english
	reading parameters ...
	tagging ...
	 finished.
Hello	 UH	Hello
world NN	world
!	SENT	!