[Docomo] カテゴリ分析 clusteranalytics 試してみた

Docomo の カテゴリ分析 は 入力文からキーワード取得とカテゴリ分析を行い、文全体のカテゴリ分布を返してくれます
https://dev.smt.docomo.ne.jp/?p=docs.api.page&api_name=language_analysis&p_name=jetrun_api_1#tag01

# Docomo カテゴリ分析 clusteranalytics サンプル
import requests
import json

APIKEY = "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"
text = u'''
昨日は隅田川花火大会を見に行ってきました。
地下鉄の浅草駅で降りた瞬間から、大混雑していました。
地上に出てみると人混みと交通規制の多さで大苦戦しましたが、
何とか良い場所で花火を見るこが出来ました。
夏の風物詩、花火をどうぞお楽しみください
'''
url = 'https://api.apigw.smt.docomo.ne.jp/truetext/v1/clusteranalytics?APIKEY={}'.format( APIKEY )
header = {'Content-Type': 'application/x-www-form-urlencoded'}
body = { "text": text }

response = requests.post(url, headers=header, data=body).json()
text = json.dumps(response, sort_keys=True, ensure_ascii=False, indent=2)
print(text)


カテゴリ分析 結果

{
  "clusters": [
    {
      "cluster_name": "その他一般ワード",
      "cluster_rank": 1,
      "cluster_rate": 36
    },
    {
      "cluster_name": "花火大会・祭り",
      "cluster_rank": 2,
      "cluster_rate": 27
    },
    {
      "cluster_name": "私鉄・地下鉄",
      "cluster_rank": 3,
      "cluster_rate": 9
    },
    {
      "cluster_name": "東京交通情報",
      "cluster_rank": 3,
      "cluster_rate": 9
    },
    {
      "cluster_name": "その他交通情報",
      "cluster_rank": 3,
      "cluster_rate": 9
    },
    {
      "cluster_name": "夜景・風物詩",
      "cluster_rank": 3,
      "cluster_rate": 9
    }
  ],
  "count": 6,
  "rawdata": "\n昨日は隅田川花火大会を見に行ってきました。\n地下鉄の浅草駅で降りた瞬間から、大混雑していました。\n地上に出てみると人混みと交通規制の多さで大苦戦しましたが、\n何とか良い場所で花火を見るこが出来ました。\n夏の風物詩、花火をどうぞお楽しみください\n",
  "status": "OK"
}