Docomo の カテゴリ分析 は 入力文からキーワード取得とカテゴリ分析を行い、文全体のカテゴリ分布を返してくれます
https://dev.smt.docomo.ne.jp/?p=docs.api.page&api_name=language_analysis&p_name=jetrun_api_1#tag01
# Docomo カテゴリ分析 clusteranalytics サンプル import requests import json APIKEY = "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX" text = u''' 昨日は隅田川花火大会を見に行ってきました。 地下鉄の浅草駅で降りた瞬間から、大混雑していました。 地上に出てみると人混みと交通規制の多さで大苦戦しましたが、 何とか良い場所で花火を見るこが出来ました。 夏の風物詩、花火をどうぞお楽しみください ''' url = 'https://api.apigw.smt.docomo.ne.jp/truetext/v1/clusteranalytics?APIKEY={}'.format( APIKEY ) header = {'Content-Type': 'application/x-www-form-urlencoded'} body = { "text": text } response = requests.post(url, headers=header, data=body).json() text = json.dumps(response, sort_keys=True, ensure_ascii=False, indent=2) print(text)
カテゴリ分析 結果
{ "clusters": [ { "cluster_name": "その他一般ワード", "cluster_rank": 1, "cluster_rate": 36 }, { "cluster_name": "花火大会・祭り", "cluster_rank": 2, "cluster_rate": 27 }, { "cluster_name": "私鉄・地下鉄", "cluster_rank": 3, "cluster_rate": 9 }, { "cluster_name": "東京交通情報", "cluster_rank": 3, "cluster_rate": 9 }, { "cluster_name": "その他交通情報", "cluster_rank": 3, "cluster_rate": 9 }, { "cluster_name": "夜景・風物詩", "cluster_rank": 3, "cluster_rate": 9 } ], "count": 6, "rawdata": "\n昨日は隅田川花火大会を見に行ってきました。\n地下鉄の浅草駅で降りた瞬間から、大混雑していました。\n地上に出てみると人混みと交通規制の多さで大苦戦しましたが、\n何とか良い場所で花火を見るこが出来ました。\n夏の風物詩、花火をどうぞお楽しみください\n", "status": "OK" }