Python

全角半角の表記揺れの正規化に便利な unicodedata モジュールですが
入力する文字列が長すぎるとセグメンテーションエラー ( segmentation fault ) になることがあるようです

# 下記の場合 Inhoge が長い
Outhoge = unicodedata.normalize('NFKC', Inhoge)

こういう場合は入力文字列を分割すると解決します。

セグメンテーションエラーになると Python ごと落ちてしまうので、except でエラー箇所を捕まえることもできずデバッグに難儀します

Solr, Python, MacBook Air in Shinagawa Seaside

長すぎる文字列を正規化するとセグメンテーションエラー ( segmentation fault ) になることがあるようです