長すぎる文字列を正規化するとセグメンテーションエラー ( segmentation fault ) になることがあるようです


全角半角の表記揺れの正規化に便利な unicodedata モジュールですが
入力する文字列が長すぎると セグメンテーションエラー ( segmentation fault ) になることがあるようです

# 下記の場合 Inhoge が長い
Outhoge = unicodedata.normalize('NFKC', Inhoge)

こういう場合は入力文字列を分割すると解決します。


セグメンテーションエラーになると Python ごと落ちてしまうので、except でエラー箇所を捕まえることもできずデバッグに難儀します