文字コードの変換。
ユニコードUTF-8とか。

# -*- coding: utf-8 -*-"
import sys
import unicodedata

#全角半角混じった文章(utf8)をunicodeに変換します。
ustr=unicode('これはテストtestです!','utf-8')
print ustr
#半角に整形します。
s=unicodedata.normalize('NFKC',ustr)
print s
#文字コードをutf8に戻します。
s1=s.encode('utf-8')
print s1