読者です 読者をやめる 読者になる 読者になる

iso2022_jp

Python

個人的なまとめ用。

- iso2022_jp _1 _2 _3 _2004 _ext
JISX0201_K - - - - -
JISX0201_R - -
JISX0208
JISX0208_O - - -
JISX0212 - - - -
JISX0213_2000 - - - - -
JISX0213_2004 - - - - -
GB2312 - - - - -
KSX1001_G0 - - - - -

JIS X 0201

>>> u"カタカナ".encode("iso2022_jp")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'iso2022_jp' codec can't encode character u'\uff76' in position 0: illegal multibyte sequence
>>> u"カタカナ".encode("iso2022_jp_ext")
'\x1b(I6@6E\x1b(B'

JIS X 0213

>>> import unicodedata
>>> unicodedata.name(u"\u20ac")
'EURO SIGN'
>>> u"\u20ac".encode("iso2022_jp_2004")
'\x1b$(Q)!\x1b(B'

GB 2312

>>> import unicodedata
>>> unicodedata.name(u"\u6c49")
'CJK UNIFIED IDEOGRAPH-6C49'
>>> u"\u6c49".encode("iso2022_jp_2")
'\x1b$(A::\x1b(B'