読者です 読者をやめる 読者になる 読者になる

MIME文書の文字セットを取得する

Python

Messageオブジェクトのget_content_charset()メソッドを使うのがよさそうです。いままでは自分で、Content-Typeを解析していた・・・

>>> from email import message_from_string
>>> msg = message_from_string("""Content-Type: text/plain;charset=utf-8; spam=spam
... 
... hello""")
>>> msg.get_content_charset()
'utf-8'


ちなみに、このget_content_charset()は、マニュアルにある通りget_charset()メソッドとは別物です。