====== 2023.07.08 json.loads失敗 ======
json.loadsする時に、文字列に制御文字が入っていると失敗します。
[[https://docs.python.org/ja/3.7/library/json.html]]
strict が false (デフォルトは True) の場合、制御文字を文字列に含めることができます。ここで言う制御文字とは、'\t' (タブ)、'\n'、'\r'、'\0' を含む 0-31 の範囲のコードを持つ文字のことです。
===== エラー =====
>>> json.loads(text)
>>> text = '{"key": "Hello \t World!"}'
>>> json.loads(text)
Traceback (most recent call last):
File "", line 1, in
File "/usr/lib64/python3.4/json/__init__.py", line 318, in loads
return _default_decoder.decode(s)
File "/usr/lib64/python3.4/json/decoder.py", line 343, in decode
obj, end = self.raw_decode(s, idx=_w(s, 0).end())
File "/usr/lib64/python3.4/json/decoder.py", line 359, in raw_decode
obj, end = self.scan_once(s, idx)
ValueError: Invalid control character at: line 1 column 16 (char 15)
==== 対応 ====
strict=Falseを付けてあげると、制御文字も含めて読み込む事ができます。
>>> json.loads(text, strict=False)
{'key': 'Hello \t World!'}
{{tag>Python 日記}}