(作者:www.data-master.net 数据极)

问题描述:
使用以下代码转换字符串为json格式时,出现JSONDecodeError: Extra data的错误:

import json
import pandas as pd

df = pd.read_csv('test.csv')
df['col1'] = df['col1'].apply(lambda x:json.load(x))

可能的原因:
出现这个错误,可能的原因就是待转换的字符串中有多余字符,具体表现为两种:

  1. 字符串中有其他多余字符,比如列表框外有数字,如{‘a’:‘b’} --。

  2. 数据量太大,比如一个文件一起转,换行符就可能被视为多余字符。

结局方案:

  1. 如果是第一种表现,需要将多余字符去除,如果是{}之外或者[]之外有其他字符,则删掉这些字符。

  2. 如果第二种表现,是一整个文件读进来,换行符不好去除,则逐行读取,并保证每行是一个完整的json对象格式。

  3. 另一种是从根源上解决,即如果你是读写一个json格式的文件,则你保存文件时,就作为一个对象来保存,这样读取时也直接作为一个对象来读取,就不需要逐行读取再逐行转换了。

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐