解决UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position xxx: ordinal not in range

在调用一个库时,出现了一个异常报错类似如UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 0-1: ordinal not in range(128),只要该库返回结果包含中文,该结果时就会出现该异常。

原因:

Python2默认使用ASCII编码,ASCII编码不包含中文,处理中文时会报错

Python3更换为默认使用Unicode编码

解决方法(任选其一):

1.

在文件首部添加

# coding=utf-8

2.

在python的Lib\site-packages文件夹下新建一个sitecustomize.py,内容为:

# encoding=utf8
import sys

reload(sys)
sys.setdefaultencoding('utf8')   

编码

  • ascii 1个字节
  • gb-2312(1980)
  • gbk(1995) 对gb-2312扩展,包含中日韩等国家文字
  • unicode(万国码) 

        ucs2 固定的2个字节表示二进制和文字的对应关系 2^16

        ucs4 固定的4个字节表示二进制和文字的对应关系 2^32 ->浪费空间,流量 

  • utf-8 对unicode进行压缩,用尽可能少的字节表示数据

开发时尽量使用utf-8进行编码,一个中文占3个字节

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2023年7月6日
下一篇 2023年7月6日

相关推荐