解决python2.7 UnicodeDecodeError和UnicodeEnco…

2018-06-18 03:14:38来源:未知 阅读 ()

新老客户大回馈,云服务器低至5折

最近在项目中,读取上传的csv文件,并写入时,会报编码问题,

                    with open(origin_file_path, mode='wb')as f:
                        for chunk in file_obj:
                            f.write(chunk)

UnicodeDecodeError: 'utf8' codec can't decode byte 0xc4 in position 0: invalid continuation byte

刚开始以为是对方上传的文本编码格式有问题,所以让对方用Notepad++,打开编辑后保存

刚开始一段时间,没有再出现错误,最近,错误再次发生,即使用上面说的编辑器也没用

                    with open(origin_file_path, mode='wb')as f:
                        for chunk in file_obj:
                            f.write(chunk.decode('gbk')

后面考虑,可能是因为有中文,需要进行gbk编码,所以在写入文件时我按gbk写入后,发现问题解决了,不会再报上面这个错误

但是当我把把更新的文件放到服务器上后,发现,又报另外一个错误错误

UnicodeEncodeError: 'ascii' codec can't encode characters in position 42-57: ordinal not in range(128)

可能是因为linux默认是utf-8编码。所以报错

然后我又转成utf-8,完美解决问题,代码如下  

                    with open(origin_file_path, mode='wb')as f:
                        for chunk in file_obj:
                            f.write(chunk.decode('gbk').encode('utf-8'))

 

 

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:算法学习笔记(三):冒泡排序和归并排序

下一篇:Python 列表与元组