python2.x在win下cmd中运行中文乱码问题解决方法
恼火的现象
由于CMD默认的gbk编码,在用python输出中文的时候特别的恼火,即使加了很多教程中提到的下面两行代码,还是无效。
[neilian ids=]#!/usr/bin/env python #-*- coding: utf-8 -*-
解决方法:
从代码入手,因为CMD默认gbk编码,所以只能把代码中的中文进行gbk编码了。
utf-8通过解码转化为unicode,然后将unicode编码转化为gbk
# -*- coding:utf-8 -*- content = "我是中文" content_unicode = content.decode("utf-8") content_gbk = content_unicode.encode("gbk") print content_gbk
而在python3.x中,根本不存在这种现象。
原因分析:
主要是二者对于字符串的编码不同
python 2.x:
python 2.x的字符串是有编码的,默认为ascii,但如果在其中写中文的话,解释器一般会报错,所以都在代码第一行或者第二行规定编码格式:
# -*- coding:utf-8 -*-
想要转换为其他编码,就要进行先解码为unicode再编码的过程。
python 3.x
python 3.x的字符串类似python 2.x的unicode,是没有经过编码的,因此python 3.x的字符串没有decode属性,只有encode属性,调用这个方法后将产生bytes类型的字符串(有点像python 2.x中的字符串),而bytes类型支持解码操作。
借鉴csdn:http://blog.csdn.net/jia304349145/article/details/59706455
阅读剩余
版权声明:
作者:windchao
链接:http://www.naoxiaogen.com/python/2017-10-31/pythonchinese.html
文章版权归作者所有,未经允许请勿转载。
THE END