python2.x在win下cmd中运行中文乱码问题解决方法

2017-10-31

恼火的现象

由于CMD默认的gbk编码，在用python输出中文的时候特别的恼火，即使加了很多教程中提到的下面两行代码，还是无效。

[neilian ids=]#!/usr/bin/env python
#-*- coding: utf-8 -*-

解决方法：

从代码入手，因为CMD默认gbk编码，所以只能把代码中的中文进行gbk编码了。
utf-8通过解码转化为unicode，然后将unicode编码转化为gbk

# -*- coding:utf-8 -*-
content = "我是中文"
content_unicode = content.decode("utf-8")
content_gbk = content_unicode.encode("gbk")
print content_gbk

而在python3.x中，根本不存在这种现象。

原因分析：

主要是二者对于字符串的编码不同
python 2.x：
这里写图片描述
python 2.x的字符串是有编码的，默认为ascii，但如果在其中写中文的话，解释器一般会报错，所以都在代码第一行或者第二行规定编码格式：
# -*- coding:utf-8 -*-
想要转换为其他编码，就要进行先解码为unicode再编码的过程。
python 3.x
这里写图片描述
python 3.x的字符串类似python 2.x的unicode，是没有经过编码的，因此python 3.x的字符串没有decode属性，只有encode属性，调用这个方法后将产生bytes类型的字符串（有点像python 2.x中的字符串），而bytes类型支持解码操作。