python默认是unicode编码 字符串默认是unicode
编码就是将unicode编码字符串转换为gbk或者utf-8的编码
解码,就是将原本是gbk或Utf-8编码得字符串转换为unicode编码
cs = '我是一个测试'.encode('utf-8') print(cs) #b'\xe6\x88\x91\xe6\x98\xaf\xe4\xb8\x80\xe4\xb8\xaa\xe6\xb5\x8b\xe8\xaf\x95' aa =cs.decode('utf-8') print(aa) #我是一个测试
判断字符串的编码
import chardet jiancha = chardet.detect(cs) print(jiancha) #{'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
判断一个字符是否为字符串
cs1 = '我是一个字符串' jg = isinstance(cs1,str) print(jg) #True
url编码格式转换为utf或者其他格式
from urllib import parse cs2 ='我是一个' qs = parse.quote(cs2) print(qs) #%E6%88%91%E6%98%AF%E4%B8%80%E4%B8%AA print(parse.unquote(qs)) #我是一个
data = {'name':'zcy','age':27} #urlencode可以将字典数据转换成url编码数据 qs1 = parse.urlencode(data) print(qs1) #parse_qs将经过编码得url参数进行解码 print(parse.parse_qs(qs1))