Python如何将Unicode中文字符串转换成 string字符串

Unicode字符串可以用多种方式编码为普通字符串，假设unicodestring = u"Hello world"，依照所选择的编码(encoding)，如下：

1、#将Unicode转换成普通的Python字符串:"编码(encode)"。

2、 #将普通的Python字符串转换成Unicode: "解码(decode)"。

扩展资料：

Python转换字符和字符串的原因：为了处理不适合用ASCII字符集表示的数据。

在以ASCII码为中心的语言和环境中，字节和字符被当做相同的事物。由于一个字节只能有256个值，这些环境就受限为只支持256个字符Unicode码，另一方面，有数万个字符，那意谓着每个Unicode字符占用多个字节，因此，你需要在字符和字节之间作出区别。

（1）UTF-8编码能处理任何的Unicode字符。它也是与ASCII码向后兼容的，因此一个纯粹的ASCII码文件也能被考虑为一个UTF-8文件，而且一个碰巧只使用ASCII码字符的 UTF-8文件和拥有同样字符的ASCII码文件是相同的。

这个特性使得UTF-8的向后兼容性非常好,尤其使用较旧的Unix工具时。UTF-8 无疑地是在 Unix上的占优势的编码。它主要的弱点是对东方文字是非常低效的。

（2）UTF-16编码在微软的操作系统和Java环境下受到偏爱。它对西方语言是比较低效,但对于东方语言是更有效率的。一个UTF-16 的变体有时叫作UCS-2 。

（3）ISO-8859编码系列是256个字符的ASCII码的超集。他们不能够支援所有的Unicode码字符;他们只能支援一些特别的语言或语言家族。

ISO-8859-1,也既Latin-1,包括大多数的西欧和非洲语言,但是不含阿拉伯语。ISO-8859-2,也既Latin-2,包括许多东欧的语言,像是匈牙利语和波兰语。

参考资料：

百度百科--Unicode

python ,unicode鐮鎬庝箞杞垚涓枃瀛楃涓,闄勫肩粰鍏朵粬鍙橀噺
绛旓細decode瑙ｇ爜鍚庡湪encode缂栫爜锛屼綘鐨勭紪璇戠幆澧冩槸utf-8鐨勮瘽閭ｅ氨鏄 a.decode('gbk').encode('utf-8')

鏂囦欢閲屽啓鐨勬槸unicode,鐢python鎬庝箞璇诲彇鎴愭枃鏈
绛旓細鍏堣鍒板唴瀛橈紝鐒跺悗鏍规嵁鑴氭湰褰撳墠缂栫爜decode锛岀劧鍚庡啀encode鎴愪綘鎯宠鐨勭紪鐮 eg锛氬亣璁緍eadString鏄綘璇诲嚭鏉ョ殑瀛楃涓诧紝浣犳兂杞垚gb2312 -*- coding: utf-8 -*- readString.decode('utf-8').encode('gb2312') #褰撳墠鑴氭湰缂栫爜涓簎tf-8

python鎬庝箞鎶妘nicode鐨勭紪鐮佹墦鎴愭眽瀛
绛旓細浣犳槸鍦↖DLE鎺у埗鍙帮紝杩樻槸cmd锛岃繕鏄湪sublime閲屽憿 IDLE瀵逛腑鏂囩殑鏀寔鏈夐棶棰橈紝榛樿鏄疉SCII鐮侊紝鎵浠ョ敤缂栫爜瑙ｇ爜浼氭湁闂銆傚鏋滄槸cmd鎴杝ublime鎴栨枃浠剁殑褰㈠紡锛屽彧瑕佸湪鏂囦欢寮濮嬫寚瀹氬ソ缂栫爜锛岀劧鍚庡氨ok鍟

鎬庢牱灏唘nicode缂栫爜杞崲涓轰腑鏂
绛旓細1銆python2涓巔ython3绋嶅井鏈夌偣鍖哄埆 2銆乸ython2涓粯璁ょ殑瀛楃缂栫爜鏍煎紡閮芥槸unicode,鍦ㄥ瓧绗︿覆鍓嶅姞'u'锛岃〃绀簎nicode 缂栫爜 3銆灏唘nicode杞崲鎴愪腑鏂囷紝鍙渶瑕佺敤deconde瑙ｇ爜灏卞彲浠ヤ簡 >>> u='娆㈣繋'>>> e=u.encode()>>> e b'\xe6\xac\xa2\xe8\xbf\x8e'>>> e.decode()#python3涓粯璁ゅ氨鏄痷tf-8...

Python涓浣杈撳叆鎽勬皬娓╁害鐨勭鍙?
绛旓細鍦Python涓锛屾垜浠彲浠ヤ娇鐢Unicode瀛楃鏉ヨ緭鍏ユ憚姘忓害绗﹀彿锛屽嵆掳C銆備唬鐮佸涓嬶細celsius = 25print(str(celsius) + "\u2103")杈撳嚭缁撴灉灏嗕负锛25鈩鍦ㄤ笂杩颁唬鐮佷腑锛孿u2103 鏄鍙封剝鐨刄nicode缂栫爜锛岄氳繃灏嗗叾娣诲姞鍒板瓧绗︿覆涓紝鎴戜滑鍙互鍦ㄦ帶鍒跺彴杈撳嚭鎽勬皬搴︾鍙枫

pythonUnicodeEncodeError>鎴鎬庝箞鑳界畝鍗曞湴鍘绘帀鍥版壈unicode瀛楃_鐧惧害鐭 ...
绛旓細1銆python2涓巔ython3绋嶅井鏈夌偣鍖哄埆 2銆乸ython2涓粯璁ょ殑瀛楃缂栫爜鏍煎紡閮芥槸unicode,鍦ㄥ瓧绗︿覆鍓嶅姞'u'锛岃〃绀簎nicode 缂栫爜 3銆灏唘nicode杞崲鎴愪腑鏂囷紝鍙渶瑕佺敤deconde瑙ｇ爜灏卞彲浠ヤ簡 >>> u='娆㈣繋'>>> e=u.encode()>>> eb'\xe6\xac\xa2\xe8\xbf\x8e'>>> e.d......

...python,灏嗗瓧绗︿覆杞寲涓 \u XXXX 鐨勫瓧绗︿覆(unicode)
绛旓細print(u'浣犲ソ'.__repr__())

python 濡備綍瑙ｇ爜unicode鏄庢枃
绛旓細s鏄瓧绗︿覆s = '袪褍褋褋泻懈泄褟蟹褘泻'#鎵撳嵃s瀵瑰簲鐨unicode鐮乸rint(s.encode('unicode_escape').decode('utf-8'))#a鏄痷nicode鐮乤 = r'\u0420\u0443\u0441\u0441\u043a\u0438\u0439 \u044f\u0437\u044b\u043a'#鎵撳嵃a瀵瑰簲鐨勫瓧绗︿覆print(a.encode("utf-8").decode('unicode_...

鎬庝箞鐢python璇█杈撳叆涓涓瓧姣嶇殑鐩搁偦涓や釜瀛楁瘝
绛旓細1銆侀鍏堝皢杩欎釜瀛楁瘝浣跨敤ord()鏂规硶杞负unicode鐮侊紱2銆佸皢寰楀埌鐨剈nicode鐮佸垎鍒姞涓鍑忎竴鍗冲彲寰楀埌涓や釜鐩搁偦瀛楁瘝鐨剈nicode鐮侊紱3銆佸皢涓や釜瀛楁瘝鐨剈nicode鐮佷娇鐢╟hr()鏂规硶杞寲涓哄瓧姣嶆牸寮忓嵆鍙Python鐢辫嵎鍏版暟瀛﹀拰璁＄畻鏈虹瀛︾爺绌跺浼氱殑鍚夊路鑼冪綏鑻忓浜1990骞翠唬鍒濊璁★紝浣滀负涓闂ㄥ彨鍋欰BC璇█鐨勬浛浠ｅ搧銆

python print鍑unicode鐮鎬庝箞鍔
绛旓細鍒欒緭鍑哄埌GBK鐨勫懡浠よ鏃讹紝Python浼氳嚜鍔灏哢nicode鐨勫瓧绗︿覆锛岀紪鐮佷负GBK锛岀劧鍚庢纭樉绀哄瓧绗 decodedUnicodeChar = cnUtf8Char.decode("UTF-8"); print "decodedUnicodeChar=",decodedUnicodeChar; #decodedUnicodeChar= 鎴戞槸UTF-8鐨勪腑鏂囧瓧绗︿覆 #2. 璁╁瓧绗︿覆鐨勭紪鐮佸拰杈撳叆鐩爣锛坵indows鐨刢md锛夌殑缂栫爜...

扩展阅读：pubmed官方官网入口 ... 樱花乳液官方网页版 ... photoshop免费网站入口 ... python免费源码网站 ... photoshop永久免费版 ... javascript在线 ... python手机版下载安装 ... python在线网站 ... wordpress免费网站 ...

车视网

Python如何将Unicode中文字符串转换成 string字符串