字符编码的Unicode 怎样查一个字符的unicode编码

\u5b57\u7b26\u7f16\u7801\u4e2dASCII\uff0cUnicode\u548cUTF-8\u7684\u533a\u522b

ASCII\u7801\u4f7f\u7528\u4e00\u4e2a\u5b57\u8282\u7f16\u7801\uff0c\u6240\u4ee5\u5b83\u7684\u8303\u56f4\u57fa\u672c\u662f\u53ea\u6709\u82f1\u6587\u5b57\u6bcd\u3001\u6570\u5b57\u548c\u4e00\u4e9b\u7279\u6b8a\u7b26\u53f7 \uff0c\u53ea\u6709256\u4e2a\u5b57\u7b26\u3002
\u5728\u8868\u793a\u4e00\u4e2aUnicode\u7684\u5b57\u7b26\u65f6\uff0c\u901a\u5e38\u4f1a\u7528\u201cU+\u201d\u7136\u540e\u7d27\u63a5\u7740\u4e00\u7ec4\u5341\u516d\u8fdb\u5236\u7684\u6570\u5b57\u6765\u8868\u793a\u8fd9\u4e00\u4e2a\u5b57\u7b26\u3002\u5728\u57fa\u672c\u591a\u6587\u79cd\u5e73\u9762\uff08\u82f1\u6587\u4e3a Basic Multilingual Plane\uff0c\u7b80\u5199 BMP\u3002\u5b83\u53c8\u7b80\u79f0\u4e3a\u201c\u96f6\u53f7\u5e73\u9762\u201d, plane 0\uff09\u91cc\u7684\u6240\u6709\u5b57\u7b26\uff0c\u8981\u7528\u56db\u4f4d\u5341\u516d\u8fdb\u5236\u6570\uff08\u4f8b\u5982U+4AE0\uff0c\u5171\u652f\u6301\u516d\u4e07\u591a\u4e2a\u5b57\u7b26\uff09\uff1b\u5728\u96f6\u53f7\u5e73\u9762\u4ee5\u5916\u7684\u5b57\u7b26\u5219\u9700\u8981\u4f7f\u7528\u4e94\u4f4d\u6216\u516d\u4f4d\u5341\u516d\u8fdb\u5236\u6570\u4e86\u3002\u65e7\u7248\u7684Unicode\u6807\u51c6\u4f7f\u7528\u76f8\u8fd1\u7684\u6807\u8bb0\u65b9\u6cd5\uff0c\u4f46\u5374\u6709\u4e9b\u5fae\u7684\u5dee\u5f02\uff1a\u5728Unicode 3.0\u91cc\u4f7f\u7528\u201cU-\u201d\u7136\u540e\u7d27\u63a5\u7740\u516b\u4f4d\u6570\uff0c\u800c\u201cU+\u201d\u5219\u5fc5\u987b\u968f\u540e\u7d27\u63a5\u7740\u56db\u4f4d\u6570\u3002
Unicode\u80fd\u591f\u8868\u793a\u5168\u4e16\u754c\u6240\u6709\u7684\u5b57\u8282
GBK\u662f\u53ea\u7528\u6765\u7f16\u7801\u6c49\u5b57\u7684\uff0cGBK\u5168\u79f0\u300a\u6c49\u5b57\u5185\u7801\u6269\u5c55\u89c4\u8303\u300b\uff0c\u4f7f\u7528\u53cc\u5b57\u8282\u7f16\u7801\u3002

UTF-8\uff088-bit Unicode Transformation Format\uff09\u662f\u4e00\u79cd\u9488\u5bf9Unicode\u7684\u53ef\u53d8\u957f\u5ea6\u5b57\u7b26\u7f16\u7801\uff0c\u53c8\u79f0\u4e07\u56fd\u7801\u3002\u7531Ken Thompson\u4e8e1992\u5e74\u521b\u5efa\u3002\u73b0\u5728\u5df2\u7ecf\u6807\u51c6\u5316\u4e3aRFC 3629\u3002UTF-8\u75281\u52306\u4e2a\u5b57\u8282\u7f16\u7801UNICODE\u5b57\u7b26\u3002\u7528\u5728\u7f51\u9875\u4e0a\u53ef\u4ee5\u540c\u4e00\u9875\u9762\u663e\u793a\u4e2d\u6587\u7b80\u4f53\u7e41\u4f53\u53ca\u5176\u5b83\u8bed\u8a00\uff08\u5982\u82f1\u6587\uff0c\u65e5\u6587\uff0c\u97e9\u6587\uff09\u3002

\u4f60\u597d\uff0c\u8bbf\u95eehttps://unicode-table.com/cn/
\u8f93\u5165\u60f3\u8981\u7684\u67e5\u770b\u7684\u5b57\u7b26\uff0c\u7136\u540e\u70b9\u51fb\u641c\u7d22\u56fe\u6807\uff0c\u6700\u540e\u70b9\u51fb\u641c\u7d22\u5230\u7684\u67d0\u4e2a\u7ed3\u679c\u3002\u8fd9\u91cc\u6211\u4eec\u641c\u7d22\u7684\u662f2

\u7136\u540e\u5c31\u53ef\u4ee5\u770b\u5230\u8be5\u5b57\u7b26\u7684\u8be6\u7ec6\u4ecb\u7ecd\u4e86\uff08\u8fd9\u91cc\u53ea\u622a\u53d6\u4e86\u4e00\u90e8\u5206\u4fe1\u606f\uff0c\u4e0b\u9762\u8fd8\u6709\u5f88\u591a\uff0c\u8be6\u7ec6\u53ef\u67e5\u770b\uff1ahttps://unicode-table.com/cn/0032/\uff09




ANSI\u7f16\u7801\u662f\u4e00\u79cd\u5bf9ASCII\u7801\u7684\u62d3\u5c55\uff1aANSI\u7f16\u7801\u75280x00~0x7f \uff08\u5373\u5341\u8fdb\u5236\u4e0b\u76840\u5230127\uff09\u8303\u56f4\u76841 \u4e2a\u5b57\u8282\u6765\u8868\u793a 1 \u4e2a\u82f1\u6587\u5b57\u7b26\uff0c\u8d85\u51fa\u4e00\u4e2a\u5b57\u8282\u7684 0x80~0xFFFF \u8303\u56f4\u6765\u8868\u793a\u5176\u4ed6\u8bed\u8a00\u7684\u5176\u4ed6\u5b57\u7b26\u3002\u4e5f\u5c31\u662f\u8bf4\uff0cANSI\u7801\u4ec5\u5728\u524d128\uff080-127\uff09\u4e2a\u4e0eASCII\u7801\u76f8\u540c\uff0c\u4e4b\u540e\u7684\u5b57\u7b26\u5168\u662f\u67d0\u4e2a\u56fd\u5bb6\u8bed\u8a00\u7684\u6240\u6709\u5b57\u7b26\u3002\u503c\u5f97\u6ce8\u610f\u7684\u662f\uff0c\u4e24\u4e2a\u5b57\u8282\u6700\u591a\u53ef\u4ee5\u5b58\u50a8\u7684\u5b57\u7b26\u6570\u76ee\u662f2\u768416\u6b21\u65b9\uff0c\u537365536\u4e2a\u5b57\u7b26\uff0c\u8fd9\u5bf9\u4e8e\u4e00\u4e2a\u8bed\u8a00\u7684\u5b57\u7b26\u6765\u8bf4\uff0c\u7edd\u5bf9\u591f\u4e86\u3002\u8fd8\u6709ANSI\u7f16\u7801\u5176\u5b9e\u5305\u62ec\u5f88\u591a\u7f16\u7801\uff1a\u4e2d\u56fd\u5236\u5b9a\u4e86GB2312\u7f16\u7801\uff0c\u7528\u6765\u628a\u4e2d\u6587\u7f16\u8fdb\u53bb\u53e6\u5916\uff0c\u628a\u7f16\u5230Shift_JIS\u91cc\uff0c\u97e9\u628a\u97e9\u6587\u7f16\u5230Euc-kr\u91cc\uff0c\u5404\u56fd\u6709\u5404\u56fd\u7684\u6807\u51c6\u3002\u53d7\u5236\u4e8e\u5f53\u65f6\u7684\u6761\u4ef6\uff0c\u4e0d\u540c\u8bed\u8a00\u4e4b\u95f4\u7684ANSI\u7801\u4e4b\u95f4\u4e0d\u80fd\u4e92\u76f8\u8f6c\u6362\uff0c\u8fd9\u5c31\u4f1a\u5bfc\u81f4\u5728\u591a\u8bed\u8a00\u6df7\u5408\u7684\u6587\u672c\u4e2d\u4f1a\u6709\u4e71\u7801\u4ec5\u4f9b\u53c2\u8003

如上ANSI编码条例中所述,世界上存在着多种编码方式,在ANSi编码下,同一个编码值,在不同的编码体系里代表着不同的字。在简体中文系统下,ANSI 编码代表 GB2312 编码,在日文操作系统下,ANSI 编码代表 JIS 编码,可能最终显示的是中文,也可能显示的是日文。在ANSI编码体系下,要想打开一个文本文件,不但要知道它的编码方式,还要安装有对应编码表,否则就可能无法读取或出现乱码。为什么电子邮件和网页都经常会出现乱码,就是因为信息的提供者可能是日文的ANSI编码体系和信息的读取者可能是中文的编码体系,他们对同一个二进制编码值进行显示,采用了不同的编码,导致乱码。这个问题促使了unicode码的诞生。
如果有一种编码,将世界上所有的符号都纳入其中,无论是英文、日文、还是中文等,大家都使用这个编码表,就不会出现编码不匹配现象。每个符号对应一个唯一的编码,乱码问题就不存在了。这就是Unicode编码。
Unicode当然是一个很大的集合,现在的规模可以容纳100多万个符号。每个符号的编码都不一样,比如,U+0639表示阿拉伯字母Ain,U+0041表示英语的大写字母A,“汉”这个字的Unicode编码是U+6C49。
Unicode固然统一了编码方式,但是它的效率不高,比如UCS-4(Unicode的标准之一)规定用4个字节存储一个符号,那么每个英文字母前都必然有三个字节是0,这对存储和传输来说都很耗资源。



  • Unicode鏄粈涔???
    绛旓細Unicode锛堢粺涓鐮併佷竾鍥界爜銆佸崟涓鐮侊級鏄绠楁満绉戝棰嗗煙閲岀殑涓椤逛笟鐣屾爣鍑嗭紝鍖呮嫭瀛楃闆銆佺紪鐮佹柟妗堢瓑銆俇nicode 鏄负浜嗚В鍐充紶缁熺殑瀛楃缂栫爜鏂规鐨勫眬闄愯屼骇鐢熺殑锛屽畠涓烘瘡绉嶈瑷涓殑姣忎釜瀛楃璁惧畾浜嗙粺涓骞朵笖鍞竴鐨勪簩杩涘埗缂栫爜锛屼互婊¤冻璺ㄨ瑷銆佽法骞冲彴杩涜鏂囨湰杞崲銆佸鐞嗙殑瑕佹眰銆1990骞村紑濮嬬爺鍙戯紝1994骞存寮忓叕甯冦俇nicode閫氬父...
  • 鏈閫氱敤鐨瀛楃缂栫爜
    绛旓細鏈閫氱敤鐨瀛楃缂栫爜鏄Unicode锛堢粺涓鐮侊級銆俇nicode锛屽叏绉颁负Universal Multiple-Octet Coded Character Set锛屽嵆“缁熶竴澶氬叓浣嶇紪鐮瀛楃闆”锛屽畠涓烘瘡绉嶈瑷涓殑姣忎釜瀛楃璁惧畾浜嗙粺涓骞朵笖鍞竴鐨勪簩杩涘埗缂栫爜锛屼互婊¤冻璺ㄨ瑷銆佽法骞冲彴杩涜鏂囨湰杞崲銆佸鐞嗙殑瑕佹眰銆俇nicode鐢ㄦ暟瀛0-0x10FFFF鏉ユ槧灏勪笘鐣屼笂鎵鏈夋枃瀛楀拰绗﹀彿...
  • unicode瀛楃闆鏄竴绉嶅嚑浣嶇殑瀛楃缂栫爜鏍囧噯
    绛旓細Unicode瀛楃闆鏄竴绉16浣嶇殑瀛楃缂栫爜鏍囧噯锛屼絾涔熷彲浠ユ敮鎸佸埌32浣嶏紝浠ラ傚簲鏇村鐨勫瓧绗﹀拰绗﹀彿銆俇nicode锛屽叏绉颁负Universal Multiple-Octet Coded Character Set锛屽嵆“缁熶竴鐮併佷竾鍥界爜銆佸崟涓鐮”锛屽畠涓烘瘡绉嶈瑷涓殑姣忎釜瀛楃璁惧畾浜嗙粺涓骞朵笖鍞竴鐨勪簩杩涘埗缂栫爜锛屼互婊¤冻璺ㄨ瑷銆佽法骞冲彴杩涜鏂囨湰杞崲銆佸鐞嗙殑瑕佹眰銆
  • uni code缂栫爜鏄粈涔堢爜
    绛旓細Unicode鏄浗闄呯粍缁囧埗瀹氱殑鍙互瀹圭撼涓栫晫涓婃墍鏈夋枃瀛楀拰绗﹀彿鐨瀛楃缂栫爜鏂规銆俇nicode鐢ㄦ暟瀛0-0x10FFFF鏉ユ槧灏勮繖浜涘瓧绗︼紝鏈澶氬彲浠ュ绾1114112涓瓧绗︼紝鎴栬呰鏈1114112涓爜浣嶃傜爜浣嶅氨鏄彲浠ュ垎閰嶇粰瀛楃鐨勬暟瀛椼俇TF-8銆乁TF-16銆乁TF-32閮芥槸灏嗘暟瀛楄浆鎹㈠埌绋嬪簭鏁版嵁鐨勭紪鐮佹柟妗堛傝瑙佺櫨搴︾櫨绉戙
  • 浠涔堟槸Unicode缂栫爜?
    绛旓細Unicode鏄浗闄呯粍缁囧埗瀹氱殑鍙互瀹圭撼涓栫晫涓婃墍鏈夋枃瀛楀拰绗﹀彿鐨瀛楃缂栫爜鏂规銆傜洰鍓鐨刄nicode瀛楃鍒嗕负17缁勭紪鎺掞紝0x0000鑷0x10FFFF锛屾瘡缁勭О涓哄钩闈紙Plane锛夛紝鑰屾瘡骞抽潰鎷ユ湁65536涓爜浣嶏紝鍏1114112涓備富瑕佸唴瀹 涓轰簡浣縐nicode涓庡凡瀛樺湪鍜屽箍娉涗娇鐢ㄧ殑鏃ф湁缂栫爜浜掔浉鍏煎锛屽挨鍏舵槸宸笉澶氭墍鏈夌數鑴戠郴缁熼兘鏀彺鐨勫熀鏈媺涓佸瓧姣嶉儴鍒嗭紝...
  • 浠涔堟槸unicode缂栫爜?
    绛旓細unicode缂栫爜锛岀紪鐮佹槸淇℃伅浠庝竴绉嶅舰寮忔垨鏍煎紡杞崲涓哄彟涓绉嶅舰寮忕殑杩囩▼涔熺О涓鸿绠楁満缂栫▼璇█鐨勪唬鐮佺畝绉扮紪鐮併傚洜涓1浣嶄簩杩涘埗鏁板彲浠ヨ〃绀猴紙2^1=锛2绉嶇姸鎬侊細0銆1锛涜2浣嶄簩杩涘埗鏁板彲浠ヨ〃绀猴紙2^2锛=4绉嶇姸鎬侊細00銆01銆10銆11锛涗緷娆$被鎺紝7浣嶄簩杩涘埗鏁板彲浠ヨ〃绀猴紙2^7=锛128绉嶇姸鎬侊紝姣忕鐘舵侀兘鍞竴鍦扮紪涓轰竴涓7...
  • unicode缂栫爜鏄粈涔堟剰鎬
    绛旓細鍦ˋSCII涓細鑻辨枃瀛楃鍗犱竴涓紪鐮佷綅缃紙鍗曞瓧鑺傦級锛岃屼腑鏂囧氨瑕佸崰涓や釜浣嶇疆锛堝弻瀛楄妭锛変簡鍦║nicode涓細鑻辨枃涓枃閮芥槸鍗犱袱涓紪鐮佷綅缃紙鍙屽瓧鑺傦級锛岀幇鍦ㄧ殑鎿嶄綔绯荤粺鐢ㄧ殑閮芥槸Unicode缂栫爜锛屾墍浠ヨ繖鏃朵腑鏂囧氨涓嶇敤杩涜杞崲涓哄崟瀛楄妭杩涜杩愯浜嗭紝鏁堢巼灏辨彁楂樹簡锛涙渶閲嶈鐨勪竴鐐规槸Unicode鍑犱箮鏀寔鎵鏈夌殑璇█缂栫爜锛屾墍浠ャ傘傘
  • \u4f60\u4e2a\u50bb\u903c浠涔堟剰鎬?
    绛旓細鏄Unicode鐮銆傝浆涔夋垚涓枃鏄細浣犱釜xx銆傛槸鍙ヨ剰璇濄俇nicode鏄负浜嗚В鍐充紶缁熺殑瀛楃缂栫爜鏂规鐨勫眬闄愯屼骇鐢熺殑銆傚畠涓烘瘡绉嶈瑷涓殑姣忎釜瀛楃璁惧畾浜嗙粺涓骞朵笖鍞竴鐨勪簩杩涘埗缂栫爜锛屼互婊¤冻璺ㄨ瑷銆佽法骞冲彴杩涜鏂囨湰杞崲銆佸鐞嗙殑瑕佹眰銆1990骞村紑濮嬬爺鍙戯紝1994骞存寮忓叕甯冦
  • \ u5927\ u732a\ u8e44\ u5b50鏄粈涔堟剰鎬?
    绛旓細\u5927\u732a\u8e44\u5b50鐨勬剰鎬濇槸澶х尓韫勫瓙銆傝繖鏄疷nicode鐮侊紙涓囧浗鐮併佺粺涓鐮侊級涓滃ぇ鐚箘瀛愨濊繖鍥涗釜瀛楃殑缂栫爜銆倁5927锛堝ぇ锛夛紝u732a锛堢尓锛夛紝u8e44锛堣箘锛夛紝u5b50锛堝瓙锛夈傚湪浠ュ墠鐨勫井淇$増鏈腑锛屽井淇$殑缈昏瘧鍔熻兘鍙互缈昏瘧Unicode鐮侊紝鎵浠ュ氨鏈変竴閮ㄤ汉閫氳繃鍙戦佹眽瀛鐨刄nicode鐮鏉ヤ氦娴侊紝鐜板湪鐨勭増鏈笉鏀寔杩欎竴...
  • 瀛楃闆嗙紪鐮(涓):Unicode 涔嬪墠
    绛旓細鍦ㄤ笢浜氬競鍦猴紝姹夊瓧缂栫爜濡係hift JIS銆丅ig5鍜孏B 2312鍚勫叿鐗硅壊锛孏B 2312鏈鍒濇敮鎸6763涓眽瀛楋紝鍙屽瓧鑺傜紪鐮佷娇鍏跺湪鍏煎ASCII鐨勫悓鏃跺绾虫洿澶瀛楃銆傜劧鑰岋紝闅忕潃姹夊瓧闇姹傜殑澧炲姞锛孏BK鍜孏B 18030鐩哥户鎺ㄥ嚭锛屽墠鑰呮墿灞曚簡姹夊瓧鑼冨洿锛屽悗鑰呭垯鍏ㄩ潰瀵规帴Unicode锛屾棬鍦ㄦ彁渚涙洿涓哄叏闈㈢殑瀛楃鏀寔銆傚敖绠nicode鍜屾爣鍑嗗寲缂栫爜濡侴B 18030鐨勫彂灞...
  • 扩展阅读:unicode字符大全查询 ... unicode编码区对照表 ... 不属于unicode编码的是 ... 在线unicode编码转换 ... unicode字符代码大全 ... unicode在线编码解码 ... unicode在线转码中文 ... 汉字转unicode编码 ... 26个字母的unicode编码 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网