unicode字符集是多少位的字符编码 Unicode字符集采用几个字节来表示一个字符?

unicode\u5b57\u7b26\u96c6\u662funicode\u8054\u76df\u5f00\u53d1\u7684\u4e00\u79cd\u591a\u5c11\u4f4d\u5b57\u7b26\u7f16\u7801\u6807\u51c6

ASCII\uff1a
7\u4f4d\u5b57\u7b26\u96c6\uff0c\u5305\u62ec52\u4e2a\u5927\u5c0f\u5199\u82f1\u8bed\u5b57\u6bcd\uff0c10\u4e2a\u963f\u62c9\u4f2f\u6570\u5b57\uff0c1\u4e2a\u7a7a\u683c\uff0c32\u4e2a\u7b26\u53f7\u3002
\u9002\u7528\u4e8e\u7eaf\u82f1\u6587\u73af\u5883\uff0c\u517c\u5bb9\u6027\u6700\u597d\uff0c\u5728\u5176\u4ed6\u5404\u79cd\u5b57\u7b26\u96c6\u4e0b\u90fd\u80fd\u6b63\u786e\u8bc6\u522b\uff1b\u4e0d\u9002\u7528\u4e8e\u82f1\u8bed\u4ee5\u5916\u7684\u73af\u5883\u3002

Latin1\uff08ISO-8859-1\uff09\uff1a8\u4f4d\u5b57\u7b26\u96c6\uff0c\u5411\u4e0b\u517c\u5bb9ASCII\u5b57\u7b26\u96c6\uff0c\u5e76\u589e\u52a0\u4e86\u4e00\u4e9b\u897f\u6b27\u8bed\u8a00\u4e2d\u7684\u5b57\u6bcd\u548c\u7b26\u53f7\u3002
\u4f18\u70b9\uff1a\u9002\u7528\u4e8e\u897f\u6b27\u8bed\u79cd\uff0c\u5f97\u5230\u4e16\u754c\u5e7f\u6cdb\u7684\u8f6f\u4ef6\u652f\u6301\uff1b
\u7f3a\u70b9\uff1a\u4e0d\u80fd\u8868\u793a\u62c9\u4e01\u8bed\u7cfb\u4ee5\u5916\u7684\u8bed\u8a00\uff0c\u4e0d\u517c\u5bb9\u5c11\u91cf\u53ea\u4f7f\u75287\u4f4d\u5b57\u7b26\u96c6\u7684\u53e4\u8001\u7a0b\u5e8f\u3002

GB2312\uff1a16\u4f4d\u5b57\u7b26\u96c6\uff0c\u6536\u5f55\u67096763\u4e2a\u7b80\u4f53\u6c49\u5b57\uff0c682\u4e2a\u7b26\u53f7\uff1b
\u4f18\u70b9\uff1a\u9002\u7528\u4e8e\u7b80\u4f53\u4e2d\u6587\u73af\u5883\uff0c\u5c5e\u4e8e\u4e2d\u56fd\u56fd\u5bb6\u6807\u51c6\uff0c\u5728\u5927\u9646\uff08\u548c\u65b0\u52a0\u5761\uff1f\uff09\u5f97\u5230\u5e7f\u6cdb\u652f\u6301\uff1b
\u7f3a\u70b9\uff1a\u4e0d\u517c\u5bb9\u7e41\u4f53\u4e2d\u6587\uff0c\u5176\u6c49\u5b57\u96c6\u5408\u8fc7\u5c11\u3002

big5\uff1a16\u4f4d\u5b57\u7b26\u96c6\uff0c\u6536\u5f55\u670913060\u4e2a\u7e41\u4f53\u6c49\u5b57\uff0c440\u4e2a\u7b26\u53f7\uff1b
\u4f18\u70b9\uff1a\u9002\u7528\u4e8e\u7e41\u4f53\u4e2d\u6587\u73af\u5883\uff0c\u5c5e\u4e8e\u53f0\u6e7e\u5b98\u65b9\u6807\u51c6\uff0c\u4e3a\u7e41\u4f53Windows\u6240\u4f7f\u7528\uff0c\u5728\u53f0\u6e7e\u548c\u9999\u6e2f\u5f97\u5230\u5e7f\u6cdb\u652f\u6301\uff0c\u800c\u4e14\uff0c\u7531\u4e8e\u53f0\u6e7e\u8f6f\u4ef6\u4e1a\u53d1\u5c55\u8f83\u65e9\uff0c\u56fd\u5916\u8f6f\u4ef6\u652f\u6301big5\u7684\u6bd4\u652f\u6301gb2312/gbk\u7684\u8981\u591a\uff1b
\u7f3a\u70b9\uff1a \u4e0d\u517c\u5bb9\u7b80\u4f53\u4e2d\u6587\u73af\u5883\uff0c\u548cgb2312\u4e4b\u95f4\u9700\u8981\u8f6c\u6362\u3002

GBK\uff1a16\u4f4d\u5b57\u7b26\u96c6\uff0c\u6536\u5f55\u670921003\u4e2a\u6c49\u5b57\uff0c883\u4e2a\u7b26\u53f7\uff1b
\u4f18\u70b9\uff1a\u9002\u7528\u4e8e\u7b80\u7e41\u4e2d\u6587\u5171\u5b58\u7684\u73af\u5883\uff0c\u4e3a\u7b80\u4f53Windows\u6240\u4f7f\u7528\uff08\u4ee3\u7801\u9875cp936\uff09\uff0c\u5411\u4e0b\u5b8c\u5168\u517c\u5bb9gb2312\uff1b \u7f3a\u70b9\uff1a\u4e0d\u5c5e\u4e8e\u5b98\u65b9\u6807\u51c6\uff0c\u548cbig5\u4e4b\u95f4\u9700\u8981\u8f6c\u6362\u3002

Unicode \u662f\u6709\u4e24\u4e2a\u5b57\u8282\u3001\u56db\u5b57\u8282\u4e4b\u533a\u5206\uff0cUCS-4\u75284\u4e2a\u5b57\u8282\u7f16\u7801\uff0c\u53ef\u8868\u793a2\u768432\u6b21\u65b9\uff0c\u53734294967296\u79cd\u5b57\u7b26\u3002
Unicode\uff08\u7edf\u4e00\u7801\u3001\u4e07\u56fd\u7801\u3001\u5355\u4e00\u7801\uff09\u662f\u8ba1\u7b97\u673a\u79d1\u5b66\u9886\u57df\u91cc\u7684\u4e00\u9879\u4e1a\u754c\u6807\u51c6,\u5305\u62ec\u5b57\u7b26\u96c6\u3001\u7f16\u7801\u65b9\u6848\u7b49\u3002Unicode \u662f\u4e3a\u4e86\u89e3\u51b3\u4f20\u7edf\u7684\u5b57\u7b26\u7f16\u7801\u65b9\u6848\u7684\u5c40\u9650\u800c\u4ea7\u751f\u7684\uff0c\u5b83\u4e3a\u6bcf\u79cd\u8bed\u8a00\u4e2d\u7684\u6bcf\u4e2a\u5b57\u7b26\u8bbe\u5b9a\u4e86\u7edf\u4e00\u5e76\u4e14\u552f\u4e00\u7684\u4e8c\u8fdb\u5236\u7f16\u7801\uff0c\u4ee5\u6ee1\u8db3\u8de8\u8bed\u8a00\u3001\u8de8\u5e73\u53f0\u8fdb\u884c\u6587\u672c\u8f6c\u6362\u3001\u5904\u7406\u7684\u8981\u6c42\u3002
\u901a\u7528\u5b57\u7b26\u96c6\uff08Universal Character Set, UCS\uff09\u662f\u7531ISO\u5236\u5b9a\u7684ISO 10646\uff08\u6216\u79f0ISO/IEC 10646\uff09\u6807\u51c6\u6240\u5b9a\u4e49\u7684\u6807\u51c6\u5b57\u7b26\u96c6\u3002UCS-2\u7528\u4e24\u4e2a\u5b57\u8282\u7f16\u7801\uff0cUCS-4\u75284\u4e2a\u5b57\u8282\u7f16\u7801\u3002

unicode编码用2个字节存储字符。

2个字节=16个bit,即16位二进制编码。

注意:一个bit=一位二进制。

最初的unicode编码是固定长度的,16位,也就是2两个字节代表一个字符,这样一共可以表示65536个字符。显然,这样要表示各种语言中所有的字符是远远不够的。

Unicode4.0规范考虑到了这种情况,定义了一组附加字符编码,附加字符编码采用2个16位来表示,这样最多可以定义1048576个附加字符,目前unicode4.0只定义了45960个附加字符。

扩展资料:

字母和数字的 ASCII 码的记忆是非常简单的。我们只要记住了一个字母或数字的 ASCII 码(例如记住 A 为 65 , 0 的 ASCII 码为 48 ),知道相应的大小写字母之间差 32 ,就可以推算出其余字母、数字的 ASCII 码。

虽然标准 ASCII 码是 7 位编码,但由于计算机基本处理单位为字节( 1byte = 8bit ),所以一般仍以一个字节来存放一个 ASCII 字符。每一个字节中多余出来的一位(最高位)在计算机内部通常保持为 0 (在数据传输时可用作奇偶校验位)。

参考资料来源:百度百科-字符编码



Unicode用4个字节,数字0-0x10FFFF来映射字符,有1114112个码位。码位就是可以分配给字符的数字。全世界的字符加起来也用不了所有的码位。

  • unicode瀛楃闆嗘槸涓绉鍑犱綅鐨瀛楃缂栫爜鏍囧噯
    绛旓細Unicode瀛楃闆嗘槸涓绉16浣嶇殑瀛楃缂栫爜鏍囧噯锛屼絾涔熷彲浠ユ敮鎸佸埌32浣嶏紝浠ラ傚簲鏇村鐨勫瓧绗﹀拰绗﹀彿銆俇nicode锛屽叏绉颁负Universal Multiple-Octet Coded Character Set锛屽嵆“缁熶竴鐮併佷竾鍥界爜銆佸崟涓鐮”锛屽畠涓烘瘡绉嶈瑷涓殑姣忎釜瀛楃璁惧畾浜嗙粺涓骞朵笖鍞竴鐨勪簩杩涘埗缂栫爜锛屼互婊¤冻璺ㄨ瑷銆佽法骞冲彴杩涜鏂囨湰杞崲銆佸鐞嗙殑瑕佹眰銆
  • unicode瀛楃闆嗘槸unicode鑱旂洘寮鍙戠殑涓绉嶄粈涔浣嶅瓧绗
    绛旓細64浣嶅瓧绗銆倁nicode瀛楃闆嗘槸unicode鑱旂洘寮鍙戠殑涓绉64浣嶅瓧绗︺倁nicode瀛楃闆嗘槸涓涓粺涓瀛楃闆嗭紝鏁村悎涓栫晫涓婃墍鏈夐渶瑕佺敤鍒扮殑瀛楃锛岃В鍐充笉鍚屽瓧绗﹂泦涔嬮棿鏃犳硶閫氳鐨勯棶棰樸
  • unicode瀛楃闆嗘槸澶氬皯浣嶇殑瀛楃缂栫爜
    绛旓細鏈鍒濈殑unicode缂栫爜鏄浐瀹氶暱搴︾殑锛16浣锛屼篃灏辨槸2涓や釜瀛楄妭浠h〃涓涓瓧绗︼紝杩欐牱涓鍏卞彲浠ヨ〃绀65536涓瓧绗︺傛樉鐒讹紝杩欐牱瑕佽〃绀哄悇绉嶈瑷涓墍鏈夌殑瀛楃鏄繙杩滀笉澶熺殑銆俇nicode4.0瑙勮寖鑰冭檻鍒颁簡杩欑鎯呭喌锛屽畾涔変簡涓缁勯檮鍔犲瓧绗︾紪鐮侊紝闄勫姞瀛楃缂栫爜閲囩敤2涓16浣嶆潵琛ㄧず锛岃繖鏍锋渶澶氬彲浠ュ畾涔1048576涓檮鍔犲瓧绗︼紝鐩墠unicode4.0鍙...
  • Unicode鏄鐢澶氬皯浣鏉ヨ〃绀轰竴涓瓧鐨?
    绛旓細16浣銆備竴鍒板洓涓瓧鑺傝〃绀轰竴涓瓧绗︼紝utf-8鏄竴鍒颁袱涓瓧鑺傦紝涓轰簡鏄剧ず浜氭床鐨勭瓑瀛楃锛屾瘮濡備腑鏂囷紝鏃ユ枃锛屾墍浠ヨ鐢╱nicode锛寀tf-8鏄痷nicode鐨勪竴绉嶃俇nicode锛堢粺涓鐮併乥ai涓囧浗鐮併佸崟涓鐮侊級鏄绠楁満绉戝棰嗗煙閲岀殑涓椤逛笟鐣屾爣鍑,鍖呮嫭瀛楃闆嗐佺紪鐮佹柟妗堢瓑銆俇nicode 鏄负浜嗚В鍐充紶缁熺殑瀛楃缂栫爜鏂规鐨勫眬闄愯屼骇鐢熺殑锛屽畠涓烘瘡...
  • Unicode(utf-8) 鏄粈涔堟剰鎬?
    绛旓細8浣Unicode杞崲鏍煎紡锛圲TF-8锛夋槸涓绉嶇敤浜庣紪鐮佸悇绉嶅瓧绗︾殑鐩稿杈冩柊鐨勪唬鐮佺害瀹氥傚畠鏄瓧绗︽爣璇嗙殑鏍囧噯锛屼篃鏄悇绉嶇紪绋嬭瑷鍜岃澶囩殑鍙傝冿紝鏈夊姪浜庢爣鍑嗗寲瀛楁瘝锛屾暟瀛楀拰鍏朵粬瀛楃鐨勬樉绀恒傚湪璁稿鎯呭喌涓嬶紝UTF-8鍙栦唬浜嗕竴绉嶅悕涓虹編鍥戒俊鎭氦鎹㈡爣鍑嗙爜锛圓SCII锛夌殑鏃х害瀹氥侫SCII澶勭悊鑻辫璇█鏂囨湰鎵闇鐨勬墍鏈夊瓧绗︼紝浣哢TF-8涓轰笉...
  • unicode瀛楃闆嗘槸鍑犱綅鐨瀛楃缂栫爜琛
    绛旓細Unicode鐢4涓瓧鑺傦紝鏁板瓧0-0x10FFFF鏉ユ槧灏勫瓧绗︼紝鏈1114112涓爜浣嶃傜爜浣嶅氨鏄彲浠ュ垎閰嶇粰瀛楃鐨鏁板瓧銆傚叏涓栫晫鐨勫瓧绗﹀姞璧锋潵涔熺敤涓嶄簡鎵鏈夌殑鐮佷綅銆
  • 浠涔堟槸USC-2(Unicode)缂栫爜鏍囧噯?
    绛旓細鐩墠Unicode鏄噰鐢16浣缂栫爜浣撶郴銆傚叾瀛楃闆嗗唴瀹逛笌ISO10646鐨凚MP锛圔asic Multilingual Plane锛夌浉鍚屻俇nicode浜1992骞6鏈堥氳繃DIS锛圖raf International Standard锛夈傜洰鍓嶇増鏈琕2.0浜1996鍏竷銆傚唴瀹瑰寘鍚鍙6811涓傛眽瀛20902涓傞煩鏂囨嫾闊11172涓傞犲瓧鍖6400涓備繚鐣20249涓傚叡璁65534涓傞殢鐫鍥介檯浜掕仈缃戠殑杩呴熷彂灞...
  • 浠涔堟槸UNICODE
    绛旓細Unicode瀛楃闆鍙互绠鍐欎负UCS锛圲nicode Character Set锛夈傛棭鏈熺殑Unicode鏍囧噯鏈塙CS-2銆乁CS-4鐨勮娉曘俇CS-2鐢ㄤ袱涓瓧鑺傜紪鐮侊紝UCS-4鐢4涓瓧鑺傜紪鐮併俇CS-4鏍规嵁鏈楂樹綅涓0鐨勬渶楂樺瓧鑺傚垎鎴2^7=128涓猤roup銆傛瘡涓猤roup鍐嶆牴鎹楂樺瓧鑺傚垎涓256涓钩闈紙plane锛夈傛瘡涓钩闈㈡牴鎹3涓瓧鑺傚垎涓256琛 锛坮ow锛夛紝姣忚鏈...
  • 鍒ㄦ牴绌跺簳瀛楃缂栫爜涔嬪叓鈥斺Unicode缂栫爜鏂规姒傝堪
    绛旓細UCS瀛楃闆嗗垯琛嶇敓鍑篣CS-2鍜孶CS-4锛屽叾涓璘CS-2宸查愭笎琚窐姹帮紝UCS-4涓嶶TF-32鍩烘湰绛変环銆傛瘡涓瓧绗﹂兘鏈夊叾鐙竴鏃犱簩鐨勭爜鐐瑰煎拰鍚嶇О锛屽U+0041浠h〃澶у啓瀛楁瘝A锛孶+4E25鍒欏搴旀眽瀛椻滀弗鈥濄傚煎緱涓鎻愮殑鏄紝Unicode缂栫爜涓嶢SCII瀛楃闆嗙殑鍗佽繘鍒0~127鏄竴鑷寸殑锛岃孶+0000~U+00FF鍒欎笌ISO/IEC 8859-1锛堟媺涓-1锛...
  • Unicode鏄浠涔???
    绛旓細Unicode锛堢粺涓鐮併佷竾鍥界爜銆佸崟涓鐮侊級鏄绠楁満绉戝棰嗗煙閲岀殑涓椤逛笟鐣屾爣鍑嗭紝鍖呮嫭瀛楃闆銆佺紪鐮佹柟妗堢瓑銆俇nicode 鏄负浜嗚В鍐充紶缁熺殑瀛楃缂栫爜鏂规鐨勫眬闄愯屼骇鐢熺殑锛屽畠涓烘瘡绉嶈瑷涓殑姣忎釜瀛楃璁惧畾浜嗙粺涓骞朵笖鍞竴鐨勪簩杩涘埗缂栫爜锛屼互婊¤冻璺ㄨ瑷銆佽法骞冲彴杩涜鏂囨湰杞崲銆佸鐞嗙殑瑕佹眰銆1990骞村紑濮嬬爺鍙戯紝1994骞存寮忓叕甯冦俇nicode閫氬父...
  • 扩展阅读:unicode在线转码中文 ... unicode编码区对照表 ... unicode字符代码大全 ... unicode控制字符对照表 ... unicode字符大全查询 ... unicode在线编码解码 ... 空白昵称在线复制 ... unicode字符转换器 ... 全部unicode字符哪里查看 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网