QQ密码中的UNICODE码是什么东西? 请问在QQ密码中如何加入UNICODE?

QQ\u5bc6\u7801\u5305\u542bunicode\u7801

\u674e\u662f\u5e0c\u74dc\u74dc \u90a3\u662f\u6263\u6263\u8f6f\u4ef6\u7684\u95ee\u9898\u2026\u2026\u5bc6\u7801\u8f93\u5165\u7a97\u53e3\u4e0d\u652f\u6301\u8f93\u5165\u4f60\u90a3\u79cd\u7b26\u53f7 \u4f46\u662f\u7f51\u9875\u7684\u8f93\u5165\u7a97\u53e3\u53ef\u4ee5\u7684 \u4f60\u8bd5\u4e00\u4e0b\u7528\u590d\u5236\u7684\u65b9\u5f0f\u8981\u7684\u4e0d\uff1f\uff1f \u8bb0\u5230\u628a\u6700\u4f73\u7b54\u6848\u7ed9\u6211 \u8bb0\u5230

\u5355\u51fb\u4f60\u90a3\u4e2a\u770b\u4e0d\u5230\u7684\u4e1c\u897f\uff0c\u5b89\u88c5\u4e00\u4e0bAX\u8f6f\u4ef6\u5c31\u770b\u5230\u4e86

Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。随着计算机工作能力的增强,Unicode也在面世以来的十多年里得到普及。

2006年6月的最新版本的 Unicode 是 2005年3月31日推出的Unicode 4.1.0 。另外,5.0 Beta已于2005年12月12日推出,以供各会员评价。

Unicode 的编码和实现

大概来说,Unicode 编码系统可分为编码方式和实现方式两个层次。

1.编码方式

Unicode 的编码方式与 ISO 10646 的通用字元集(亦称[通用字符集])(Universal Character Set,UCS)概念相对应,目前的用于实用的 Unicode 版本对应于 UCS-2,使用16位的编码空间。也就是每个字符占用2个字节。这样理论上一共最多可以表示 216 个字符。基本满足各种语言的使用。实际上目前版本的 Unicode 尚未填充满这16位编码,保留了大量空间作为特殊使用或将来扩展。

上述16位 Unicode 字符构成基本多文种平面(Basic Multilingual Plane, 简称 BMP)。最新(但未实际广泛使用)的 Unicode 版本定义了16个辅助平面,两者合起来至少需要占据21位的编码空间,比3字节略少。但事实上辅助平面字符仍然占用4字节编码空间,与 UCS-4 保持一致。未来版本会扩充到 ISO 10646-1 实现级别3,即涵盖 UCS-4 的所有字符。UCS-4 是一个更大的尚未填充完全的31位字符集,加上恒为0的首位,共需占据32位,即4字节。理论上最多能表示 231 个字符,完全可以涵盖一切语言所用的符号。

BMP 字符的 Unicode 编码表示为 U+hhhh,其中每个 h 代表一个十六进制数位。与 UCS-2 编码完全相同。对应的4字节 UCS-4 编码后两个字节一致,前两个字节的所有位均为0。

2.实现方式

Unicode 的实现方式不同于编码方式。一个字符的 Unicode 编码是确定的。但是在实际传输过程中,由于不同系统平台的设计不一定一致,以及出于节省空间的目的,对 Unicode 编码的实现方式有所不同。Unicode 的实现方式称为Unicode转换格式(Unicode Translation Format,简称为 UTF)。

例如,如果一个仅包含基本7位ASCII字符的 Unicode 文件,如果每个字符都使用2字节的原 Unicode 编码传输,其第一字节的8位始终为0。这就造成了比较大的浪费。对于这种情况,可以使用 UTF-8 编码,这是一种变长编码,它将基本7位ASCII字符仍用7位编码表示,占用一个字节(首位补0)。而遇到与其他 Unicode 字符混合的情况,将按一定算法转换,每个字符使用1-3个字节编码,并利用首位为0或1进行识别。这样对以7位ASCII字符为主的西文文档就大大节省了编码长度(具体方案参见UTF-8)。类似的,对未来会出现的需要4个字节的辅助平面字符和其他 UCS-4 扩充字符,2字节编码的 UTF-16 也需要通过一定的算法进行转换。

再如,如果直接使用与 Unicode 编码一致(仅限于 BMP 字符)的 UTF-16 编码,由于每个址�加昧肆礁鲎纸冢�赣acintosh机和PC机上对字节顺序的理解是不一致的。这时同一字节流可能会被解释为不同内容,如编码为 U+594E 的字符“奎”同编码为 U+4E59 的“乙”就可能发生混淆。于是在 UTF-16 编码实现方式中使用了大尾序(big-endian)、小尾序(little-endian)的概念,以及BOM(Byte Order Mark)解决方案。(具体方案参见UTF-16)

此外 Unicode 的实现方式还包括 UTF-7、Punycode、CESU-8、SCSU、UTF-32等,这些实现方式有些仅在一定的国家和地区使用,有些则属于未来的规划方式。目前通用的实现方式是 UTF-16小尾序(BOM)、UTF-16大尾序(BOM)和 UTF-8。在微软公司Windows XP操作系统附带的记事本中,“另存为”对话框可以选择的四种编码方式除去非 Unicode 编码的 ANSI 外,其余三种“Unicode”、“Unicode big endian”和“UTF-8”即分别对应这三种实现方式。

目前辅助平面的工作主要集中在第二和第三平面的中日韩统一表意文字中,因此包括GBK、GB18030、Big5等简体中文、正体中文、日文、韩语以及越南字喃的各种编码与 Unicode 的协调性被重点关注。考虑到 Unicode 最终要涵盖所有的字符,从某种意义而言,这些编码方式也可视作 Unicode 的出现于其之前的既成事实的实现方式,如同ASCII及其扩展Latin-1一样,后两者的字符在16位 Unicode 编码空间中的编码第一字节各位全为0,第二字节编码与原编码完全一致。但上述东亚语言编码与 Unicode 编码的对应关系要复杂得多。

非 Unicode 环境

在非 Unicode 环境下,由于不同国家和地区采用的字符集不一致,很可能出现无法正常显示所有字符的情况。微软公司使用了代码页(Codepage)转换表的技术来过渡性的部分解决这一问题,即通过指定的转换表将非 Unicode 的字符编码转换为同一字符对应的系统内部使用的 Unicode 编码。可以在“语言与区域设置”中选择一个代码页作为非 Unicode 编码所采用的默认编码方式,如936为简体中文GBK,950为正体中文Big5(皆指PC上使用的)。在这种情况下,一些非英语的欧洲语言编写的软件和文档很可能出现乱码。而将代码页设置为相应语言中文处理又会出现问题,这一情况无法避免。从根本上说,完全采用统一编码才是解决之道,但目前上无法做到这一点。

代码页技术现在广泛为各种平台所采用。UTF-7 的代码页是65000,UTF-8 的代码页是65001。

XML 和 Unicode

XML及其子集HTML采用UTF-8作为标准字集,理论上我们可以在各种支持XML标准的浏览器上显示任何地区文字的网页,只要电脑本身安装有合适的字体即可。可以利用&#nnn;的格式显示特定的字符。nnn代表该字符的十进制 Unicode 代码。如果采用十六进制代码,在编码之前加上x字符即可。但部分旧版本的浏览器可能无法识别十六进制代码。

然而部分由于 Unicode 版本发展原因,很多浏览器只能显示 UCS-2 完整字符集也即现在使用的 Unicode 版本中的一个小子集。

输入Unicode

除了输入法外,操作系统会提供几种方法输入Unicode。像是Windows 2000之后的Windows系统就提供一个可点击的表。例如在Microsoft Word之下,按下 Alt 键不放,输入 0 和某个字符的 Unicode 编码(十进制),再松开 Alt 键即可得到该字符,如Alt + 033865会得到Unicode字符叶。另外按Alt + X 组合键,MS Word 也会将光标前面的字符同其十六进制的四位 Unicode 编码进行互相转换。

Unicode 目前已经有5.0版本。世界上有一大批计算机、语言学等科学家专门研究Unicode,到了现在Unicode标准已经不单是一个编码标准,还是记录人类语言文字资料的一个巨大的数据库,同时从事人类文化遗产的发掘和保护工作。
对于中文而言,Unicode 16编码里面已经包含了GB18030里面的所有汉字(27484个字),目前Unicode标准准备把康熙字典的所有汉字放入到Unicode 32bit编码中。

简单地说,Unicode扩展自ASCII字元集。在严格的ASCII中,每个字元用7位元表示,或者电脑上普遍使用的每字元有8位元宽;而Unicode使用全16位元字元集。这使得Unicode能够表示世界上所有的书写语言中可能用於电脑通讯的字元、象形文字和其他符号。Unicode最初打算作为ASCII的补充,可能的话,最终将代替它。考虑到ASCII是电脑中最具支配地位的标准,所以这的确是一个很高的目标。

Unicode影响到了电脑工业的每个部分,但也许会对作业系统和程式设计语言的影响最大。从这方面来看,我们已经上路了。Windows NT从底层支援Unicode(不幸的是,Windows 98只是小部分支援Unicode)。先天即被ANSI束缚的C程式设计语言通过对宽字元集的支援来支援Unicode。

自然,作为程式写作者,我们通常会面对许多繁重的工作。我已试图透过使本书中的所有程式「Unicode化」来减轻负担。其含义会随著本章对Unicode的讨论而清晰起来。

基本上,计算机只是处理数字。它们指定一个数字,来储存字母或其他字符。在创造Unicode之前,有数百种指定这些数字的编码系统。没有一个编码可以包含足够的字符:例如,单单欧州共同体就需要好几种不同的编码来包括所有的语言。即使是单一种语言,例如英语,也没有哪一个编码可以适用于所有的字母,标点符号,和常用的技术符号。

这些编码系统也会互相冲突。也就是说,两种编码可能使用相同的数字代表两个不同的字符,或使用不同的数字代表相同的字符。任何一台特定的计算机(特别是服务器)都需要支持许多不同的编码,但是,不论什么时候数据通过不同的编码或平台之间,那些数据总会有损坏的危险。

Unicode正在改变所有这一切!
Unicode给每个字符提供了一个唯一的数字,不论是什么平台,不论是什么程序,不论什么语言。Unicode标准已经被这些工业界的领导们所采用,例如:Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys和其它许多公司。最新的标准都需要Unicode,例如XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML等等,并且,Unicode是实现ISO/IEC 10646的正规方式。许多操作系统,所有最新的浏览器和许多其他产品都支持它。Unicode标准的出现和支持它工具的存在,是近来全球软件技术最重要的发展趋势。

将Unicode与客户服务器或多层应用程序和网站结合,比使用传统字符集节省费用。Unicode使单一软件产品或单一网站能够贯穿多个平台,语言和国家,而不需要重建。它可将数据传输到许多不同的系统,而无损坏。

关于Unicode学术学会
Unicode学术学会是一个非盈利的组织,是为发展,扩展和推广使用Unicode标准而建立的,Unicode学术学会设立了现代软件产品和标准文本的表示法。学术学会的会员代表了广泛领域的计算机和资讯工业的公司和组织。学术学会只由会员提供资金。Unicode学术学会的会员资格开放给世界上任何支持Unicode标准和希望协助其扩展和执行的组织及个人。

欲知更多信息,请参阅术语词汇表,Unicode产品样本,技术简介和参考资料



  • 瀹夊叏瀵嗙爜鏄浠涔堜笢瑗?
    绛旓細姊﹀够瑗挎父瀹夊叏鐮佹槸浠涔堜笢瑗 鏄彲浠ョ敤鏉ユ壘鍥炴父鎴瀵嗙爜鐨勫瘑鐮銆傘傚氨鏄锛氬鏋滀綘鐨勫彿琚汉鐩椾簡鎴栬呬綘鑷繁蹇樹簡銆傘備綘鍙互鍊熷姪瀹夊叏鐮佹潵鎵惧洖浣犵殑娓告垙瀵嗙爜銆傚鏋滆繛璐﹀彿鐨勫繕浜嗕粈涔堢爜閮芥病鐢ㄤ簡銆傘傘備粈涔堟牱鐨勫瘑鐮佹渶瀹夊叏 瀹夊叏瀵嗙爜璁剧疆鎸囧紩 灏界鑵捐鍏徃涓轰簡鎮ㄧ殑鍙风爜瀹夊叏鎻愪緵浜嗗绉嶆湇鍔℃帾鏂斤紝浣QQ鍙风爜鏄互瀵嗙爜涓哄敮涓...
  • 绗﹀彿鑱婂ぉ鏆楄澶у叏
    绛旓細3銆佽繕鏈変竴绉unicode缂栫爜 ,鍙戦佸悗闀挎寜閫夋嫨缈昏瘧鍗冲彲鏄剧ず銆 u6211u559cu6b22u4f60u554 缈昏瘧:鎴戝枩娆綘鍟 u5728u4e00u8d77u5427 缈昏瘧:鍦ㄤ竴璧峰惂 u60f3u4f60u4e86 缈昏瘧:鎯充綘浜 涓夈佸井淇¤〃鐧芥殫鍙峰ぇ鍏 1銆佲渙hh鈥,鍏跺疄鍦ㄥ皬浼欎即浠殑蹇冮噷,ohh灏辨槸鈥滃摝鈥濇垨璁告槸鈥滃摝鍛靛懙鈥濈殑鎰忔,浣嗗湪寰俊涓婄炕璇戝嚭鏉ュ悗,骞朵笉鏄繖鏍风殑...
  • 绌烘牸瀛楃鏄粈涔
    绛旓細鍥介檯鏍囧噯涓囧浗鐮侊紙Unicode锛夌殑鍗婅绌烘牸绗﹀彿鏄疷+0020 鈥淪PACE鈥濄 銆戙傝繖鏄釜鍗婅绌烘牸绗︼紝鍦ㄨ嫳鏂囨垨涓枃鍗婅鐘舵佷笅鎸夌┖鏍奸敭鍗冲彲鎵撳嚭杩欎釜鍗婅绌烘牸銆傚叏瑙掔┖鏍肩鍙锋槸U+30000 鈥淚DEOGRAPHIC SPACE鈥濄愩銆戙傚湪澶氬厓杈撳叆娉曠殑鍏ㄨ鐘舵佷笅鎸夌┖鏍奸敭鍗冲彲鎵撳嚭杩欎釜鍏ㄨ绌烘牸銆傝繖浜涚┖鏍肩鏄悕绗﹀叾瀹炵殑绌烘牸锛岃倝鐪兼槸鐪嬩笉瑙佺殑...
  • 涓涓瓧绗︾瓑浜庡灏戜綅鍜屽瓧鑺?
    绛旓細2銆乁TF-8缂栫爜涓,涓涓嫳鏂囧瓧绗︾瓑浜庝竴涓瓧鑺,涓涓腑鏂(鍚箒浣)绛変簬涓変釜瀛楄妭銆 3銆Unicode缂栫爜涓,涓涓嫳鏂囩瓑浜庝袱涓瓧鑺,涓涓腑鏂(鍚箒浣)绛変簬涓や釜瀛楄妭銆傜鍙:鑻辨枃鏍囩偣鍗犱竴涓瓧鑺,涓枃鏍囩偣鍗犱袱涓瓧鑺傘備妇渚:鑻辨枃鍙ュ彿鈥.鈥濆崰1涓瓧鑺傜殑澶у皬,涓枃鍙ュ彿鈥溿傗濆崰2涓瓧鑺傜殑澶у皬銆 4銆丟BK缂栫爜鏂瑰紡鏄腑鏂囧崰涓や釜瀛楄妭,鑻辨枃...
  • ZYJ杩欏嚑涓瓧姣嶆庝箞鎵?
    绛旓細ZYJ520 ALT+unicode鐮鍟 Z 65338 Y 65337 J 65322 5 65301 2 65298 0 65296
  • 鐢佃剳鏃犳硶杩涘叆qq绌洪棿
    绛旓細1. 棣栧厛纭鏈哄櫒鑳芥甯镐笂缃戯紱缃戠鏄惁灞忚斀浜嗗QQ绌洪棿璁块棶锛燂紱3. 灏嗘墍鏈夌梾姣掑拰缃戠粶闃茬伀澧欓兘閫鍑鸿瘯璇曪紱4. 鐐瑰嚮IE鑿滃崟涓殑鈥滄煡鐪嬧->鈥缂栫爜鈥濓紝纭閫変腑浜嗏Unicode (UTF-8)鈥濄傛柟娉曞叓锛氭墦涓嶅紑QQ绌洪棿鏄惁鍥犱负浣跨敤FireFox骞朵笖姝e湪浣跨敤FireBug缁勪欢锛熻В鍐虫柟娉曞緢绠鍗曪紝鍏抽棴FireBug灏卞彲浠ヤ簡銆
  • 鎵嬫満qq鑱婂ぉ璁板綍瀛樺湪鍝釜鏂囦欢澶
    绛旓細鎵嬫満涓鑸瓨鍌ㄥ垎涓烘墜鏈哄唴瀛樺拰鎵嬫満澶栫疆sd鍗″唴瀛樸傚鏋滀綘瀹夎鐨qq搴旂敤绋嬪簭鏄湪鎵嬫満鍐呭瓨閲岋紝閭e氨鐩存帴鐢ㄦ墜鏈篣SB鏁版嵁绾夸笌鐢佃剳杩炴帴灏卞彲浠ヤ簡;鎵撳紑鎴戠殑鐢佃剳鎴栬呴氳繃鎵嬫満鍔╂墜锛屾壘鍒板畨鍗撴墜鏈虹郴缁閲岀殑tencent鏂囦欢澶;閫夋嫨mobileqq,鏈鍚庨夋嫨data,灏辫兘鎵惧埌浣犵殑鑱婂ぉ璁板綍浜嗐傝屽缃偍瀛樺崱鐜板湪宸茬粡閫愭笎鐨勮娣樻卑浜嗭紝涓浣撴満鐢变簬鍏...
  • 鎵嬫満qq鑱婂ぉ璁板綍鎬庝箞寮勫埌鐢佃剳涓
    绛旓細棣栧厛鎵撳紑鎴戜滑鎵嬫満鐣岄潰涓婄殑鏂囦欢绠$悊銆俓x0d\x0a浠庢湰鍦版枃浠朵腑鎵惧埌鏂囦欢Tencent锛岀劧鍚庢墦寮銆俓x0d\x0a鍦ㄦ墦寮鍚庢壘鍒癕obileQQ杩欎釜鏂囦欢銆俓x0d\x0a鎵撳紑鍚庢壘鍒拌嚜宸盦Q鍙风殑鏂囦欢澶广俓x0d\x0a闀挎寜澶嶅埗涓嬫潵锛屾妸瀹冭鍒版垜浠兂瑕佺殑鏂囦欢涓幓鐒跺悗浼犲埌鏂版墜鏈轰笂灏卞彲浠ヤ簡锛屽綋鐒讹紝浣犱篃鍙互鐩存帴浼犲埌鐢佃剳涓娿
  • X-Scan鎬庝箞鐢?
    绛旓細X-Scanner v0.61 -- 鍙戝竷鏃ユ湡:05/17/2001,鍦ㄢ-iis鈥濋夐」涓柊澧炲IIS CGI鏂囦欢鍚嶄簩娆¤В鐮佹紡娲炵殑妫娴嬨 X-Scanner v0.6 -- 鍙戝竷鏃ユ湡:05/15/2001,鏂板鈥-iis鈥濆弬鏁,涓撻棬鐢ㄤ簬鎵弿IIS鏈嶅姟鍣ㄧ殑鈥unicode鈥濆強鈥渞emote .printer overflow鈥濇紡娲;鏇存柊婕忔礊鎻忚堪;璋冩暣CGI鎵弿鐨勮秴鏃舵椂闂,灏介噺閬垮厤鍥犺秴鏃跺鑷寸殑鈥滄壂鎻忔湭瀹屾垚...
  • ...浜岀骇fortran璇曢鍟?姹傜湡棰榽鍙戞垜閭[email protected]銆傘傘俖鐧惧害鐭 ...
    绛旓細C. Unicode瀛楃闆嗕腑鏃㈡敹褰曚簡澶ч噺绠浣撴眽瀛,涔熸敹褰曚簡澶ч噺绻佷綋姹夊瓧 D. GB2312鏄垜鍥介甯冪殑绗竴涓眽瀛缂栫爜鏍囧噯,璇ュ瓧绗﹂泦杩樻敹褰曚簡淇勬枃銆佸笇鑵婂瓧姣嶇瓑 17. 鑻ヤ竴骞呭浘鍍忕殑澶у皬涓1024脳768,棰滆壊娣卞害涓16浣,鍒欒鍥惧儚鍦ㄤ笉杩涜鏁版嵁鍘嬬缉鏃,鍏舵暟鎹噺澶х害涓 17 銆 BA. 768KB B. 1.5MB C. 3MB D. 12.3MB 18. 鍦ㄤ笅鍒4...
  • 扩展阅读:6位万能解锁密码 ... 强制查看qq密码 ... 免费qq密码破解器 ... 黑客qq密码一键破解器 ... 万能破qq密码免费 ... 免费找回qq密码黑客 ... 苹果万能qq密码破解器 ... 万能qq破解器手机版 ... 6位密码锁解开大全 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网