一个英文字母占多少字节
两个、三个或者四个字节。
1、ASCII码中:一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。
一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值0,最大值255。
2、UTF-8编码中:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。
3、Unicode编码中:一个英文字符等于两个字节,一个中文(含繁体)等于两个字节。
符号:英文标点占一个字节;中文标点占两个字节。
举例:英文句号“.”占1个字节的大小;中文句号“。”占2个字节的大小。
4、UTF-16编码中:一个英文字母字符或一个汉字字符存储都需要2个字节(Unicode扩展区的一些汉字存储需要4个字节)。
扩展资料
作用
针对微软公共语言运行库的应用程序使用编码将字符表示形式从本机字符方案映射至其他方案。应用程序使用解码将字符从非本机方案映射至本机方案。
电脑和通讯设备会使用字符编码的方式来表达字符。意思是会将一个字符指定给某个东西。传统上,是代表整数量的位元序列,如此,则可透过网络来传输,同时亦便于储存。两个常用的例子是ASCII和用于统一码的UTF-8。根据谷歌的统计,UTF-8是目前最常用于网页的编码方式。相较于大部分的字符编码把字符对应到数字或位元串,摩斯密码则是使用不定长度的电子脉冲的序列来表现字符。
参考资料:百度百科-字符
绛旓細涓涓嫳鏂囧瓧姣嶅湪璁$畻鏈轰腑鐨勫瓨鍌ㄥぇ灏忛氬父涓1涓瓧鑺傦紙byte锛銆傞鍏堬紝鎴戜滑闇瑕佷簡瑙h绠楁満瀛樺偍鏁版嵁鐨勫熀鏈崟浣嶃傝绠楁満瀛樺偍鏁版嵁鐨勫熀鏈崟浣嶆槸浣嶏紙bit锛夛紝鑰屽父鐢ㄧ殑瀛樺偍鍗曚綅瀛楄妭锛坆yte锛夋槸8涓綅锛坆it锛夌殑缁勫悎銆備竴涓綅鍙兘琛ㄧず0鎴1杩欎袱绉嶇姸鎬佷腑鐨勪竴绉嶏紝鑰屼竴涓瓧鑺傜敱浜庡寘鍚8涓綅锛屽洜姝ゅ彲浠ヨ〃绀2^8=256绉嶄笉鍚岀殑鐘舵併
绛旓細涓涓瓧姣嶅崰涓涓瓧鑺銆1銆佽嫳鏂囧拰鏁板瓧鍗犱竴涓瓧鑺傦紱2銆佷腑鏂囧崰涓涓瓧绗︼紝涔熷氨鏄袱涓瓧鑺傦紱3銆佸瓧绗︿笉绛変簬瀛楄妭銆傚瓧绗︼紙char锛夋槸 Java 涓殑涓绉嶅熀鏈暟鎹被鍨嬶紝鐢 2 涓瓧鑺傜粍鎴愶紝鑼冨洿浠 0 寮濮嬶紝鍒 2^16-1銆傚瓧鑺傛槸涓绉嶆暟鎹噺鐨勫崟浣嶏紝涓涓瓧鑺傜瓑浜 8 浣嶃傛墍鏈夌殑鏁版嵁鎵鍗犵┖闂撮兘鍙互鐢ㄥ瓧鑺傛暟鏉ヨ 閲忋備緥...
绛旓細涓涓嫳鏂囧瓧姣嶏紙涓嶅垎澶у皬鍐欙級鍗犱竴涓瓧鑺傜殑绌洪棿锛屼竴涓腑鏂囨眽瀛楀崰涓や釜瀛楄妭鐨勭┖闂淬備竴涓簩杩涘埗鏁板瓧搴忓垪锛屽湪璁$畻鏈轰腑浣滀负涓涓暟瀛楀崟鍏冿紝涓鑸负8浣嶄簩杩涘埗鏁帮紝鎹㈢畻涓哄崄杩涘埗銆傛渶灏忓0锛屾渶澶у255銆傚涓涓狝SCII鐮佸氨鏄竴涓瓧鑺傘俇TF-8缂栫爜锛氫竴涓嫳鏂囧瓧绗︾瓑浜庝竴涓瓧鑺傦紝涓涓腑鏂囷紙鍚箒浣擄級绛変簬涓変釜瀛楄妭銆俇nico...
绛旓細1銆丄SCII鐮佷腑锛涓涓嫳鏂囧瓧姣嶏紙涓嶅垎澶у皬鍐欙級鍗犱竴涓瓧鑺傜殑绌洪棿锛屼竴涓腑鏂囨眽瀛楀崰涓や釜瀛楄妭鐨勭┖闂銆備竴涓簩杩涘埗鏁板瓧搴忓垪锛屽湪璁$畻鏈轰腑浣滀负涓涓暟瀛楀崟鍏冿紝涓鑸负8浣嶄簩杩涘埗鏁帮紝鎹㈢畻涓哄崄杩涘埗銆傛渶灏忓0锛屾渶澶у255銆2銆乁TF-8缂栫爜涓紝涓涓嫳鏂囧瓧绗︾瓑浜庝竴涓瓧鑺傦紝涓涓腑鏂囷紙鍚箒浣擄級绛変簬涓変釜瀛楄妭銆3銆乁nicode缂...
绛旓細1銆佽嫳鏂囧瓧姣嶏細濡傛灉鏄痗har 鍨嬶紝閭d箞鏄崰鐢1涓瓧鑺锛屽鏋滄槸string鍨嬶紝鏄袱涓傛瘮濡傦細char c = 'a';//瀹冨崰鐢ㄤ竴涓瓧绗︼紝char c[] = "a";//鍗犵敤涓や釜锛宑har c[] = "abcde";//鍗犵敤4+1 = 5 涓紝缁撳熬鏈変竴涓'\0'銆2銆佹暟瀛楋細杩欎釜鏈夊緢澶氱锛屼粠灏忓埌澶у垎鍒负锛歴hort銆乮nt銆乫loat銆乴ong銆乨ouble...
绛旓細1銆丄SCII鐮佷腑锛氫竴涓嫳鏂囧瓧姣嶏紙涓嶅垎澶у皬鍐欙級鍗犱竴涓瓧鑺傜殑绌洪棿锛屼竴涓腑鏂囨眽瀛楀崰涓や釜瀛楄妭鐨勭┖闂淬備竴涓簩杩涘埗鏁板瓧搴忓垪锛屽湪璁$畻鏈轰腑浣滀负涓涓暟瀛楀崟鍏冿紝涓鑸负8浣嶄簩杩涘埗鏁帮紝鎹㈢畻涓哄崄杩涘埗銆傛渶灏忓0锛屾渶澶у255銆2銆乁TF-8缂栫爜涓細涓涓嫳鏂囧瓧绗︾瓑浜庝竴涓瓧鑺傦紝涓涓腑鏂囷紙鍚箒浣擄級绛変簬涓変釜瀛楄妭銆3銆乁nicode...
绛旓細1锛孉SCII鐮侊細涓涓嫳鏂囧瓧姣嶏紙涓嶅垎澶у皬鍐欙級鍗犱竴涓瓧鑺傜殑绌洪棿锛屼竴涓腑鏂囨眽瀛楀崰涓や釜瀛楄妭鐨勭┖闂淬2锛孶TF-8缂栫爜锛氫竴涓嫳鏂囧瓧绗︾瓑浜庝竴涓瓧鑺傦紝涓涓腑鏂囷紙鍚箒浣擄級绛変簬涓変釜瀛楄妭銆備腑鏂囨爣鐐瑰崰涓変釜瀛楄妭锛岃嫳鏂囨爣鐐瑰崰涓涓瓧鑺 3锛孶nicode缂栫爜锛涓涓嫳鏂囩瓑浜庝袱涓瓧鑺锛屼竴涓腑鏂囷紙鍚箒浣擄級绛変簬涓や釜瀛楄妭銆備腑鏂囨爣鐐瑰崰...
绛旓細8浣嶃備竴涓眽瀛楁槸涓涓瓧绗︺佷袱涓瓧鑺傦紝16浣 鐭ヨ瘑鎷撳睍锛氬叿浣撹鍖哄垎缂栫爜锛欰SCII鐮侊細涓涓嫳鏂囧瓧姣嶇瓑浜涓涓瓧鑺锛沀TF-8缂栫爜锛氫竴涓嫳鏂囧瓧姣嶇瓑浜庝竴涓瓧鑺傦紱Unicode缂栫爜锛氫竴涓嫳鏂囧瓧姣嶇瓑浜庝袱涓瓧鑺傘傚瓧鑺傦細璁$畻鏈轰俊鎭妧鏈敤浜庤閲忓瓨鍌ㄥ閲忕殑涓绉嶈閲忓崟浣嶏紝涔熻〃绀轰竴浜涜绠楁満缂栫▼璇█涓殑鏁版嵁绫诲瀷鍜岃瑷瀛楃銆
绛旓細ASCII鐮侊細涓涓嫳鏂囧瓧姣嶏紙涓嶅垎澶у皬鍐欙級鍗犱竴涓瓧鑺傜殑绌洪棿锛屼竴涓腑鏂囨眽瀛楀崰涓や釜瀛楄妭鐨勭┖闂淬備竴涓簩杩涘埗鏁板瓧搴忓垪锛屽湪璁$畻鏈轰腑浣滀负涓涓暟瀛楀崟鍏冿紝涓鑸负8浣嶄簩杩涘埗鏁帮紝鎹㈢畻涓哄崄杩涘埗銆傛渶灏忓-128锛屾渶澶у127銆傚涓涓狝SCII鐮佸氨鏄竴涓瓧鑺傘俇TF-8缂栫爜锛氫竴涓嫳鏂囧瓧绗︾瓑浜庝竴涓瓧鑺傦紝涓涓腑鏂囷紙鍚箒浣擄級绛変簬涓...
绛旓細涓涓嫳鏂囧瓧姣嶅湪璁$畻鏈轰腑鐨勫瓨鍌ㄥぇ灏忛氬父涓1涓瓧鑺傦紙byte锛夈傞鍏堬紝鎴戜滑闇瑕佷簡瑙h绠楁満瀛樺偍鏁版嵁鐨勫熀鏈崟浣嶃傝绠楁満瀛樺偍鏁版嵁鐨勫熀鏈崟浣嶆槸浣嶏紙bit锛夛紝鑰屽父鐢ㄧ殑瀛樺偍鍗曚綅瀛楄妭锛坆yte锛夋槸8涓綅锛坆it锛夌殑缁勫悎銆備竴涓綅鍙兘琛ㄧず0鎴1杩欎袱绉嶇姸鎬佷腑鐨勪竴绉嶏紝鑰涓涓瓧鑺鐢变簬鍖呭惈8涓綅锛屽洜姝ゅ彲浠ヨ〃绀2^8=256绉嶄笉鍚岀殑鐘舵...