怎么找出文本文件中unicode的字符? 记事本里出现该文件含有Unicode格式的字符,当保存为AN...

\u8bb0\u4e8b\u672c \u8be5\u6587\u4ef6\u542b\u6709unicode\u683c\u5f0f\u7684\u5b57\u7b26 \u70b9\u786e\u5b9a\u5c31\u53d8\u4e71\u7801\u4e86

\u4e3b\u8981\u539f\u56e0\u5982\u4e0b\uff1a
\u6587\u4ef6txt\u7f16\u7801\u9519\u8bef\uff0c\u53ea\u9700\u91cd\u65b0\u8c03\u6574\u5373\u53ef\u3002
\u5177\u4f53\u6b65\u9aa4\u5982\u4e0b\uff1a
1\u3001\u6253\u5f00\u63a7\u5236\u9762\u677f\uff0c\u627e\u5230\u533a\u57df\u548c\u8bed\u8a00\u9009\u9879\u3002

2\u3001\u5728\u533a\u57df\u548c\u8bed\u8a00\u9009\u9879\u4e2d\uff0c\u70b9\u51fb\u7ba1\u7406\uff0c\u70b9\u51fb\u66f4\u6539\u7cfb\u7edf\u533a\u57df\u8bbe\u7f6e\u3002

3\u3001\u5728\u66f4\u6539\u7cfb\u7edf\u533a\u57df\u8bbe\u7f6e\u4e2d\uff0c\u5c06\u5f53\u524d\u7cfb\u7edf\u533a\u57df\u8bbe\u7f6e\u66f4\u6539\u4e3a\uff1a\u4e2d\u6587\u7e41\u4f53\uff0c\u7136\u540e\u91cd\u542f\u7535\u8111\u3002

4\u3001\u627e\u5230\u6587\u672c\u6587\u4ef6\uff0c\u7136\u540e\u53cc\u51fb\u6253\u5f00\u5b83\u3002

5\u3001\u6253\u5f00\u4e4b\u540e\uff0c\u70b9\u51fb\u53f3\u4e0a\u89d2\u7684 \u6587\u4ef6 \u83dc\u5355\u9009\u9879\u3002

6\u3001\u7136\u540e\u5728\u5f39\u51fa\u7684\u83dc\u5355\u4e2d\u70b9\u51fb \u53e6\u5b58\u4e3a \u9009\u9879\u3002

7\u3001\u7136\u540e\u5728\u5f39\u51fa\u7684\u7a97\u53e3\u4e2d\uff0c\u53ef\u4ee5\u770b\u5230\u5f53\u524d\u6587\u6863\u7684\u7f16\u7801\u683c\u5f0f\u662fANSI\uff0c\u7136\u540e\u5c06\u5b83\u66f4\u6539\u4e3a Unicode\uff0c\u70b9\u51fb\u4fdd\u5b58\u3002

8\u3001\u7136\u540e\u5728\u5f39\u51fa\u7684\u8be2\u95ee\u6846\u4e2d\u70b9\u51fb \u662f\uff0c\u518d\u6b21\u70b9\u51fb\u4fdd\u5b58\u5373\u53ef\u89e3\u51b3\u95ee\u9898\u3002

\u6b63\u5e38\uff01\u56e0\u4e3aANSI\u7f16\u7801\u5e76\u4e0d\u5305\u62ec\u6240\u6709\u5b57\u7b26\uff0c\u5982\u679c\u6587\u6863\u91cc\u6709\u4e00\u4e9b\u7279\u6b8a\u7b26\u53f7\u6216\u5176\u4ed6\u8bed\u8a00\u7684\u6587\u5b57\u65f6\uff0c\u5c31\u6709\u53ef\u80fd\u4e22\u5931\uff0c\u8fd9\u662f\u6b63\u5e38\u7684\u3002
\u5904\u7406\u65b9\u6cd5\uff1a\uff08\u5982\u679c\u4e0d\u60f3\u4f7f\u5b57\u7b26\u4e22\u5931\u7684\u8bdd\uff09
\u51fa\u73b0\u8b66\u544a\u7a97\u53e3\u65f6\uff0c\u70b9\u51fb\u201c\u53d6\u6d88\u201d\u3002
\u4ece\u83dc\u5355\u4e2d\u9009\u62e9\u201c\u4fdd\u5b58\u201d\u3002\u4fdd\u5b58\u6587\u4ef6\u65f6\uff0c\u6709\u4e00\u4e2a\u53eb\u201c\u7f16\u7801\u201d\u7684\u9009\u9879\uff0c\u5355\u51fb\u4e0b\u62c9\u5217\u8868\u9009\u62e9\u201cUnicode\u201d\uff0c\u518d\u70b9\u51fb\u201c\u4fdd\u5b58\u201d\u5373\u53ef\u3002\u8fd9\u6837\u5c31\u80fd\u4fdd\u5b58Unicode\u5b57\u7b26\u3002\uff08\u9009\u201cUTF-8\u201d\u6216\u201cUnicode big endian\u201d\u4e5f\u53ef\u4ee5\uff0c\u56e0\u4e3a\u5b83\u4eec\u662fUnicode\u7684\u51e0\u79cd\u5f62\u5f0f\u3002\uff09

判断:如果文本文件的开头两个字节是0xFF和0xFE,那么就是Unicode,否则是ANSI;

转化:打开txt文件,另存为,下面选择"Unicode"格式,反之类似;

更多的Unicode相关资料:
http://202.38.246.163:8080/RTOS/Linux/200601/RTOS_20060110200743.html

  • 鎬庝箞鎵惧嚭鏂囨湰鏂囦欢涓璾nicode鐨勫瓧绗?
    绛旓細鍒ゆ柇:濡傛灉鏂囨湰鏂囦欢鐨勫紑澶翠袱涓瓧鑺傛槸0xFF鍜0xFE,閭d箞灏辨槸Unicode,鍚﹀垯鏄疉NSI;杞寲:鎵撳紑txt鏂囦欢,鍙﹀瓨涓,涓嬮潰閫夋嫨"Unicode"鏍煎紡,鍙嶄箣绫讳技;鏇村鐨刄nicode鐩稿叧璧勬枡:http://202.38.246.163:8080/RTOS/Linux/200601/RTOS_20060110200743.html
  • 鎬庨航鏌ョ湅缂栬緫鏄unicode鐨勬枃鏈?
    绛旓細濡傛灉鏄痷nicode鏂瑰紡瀛樺偍鐨則xt鐨勮瘽锛岀敤windows鐨勮浜嬫湰灏卞彲浠ユ甯哥紪杈戝療鐪銆備綘鐨則xt閲岄潰澶ф鏄湁浜涗笉甯哥敤鐨勫瓧绗﹀惂锛屾瘮濡傝娉版枃缂呯敻鏂囩瓑绛夛紝windows鐨勯粯璁ゅ瓧浣撲笉鏀寔锛屾墍浠ヤ笉鑳芥甯哥幇瀹炪傛帹鑽愪綘涓嬭浇瀛椾綋 unifont 鎴栬 code2000 浠栦滑鏀寔鐨剈nicode瀛楃闆嗗緢澶э紝涓鑸兘鑳芥甯告樉绀恒
  • 濡備綍瑙e喅鐢佃剳淇濆瓨璁颁簨鏈鏂囦欢鎻愮ずUnicode瀛楃闂
    绛旓細鏂规硶1锛1. 鍏堟墦寮銆愬彟瀛樹负銆戠獥鍙o紝鎺ョ潃鏍规嵁涓嬪浘鎵绀猴紝灏嗐愮紪鐮併戜慨鏀逛负銆怳nicode銆戯紝鐒跺悗鐐瑰嚮銆愪繚瀛樸戝嵆鍙銆傛柟娉2锛1. 棣栧厛绗竴姝ュ厛鎼滅储骞舵墦寮銆愭帶鍒堕潰鏉裤戠獥鍙o紝鎺ョ潃鏍规嵁涓嬪浘鎵绀猴紝鐐瑰嚮銆愬尯鍩熷拰璇█銆戦夐」銆2. 绗簩姝ュ湪寮瑰嚭鐨勭獥鍙d腑锛屾牴鎹笅鍥炬墍绀猴紝鍏堢偣鍑汇愮鐞嗐戯紝鎺ョ潃鐐瑰嚮銆愭洿鏀圭郴缁熷尯鍩熻缃...
  • Txt鏂囦欢淇濆瓨缂栫爜娌℃湁unicode鎬庝箞鍔?
    绛旓細file.write('浣犲ソ锛屼笘鐣岋紒')鍦ㄨ繖涓緥瀛愪腑锛屾垜浠娇鐢ㄤ簡 open() 鍑芥暟鎵撳紑涓涓悕涓 example.txt 鐨勬枃浠锛屽苟浣跨敤 'w' 妯″紡鎵撳紑瀹冿紝杩欐剰鍛崇潃鎴戜滑瑕佸啓鍏ユ枃浠躲傜劧鍚庯紝鎴戜滑浣跨敤 encoding='utf-8' 鍙傛暟鎸囧畾浜嗙紪鐮佷负 UTF-8銆傛渶鍚庯紝鎴戜滑浣跨敤 write() 鏂规硶灏嗗瓧绗︿覆鍐欏叆鏂囦欢銆傚鏋滄偍鎯宠鍦ㄤ繚瀛 Txt 鏂囦欢鏃朵娇...
  • 璁颁簨鏈 璇鏂囦欢鍚湁unicode鏍煎紡鐨瀛楃 鐐圭‘瀹氬氨鍙樹贡鐮佷簡
    绛旓細1銆佹墦寮鎺у埗闈㈡澘锛屾壘鍒板尯鍩熷拰璇█閫夐」銆2銆佸湪鍖哄煙鍜岃瑷閫夐」涓紝鐐瑰嚮绠$悊锛岀偣鍑绘洿鏀圭郴缁熷尯鍩熻缃銆3銆佸湪鏇存敼绯荤粺鍖哄煙璁剧疆涓紝灏嗗綋鍓嶇郴缁熷尯鍩熻缃洿鏀逛负锛氫腑鏂囩箒浣擄紝鐒跺悗閲嶅惎鐢佃剳銆4銆佹壘鍒版枃鏈枃浠讹紝鐒跺悗鍙屽嚮鎵撳紑瀹冦5銆佹墦寮涔嬪悗锛岀偣鍑诲彸涓婅鐨 鏂囦欢 鑿滃崟閫夐」銆6銆佺劧鍚庡湪寮瑰嚭鐨勮彍鍗曚腑鐐瑰嚮 鍙﹀瓨涓 閫夐」銆7...
  • 璁颁簨鏈閲鍑虹幇璇鏂囦欢鍚湁Unicode鏍煎紡鐨勫瓧绗,褰撲繚瀛樹负ANSI缂栫爜鐨勬枃鏈鏃...
    绛旓細鐢变簬ANSI缂栫爜涓嶅寘鎷墍鏈夊瓧绗︼紝鎵浠鏂囨。閲鏈変竴浜涚壒娈婄鍙锋垨鍏朵粬璇█鐨鏂囧瓧鏃讹紝灏卞彲鑳藉鑷村瓧绗︿涪澶便傚叿浣撹В鍐虫柟娉曞涓嬶細鍑虹幇璀﹀憡绐楀彛鏃讹紝鐐瑰嚮鈥滃彇娑堚濇寜閽紝寮瑰嚭涓涓滃彟瀛樹负鈥濈晫闈紝鍦ㄦ渶涓嬮潰鐨勨滅紪鐮佲濈殑閫夐」涓紝鍗曞嚮涓嬫媺鍒楄〃閫夋嫨鈥Unicode鈥濓紝鐒跺悗鐐瑰嚮鈥滀繚瀛樷濇寜閽紝杩欐牱灏辫兘淇濆瓨Unicode瀛楃銆備笉杩囷紝缂栫爜绫诲瀷閫...
  • 淇濆瓨鏂囨湰鏃鎬庝箞鏈unicode浠涔鐨
    绛旓細Unicode鏄竴绉嶇紪鐮侊紙鏂瑰紡锛夛紝淇濆瓨鏂囨湰鏂囨。鏃跺彲浠ュ湪鈥滅紪鐮佲濅腑閫夋嫨銆備笉鍚岀殑缂栫爜鏈変笉鍚岀殑閫傜敤鑼冨洿锛孏B2312锛堝嵆璁颁簨鏈腑鐨勨淎NSI鈥濓級灏卞寘鎷簡澶у鏁扮殑鎷変竵瀛楁瘝鍜岄氱敤姹夊瓧锛沀nicode锛堝寘鎷琔TF-8銆乁nicode big endian锛夊氨鍖呭惈浜嗕笘鐣屼笂鍚勭璇█鏂囧瓧鎵鏈鐨瀛楃锛堜笉杩囦竴鑸殑绯荤粺涓嶈兘瀹屽叏鏀寔锛夈
  • 鎴戜繚瀛樹竴涓鏂囨。鏃跺,瀹冩绘槸璇存湁unicode鏍煎紡鐨瀛楃銆,unicode鏍煎紡鐨勫瓧绗︽槸...
    绛旓細unicode鏄竴绉嶅瓧绗︾紪鐮侊紝鍏剁洰鐨勬槸涓轰簡娑垫嫭鍚勭鏂囧瓧绗﹀彿锛岃鍒掍竴涓悓涓鐨缂栫爜搴忓垪銆備綘搴旇鏄湪鐢鏂囨湰鏂囨。瀵瑰惂锛熺偣鍙﹀瓨涓猴紝鐒跺悗鍦ㄤ笅闈㈢紪鐮佺殑鍦版柟閫UNICODE灏卞彲浠ヤ繚瀛樹簡銆備笉杩囪繖涓枃妗d笉涓瀹氬湪鏌愪簺璁惧涓婅兘鎵撳紑锛屾湁浜涗綆绔殑鎵嬫満灏变笉鑳芥墦寮銆
  • 濡備綍鍒ゆ柇涓涓鏂囨湰鏂囦欢鍐呭鐨勭紪鐮佹牸寮廢TF
    绛旓細1: public System.Text.Encoding GetFileEncodeType(string filename)2: { 3: System.IO.FileStream fs = new System.IO.FileStream(filename, System.IO.FileMode.Open, System.IO.FileAccess.Read);4: System.IO.BinaryReader br = new System.IO.BinaryReader(fs);5: Byte[] buff...
  • 涓轰粈涔堣浜嬫湰姣忔淇濆瓨閮借璇鏂囦欢鍚湁unicode鏍煎紡鐨瀛楃?
    绛旓細鍦ㄧ紪鐮閲鎵惧埌Unicode,鐒跺悗鍐嶄繚瀛樺氨鍙互浜
  • 扩展阅读:该文件中含有unicode ... 此文件中的某些unicode ... unicode在线转码中文 ... 中文转unicode在线工具 ... 文本去掉unicode格式 ... unicode转换为中文在线 ... unistd.h头文件找不到 ... unicode文本粘贴入 ... 文本编码unicode不适用 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网