linux文件编码格式转换linux文件的编码格式

linux中转换windows文件编码?

查看文件编码

在Linux中查看文件编码可以通过以下几种方式:

1.在Vim中可以直接查看文件编码

:setfileencoding

即可显示文件编码格式。

如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在

~/.vimrc文件中添加以下内容:

setencoding=utf-8fileencodings=ucs-bom,utf-8,cp936

这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。

文件编码转换

1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式

:setfileencoding=utf-8

2.iconv转换,iconv的命令格式如下:

iconv-fencoding-tencodinginputfile

比如将一个UTF-8编码的文件转换成GBK编码

iconv-fGBK-tUTF-8file1-ofile2

iconv-fgbk-tutf8linux常用命令.txt>linux常用命令.txt.utf8

文件名编码转换:

从Linux往windows拷贝文件或者从windows往Linux拷贝文件,有时会出现中文文件名乱码的情况,出现这种问题的原因是因为,windows的文件名中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致,所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。

在Linux中专门提供了一种工具convmv进行文件名编码的转换,可以将文件名从GBK转换成UTF-8编码,或者从UTF-8转换到GBK。

首先看一下你的系统上是否安装了convmv,如果没安装的话用:

yum-yinstallconvmv

安装。

下面看一下convmv的具体用法:

convmv-f源编码-t新编码文件名

常用参数:

-r递归处理子文件夹

--notest真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。

--list显示所有支持的编码

--unescap可以做一下转义,比如把%20变成空格

比如我们有一个utf8编码的文件名,转换成GBK编码,命令如下:

convmv-fUTF-8-tGBK--notestutf8编码的文件名

这样转换以后"utf8编码的文件名"会被转换成GBK编码(只是文件名编码的转换,文件内容不会发生变化)

linux如何把默认编码更改成utp-8?

在Linux下默认编码格式为UTF-8,使用locale命令查看编码格式。若编码格式不是UTF-8,编辑~/.bashrc,exportLC_ALL=en_US.utf8

exportLANG=$LC_ALL

linux怎么看文本的编码格式?

linux下经常遇到的编码问题如果你需要在linux中操作windows下的文件,那么你可能会经常遇到文件编码转换的问题。windows中默认的文件格式是gbk(gb2312),而linux一般都是utf-8。

查看编码的方法

方法一:filefilename

方法二:在vim中可以直接查看文件编码

:setfileencoding

如果你只是想查看其它编码格式的文件或者想解决用vim查看文件乱码的问题,那么你可以在

~/.vimrc文件中添加以下内容:

setencoding=utf-8fileencodings=ucs-bom,utf-8,cp936

这样,就可以让vim自动识别文件编码(可以自动识别utf-8或者gbk编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ascii)编码打开

文件编码转换

多平台方法:

iconv提供标准的程序和api来进行编码转换;

convert_encoding.py基于python的文本文件转换工具;

decodeh.py提供算法和模块来谈测字符的编码;

linux下文件编码转换:

方法一:

在vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式

:setfileencoding=utf-8

或者

11)设置文件集合,即要对哪些文件进行操作,可以使用通配符,比如我通常是对c/c++源程序进行编码转换

:args*.h*.cpp

2)给出要在每个文件上执行的命令,这里是转换编码:

:argdosetfenc=utf-8|update

方法二:

iconv转换

5.案例:

假如说我们将windows下的一个utf-8的文件传到linux环境下,linux环境下的系统编码是gb18030,我们cat的时候就会出现乱码,这个时候就应该想到转码了,下面我们来进行试验:

我们将windows下一个名为utf-8.sh的文件传到linux系统中,其中utf-8.sh的内容如下:

我是中文编码utf-8模式~

而linux系统的系统语言设置为:

#cat/etc/sysconfig/i18n

lang=zh_cn.gb18030

sysfont="latarcyrheb-sun16"

这个时候查看一下文件的内容及编码:

#fileutf-8.sh

utf-8.sh:utf-8unicodetext,withnolineterminators

#catutf-8.sh

锘挎__?腑___镰_tf-8妯″纺~#

#

这个时候我们就需要转换编码了,记得使用iconv

#iconv-futf-8-tgb18030utf-8.sh-ogb18030.sh

#catgb18030.sh

??我是中文编码utf-8模式~#

#filegb18030.sh

gb18030.sh:non-isoextended-asciitext,withnolineterminators

#

convmv就是更改文件名编码方式的一个工具。

比如

sudoconvmv-fgbk-tutf-8-r_notest/home

就是将/home目录下原来文件名是gbk编码方式的全部改为utf-8格式的。这里-f后面为原来的编码方式,-t后面是要更改为的编码方式,-r表示这个目录下面的所有文件,_notest表示马上执行,而不是仅仅测试而已。另外这命令好像要root才能执行,因此要加上sudo。



  • linux鎬庝箞璁剧疆缂栫爜鏍煎紡linux缂栫爜鏍煎紡璁剧疆
    绛旓細convert_encoding.py鍩轰簬python鐨勬枃鏈鏂囦欢杞崲宸ュ叿锛沝ecodeh.py鎻愪緵绠楁硶鍜屾ā鍧楁潵璋堟祴瀛楃鐨勭紪鐮侊紱linux涓嬫枃浠剁紪鐮佽浆鎹锛氭柟娉曚竴锛氬湪vim涓洿鎺ヨ繘琛岃浆鎹㈡枃浠剁紪鐮侊紝姣斿灏嗕竴涓枃浠惰浆鎹㈡垚utf-8鏍煎紡 :setfileencoding=utf-8 鎴栬 11锛夎缃枃浠堕泦鍚堬紝鍗宠瀵瑰摢浜涙枃浠惰繘琛屾搷浣滐紝鍙互浣跨敤閫氶厤绗︼紝姣斿鎴戦氬父鏄c/c++...
  • linux缂栫爜鏍煎紡杞崲鍛戒护linux鏍煎紡杞崲
    绛旓細鍦Linux涓杞崲鏂囦欢鐨缂栫爜鍙互浣跨敤iconv鍛戒护锛屽畠鐨勪娇鐢ㄥ緢绠鍗曠殑锛屾瘮濡備笅闈㈣繖鏉″懡浠ゅ皢GB2312缂栫爜鐨鏂囦欢杞崲鎴怳TF-8缂栫爜鐨勬枃浠讹細iconv-fgb2312-tutf8mygb2312.txt-omyutf8.txt杩欎釜渚嬪瓙涓璵ygb2412.txt鏄杞崲鐨勬枃浠讹紝myutf8.txt鏄浆鎹㈠悗鐨勬柊鏂囦欢銆俰conv鍛戒护鏈甯哥敤鐨勫舰寮忓氨鏄笂闈㈣繖鏉″懡浠わ紝瀹冩墍浣跨敤鐨勪笁...
  • Linux绯荤粺涓杞崲鏂囦欢缂栫爜鐨勬柟娉曞皬缁
    绛旓細涓銆佸埄鐢╥conv鍛戒护杩涜鏂囦欢鍐呭缂栫爜杞崲 鐢ㄦ硶锛 iconv [閫夐」...] [鏂囦欢...]鏈夊涓嬮夐」鍙敤:杈撳叆/杈撳嚭鏍煎紡瑙勮寖锛-f, --from-code=鍚嶇О 鍘熷鏂囨湰缂栫爜 -t, --to-code=鍚嶇О 杈撳嚭缂栫爜 淇℃伅锛-l, --list 鍒椾妇鎵鏈夊凡鐭ョ殑瀛楃闆 杈撳嚭鎺у埗锛-c 浠庤緭鍑轰腑蹇界暐鏃犳晥鐨勫瓧绗 -o, --output=FILE 杈撳嚭鏂囦欢...
  • linux缂栫爜鏍煎紡杞崲鍛戒护linux鏍煎紡杞崲
    绛旓細1.鍦╒im涓洿鎺ヨ繘琛杞崲鏂囦欢缂栫爜,姣斿灏嗕竴涓鏂囦欢杞崲鎴恥tf-8鏍煎紡 :setfileencoding=utf-8 2.iconv杞崲锛宨conv鐨勫懡浠ゆ牸寮忓涓嬶細iconv-fencoding-tencodinginputfile 姣斿灏嗕竴涓猆TF-8缂栫爜鐨勬枃浠惰浆鎹㈡垚GBK缂栫爜 iconv-fGBK-tUTF-8file1-ofile2 iconv-fgbk-tutf8linux甯哥敤鍛戒护.txt>linux甯哥敤鍛戒护.txt.utf...
  • linux涓鏌ョ湅鏂囦欢缂栫爜鏍煎紡浠ュ強杞崲鏍煎紡鏁欑▼
    绛旓細棣栧厛鎴戜滑鎵撳紑绯荤粺骞朵娇鐢╮oot璐︽埛鐧诲綍绯荤粺銆傜劧鍚庝娇鐢ㄥ懡浠も渇ile -i /opt/test.log鈥濇潵鏌ョ湅test.log鐨鏂囦欢缂栫爜鏍煎紡銆傚叿浣撳睍绀哄涓嬪浘鎵绀恒備笅闈㈡垜浠粙缁嶅懡浠conv鐨勫懡浠ょ殑鐢ㄦ硶锛岄鍏堟垜浠煡鐪嬪府鍔╂枃妗c傛墽琛屽懡浠も渋conv --help鈥濇煡鐪嬪府鍔╂枃妗c傚叿浣撳涓嬪浘鎵绀恒備笅闈㈣缁嗕粙缁嶅悇涓弬鏁扮殑鍚箟銆 -fencoding 琛ㄧず鍘熷...
  • linux涓鎬庝箞鏀瑰彉鏂囦欢鐨缂栫爜鏍煎紡
    绛旓細1.鍦╒im涓洿鎺ヨ繘琛杞崲鏂囦欢缂栫爜,姣斿灏嗕竴涓鏂囦欢杞崲鎴恥tf-8鏍煎紡 :set fileencoding=utf-8 2. enconv 杞崲鏂囦欢缂栫爜锛屾瘮濡傝灏嗕竴涓狦BK缂栫爜鐨勬枃浠惰浆鎹㈡垚UTF-8缂栫爜锛屾搷浣滃涓 enconv -L zh_CN -x UTF-8 filename 3. iconv 杞崲锛宨conv鐨勫懡浠ゆ牸寮忓涓嬶細iconv -f encoding -t encoding inputfile 姣...
  • Linux濡備綍浣跨敤enca鏌ョ湅鏂囦欢缂栫爜骞杞崲
    绛旓細1. 浣跨敤file鍛戒护锛歠ile鍛戒护鍙互鐢ㄦ潵纭畾鏂囦欢鐨勭被鍨嬶紝鍖呮嫭缂栫爜鏍煎紡銆傚湪缁堢涓緭鍏ヤ互涓嬪懡浠わ細file 鏂囦欢鍚 鍏朵腑锛屾枃浠跺悕鏄綘瑕佹煡鐪嬬殑鏂囦欢鐨勫悕绉版垨璺緞銆傛墽琛岃鍛戒护鍚庯紝缁堢浼氭樉绀烘枃浠剁殑绫诲瀷鍜岀紪鐮佹牸寮忋2. 浣跨敤enca鍛戒护锛歟nca鍛戒护鏄竴涓敤浜庢娴嬪拰杞崲鏂囨湰鏂囦欢缂栫爜鐨勫伐鍏枫傚湪缁堢涓緭鍏ヤ互涓嬪懡浠わ細enca -L zh_...
  • linux鏀缂栫爜鏍煎紡linux鏀圭紪鐮
    绛旓細浣跨敤Linux绯荤粺鏌ョ湅鏂囦欢缂栫爜鏈変袱绉嶆柟寮 鏂规硶涓锛氫娇鐢ㄥ懡浠nca鏌ョ湅鏂囦欢缂栫爜 杈撳叆锛歟ncafilename filename:Universaltransformationformat8bits;UTF-8 CRLFlineterminators 鏂规硶浜岋細閫氳繃浣跨敤Vim鐩存帴鏌ョ湅鏂囦欢缂栫爜 :setfileencoding 鍗冲彲鏄剧ず鏂囦欢鐨缂栫爜鏍煎紡銆傝嫢浣犳兂鏌ョ湅鍏跺畠缂栫爜鏍煎紡鐨勬枃浠舵垨鎯宠В鍐崇敤Vim鏌ョ湅鏂囦欢涔辩爜鐨勯棶棰橈紝...
  • linux绯荤粺涓 鏂囦欢澶鍜屾枃浠剁殑瀛楃闆缂栫爜鏂瑰紡杞崲
    绛旓細1.鍦╒im涓洿鎺ヨ繘琛杞崲鏂囦欢缂栫爜,姣斿灏嗕竴涓鏂囦欢杞崲鎴恥tf-8鏍煎紡    :set fileencoding=utf-8    2. iconv 杞崲锛宨conv鐨勫懡浠ゆ牸寮忓涓嬶細   iconv -f encoding -t encoding inputfile    姣斿灏嗕竴涓猆TF-8 缂栫爜鐨勬枃浠...
  • 濡備綍鍦Linux绯荤粺瀹炵幇瀛楃缂栫爜杞崲
    绛旓細1.鍦 Vim 涓洿鎺ヨ繘琛杞崲鏂囦欢缂栫爜,姣斿灏嗕竴涓鏂囦欢杞崲鎴 utf-8鏍煎紡 :set fileencoding=utf-8 2. iconv 杞崲锛宨conv 鐨勫懡浠ゆ牸寮忓涓嬶細杈撳叆/杈撳嚭鏍煎紡瑙勮寖锛 -f, --from-code=鍚嶇О 鍘熷鏂囨湰缂栫爜 -t, --to-code=鍚嶇О 杈撳嚭缂栫爜 淇℃伅锛 www.Svn8.Com -l, --list 鍒椾妇鎵鏈夊凡鐭ョ殑瀛楃闆 杈撳嚭...
  • 扩展阅读:免费格式转换器 ... linux将文件编码改为utf8 ... linux设置编码为utf-8 ... java设置文件编码格式 ... 查看文件编码格式 linux ... linux编码格式有哪几种 ... linux修改文件编码格式 ... 怎么修改linux编码 ... file命令查看文件编码格式 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网