본문 바로가기
my_lesson/_Linux

Linux 공공데이터 한글깨짐 변환하기(iconv 명령) utf-8 ↔ euc-kr

by boolean 2018. 10. 3.
728x90

리눅스에서 파일 인코딩 확인하기(file 명령) & 변환하기(iconv 명령) utf-8 ↔ euc-kr







웹개발하다보면, 페이지 인코딩, 등이 맞지 않아서 골치 아플때가 있죠.  그래서 때로는 수동으로 변환해주어야 할때도 있습니다.  요즘 작성되는 페이지는 utf-8 을 많이 사용하곤 있지만, 기존의 페이지들로 부터 업그레이드 하는 경우 변환이 필요하곤 합니다.






[파일 인코딩 확인]


리눅스 시스템에서 파일 인코딩을 확인하는 방법으로는 file 명령어를 사용하면 됩니다




file -bi 파일명




ex) 


> file -bi ttt.php


text/html; charset=utf-8







[파일 인코딩 변환]


리눅스 시스템에서 파일 인코딩을 변환할때는 방법으로는 iconv 명령어를 사용합니다




다음예 은 원래 utf-8 인코딩이었던 ttt.php 를  euc-kr 로 변환하여 ttt2.php 로 저장하는 겁니다



ex)


> iconv -c -f utf-8 -t euc-kr ttt.php > ttt2.php





위 iconv 명형 직후 file 명령어로 확인해보면  인코딩이 변환되었슴을 확인할수 있습니다.


> file -bi ttt2.php


text/html; charset=iso-8859-1




출처: http://bitsoul.tistory.com/150 [Happy Programmer~]


우분투에서 zip압축파일 해제시 한글 파일명 깨짐현상 해결하기

윈도우에서 압축된 엑셀파일이나 문서등이 한글 파일명으로 된 파일을 우분투에서 바로 압축해제시 한글 파일명이 다 깨져서 나온다.


윈도우에서 한글 기본 인코딩이 cp494로 되어 있고 우분투는 보통 utf-8 혹은 한글환경일 경우 euc-kr 환경으로 사용한다.


그래서 다른 인코딩일 경우 깨질 수 밖에 없다.


해결방법은 …터미널에서 압축을 풀 때 아래와 같이 인코딩을 지정해서 푼다.


>unzip -O cp949 압축파일.zip



관련이 있으며 패턴이 있는 여러파일 한번에 변경하기


> rename 's/.csv/.txt/g' *
폴더 내부에 있는 모든파일중 .csv확장자를 가진 파일의 확장자를 .txt로 바꾸어라


댓글