예를 들어 우체국에서 제공하는 DB정보는 대체로 euc-kr/iso8859-1 로 제공되는 경우가 있다.

이외에도 윈도우에서 작성한 데이터등이 euc-kr일 경우 최근 추세가 utf-8을 사용하는 분위기이므로 변경이 필요하다.


먼저 파일의 인코딩을 확인해야 한다.

$ file test.txt

test.txt: UTF-8 Unicode text


UTF-8이므로 UTF-8을 사용하는 콘솔(iTerm)에서 정상적으로 내용이 표시된다.

$ cat test.txt

가나다라마바사아


iconv를 사용하여 euckr로 변경한다.

$ iconv -futf8 -teuckr test.txt > test_euckr.txt


변경된 내용을 확인하면 눈치채신분들도 있겠지만 euc-kr로 변경되어 UTF-8을 사용하는 콘솔에서 정상 표시되지 않는다.

$ cat ./test_euckr.txt

�����ٶ󸶹ٻ��


파일의 인코딩을 확인한다.

$ file test_euckr.txt

test_euckr.txt: ISO-8859 text


euc-kr/ms949/iso8859 라고 봐도 무관하겠죠? 


반대로 euckr 에서 utf8로 변경할 경우 

$ iconv -feuckr -tutf8 test_euckr.txt > test_utf8.txt


$ cat test_utf8.txt

가나다라마바사아

다시 정상적으로 표시된다.



참고하세요. :)


Posted by twintail twintail