한글 한 글자 몇 바이트

Q. 제가 A라는 테이블을 하나 만들었습니다. name이란 칼럼이 있는데요,
이 칼럼엔 '홍길동', '이순신'과 같은 세 글자 이름이 들어가도록 하려고 합니다.
그래서 name 칼럼의 데이터 타입 길이는 6 Byte로 지정했습니다. 그런데 insert가 되지 않습니다.
그래서 데이터 타입 길이를 9 Byte로 해 주었더니 인제야 insert가 됩니다. 아무래도 한글 한 글자를 3 Byte로 인식하는 것 같은데, 왜 이런 걸까요?

A. 간단합니다. 오라클 설치할 때 문자 집합을 어떻게 설정했느냐에 따라 한글을 인식하는 Byte 길이가 달라집니다. KO16KSC5601(한글 완성형), KO16MSWIN949는 한글 한 글자를 2 Byte로 인식합니다. 하지만, UTF8/AL32UTF8의 경우 한글 한 글자의 길이를 3 Byte로 인식합니다. UTF8/AL32UTF8의 장점은 한글 정렬(order by)이 가능하지만, 3 Byte 길이를 소모합니다.

SQL PLUS 접속하신 후,

SELECT * FROM NLS_DATABASE_PARAMETERS WHERE PARAMETER LIKE '%CHARACTERSET%';

명령어를 실행시켜 주십시오. 현재 사용 중인 문자 집합을 확인할 수 있습니다.

※ 글자수 체크(UTF-8)

   ☞ 한글을 3byte로 계산

   

※ 글자수 체크(EUC-KR)

   ☞ 한글을 2byte로 계산

    ◈ 500자 제한의 예
    • 한글을 3byte로 계산하는 경우는 1500byte로 제한
    • 한글을 2byte로 계산하는 경우는 1000byte로 제한
    ◈ 1000자 제한의 예
    • 한글을 3byte로 계산하는 경우는 3000byte로 제한
    • 한글을 2byte로 계산하는 경우는 2000byte로 제한

      ▶ 글자수의 경우 띄어쓰기와 구두점을 글자 하나로 보기 때문에 위의 계산이 정확하게 일치하지는 않음.
      예: '하나, 둘'은 다섯 글자(글자수에서), 11byte(UTF-8에서), 8byte(EUC-KR에서)

※ 한글 맞춤법 검사기 : http://speller.cs.pusan.ac.kr/

토해낸자료들

자소서 글자수 ; 바이트 글자수 세기 & 한글 글자수 세기 방법

입시나 취업 지원시

자기소개서 작성에서 글자수 제약을 받게 되는데요.

수시원서 자기소개서를 기준으로 말씀드리면

1,000자 또는 1,500자 이내로 작성하게 되어 있습니다.

이번에 제가 가르치는 학생이 지원하는 학교에서는 

100자, 200자, 300자, 500자. 이렇게 쓰도록 되어 있더라고요.

한글에서 작성하다가 뭔가 쫌스러워서-

네이버에서 검색을 해봤더니

요렇게 글자수를 세어주는 프로그램이 있더라고요.

네이버에서 "글자 바이트 세기"라고 쳐보세요. 바로 요런 창이 나오는데요.

아주 좋았던 건,

아랫 부분에 공백포함 / 공백제외 구분해서 나와 있다는 것!!

큰 글씨는 글자 수, 작은 글씨는 바이트 수.

한글은 한 글자가 "2바이트"입니다.

영어는 알파벳 하나에 1바이트

공백, 문장부호 전부 1바이트입니다.

한글에서 글자 수를 세는 방법은 아주 간단합니다.

문서 작성 후, 위 그림과 같이 파일 - 문서정보 클릭.

그러면 요런 <문서정보>팝업이 뜨는데요.

위의 메뉴 중에서 "문서통계"를 클릭해보세요.

그러면 여기에서 글자 수가 얼마나 되는지 나온답니다.

지금 제가 봤던 문서의 글자수는 1,061자.

참 쉽쥬? ^^

똑같은 한 글자인데..
왜 차이가 나는 걸까요?
----------------------

글자의 수 때문입니다.

애초 컴퓨터는 알파벳을 바탕으로 만들어졌기 때문에, 그들 문자가 충분히 들어갈 정도의 2진수 공간만 있으면 됐죠. 1바이트는 8비트, 총 256개의 문자를 만들 수 있습니다.

그 안에는 알파벳 대소문자 52자, 숫자 10자, 그리고 각종 기호를 다 넣고도 남죠.
따라서 기본적으로 아스키코드는 0~127까지만 사용합니다.

그러나 한글, 한자 등은 그렇지 못하죠. 한글은 당국에서 공인한 글자(이른바 완성형)만 해도 2500자 정도가 됩니다. 이러니 1바이트로는 어림도 없죠. 2바이트로 하면 총 6만 5천 자 정도를 사용할 수 있고요. 때문에 한글은 2바이트를 사용합니다.

참고로, 위에 어느 분이 타수를 논하셨지만 그것은 아닙니다. 애초 한글은 n바이트라는 개념을 사용했습니다. n바이트란, 한글 한 자를 치기 위해 필요한 타수를 말합니다.
'구'는 2바이트, '궈'는 3바이트, '권'은 4바이트가 필요한 것이죠.

이 n바이트의 가장 큰 문제 중 하나는, 글자가 잡아먹는 바이트수와 실제 화면에 보이는 것이 다르다는 점입니다. 2바이트는 두 자리, 4바이트는 4자리를 차지하게 만들 수는 없죠. 그러다 보니, 실제로 내부에서는 2바이트~4바이트를 잡아먹는데 화면에는 똑같은 자리를 차지하게 하다 보니 한 줄을 80바이트라 치고 글자를 썼을 때 뒤에 남는 공간이 다른 등의 문제를 보였죠.

n바이트의 또 다른 문제는 사실상 영어의 1바이트 체계를 받아들여서 단말기에서만 변화를 보인다는 점입니다. 특정 기호({)를 사용해 한글이 시작됨을 알리고, 영어의 소문자를 입력하면 ㄱ, ㄴ, ㅏ, ㅑ, 등으로 바뀝니다. 그리고 } 기호를 이용해 닫습니다. 이렇게 하면 겉보기에는 한글 형태로 나타나지만(한글 가능한 단말기에서만) 내부적으로는 알파벳 소문자 및 몇 개의 부호로 이루어진 것이죠. 이러니 자칫 부분적인 복사(흔히 말하는 긁어다 붙이기)를 잘못하면 한글이 깨어지고, 혹은 {
기호가 아무 데나 복사되어 들어가 영어 소문자가 한글로 변하고, 이런 문제가 심각했죠.

그 외에도 n바이트 한글에는 이런저런 문제가 있어 각 기업들이 저마다 2바이트를 만들어 배포했고, 때문에 한글끼리도 제대로 통용이 되지 않는 사태가 벌어졌습니다. 결국 문공부(혹은 문교부?)에서 통일한 지금의 2바이트 한글 완성형을 내놓은 것입니다.

그러나 요즘은 조합형 한글을 더 많이 쓰는 것처럼 보입니다. 그만큼 컴퓨터 용량도 커지고 다양화가 되었기 때문인지는 모르겠지만요.

곰돌이푸 가족의 공부하기

  • 태그
  • 미디어로그
  • 위치로그
  • 방명록


일반 상식

곰돌이푸아빠 2020. 8. 21. 05:48


한글 한 글자 몇 바이트

tinyurl.com/yxbogduz

글자수 – Daum 검색

Daum 검색에서 글자수에 대한 최신정보를 찾아보세요.

search.daum.net

한글 한 글자 몇 바이트

다음검색에서 "글자수" 라고 검색하면 글자수를 세어볼 수 있는 도구를 이용할 수 있어요. 이때 한글2, 영어1 byte로 계산 옵션을 선택하면, 입력한 문자열의 바이트를 계산해주는데요, 보통 한글 한글자는 2바이트이고, 영어나 숫자는 1바이트로 카운트 한답니다. 그러니까, 1000바이트면 모두 한글로 입력하면 500자가 되는것이지만, 보통 중간에 띄어쓰기, 쉼표, 영어, 숫자등도 들어가기 때문에 그것보다 좀더 많을수도 적어질수도 있습니다. 실제로 입력해서 체크해보세요. 

저작자표시

You will face many defeats in life, but never let yourself be defeated. – Maya Angelou

태그

글자수세기, 바이트

  • 한글 한 글자 몇 바이트
    교통법규 위반 신고 포상금 제도가 있나요?
  • 한글 한 글자 몇 바이트
    국군복지포털 온라인 쇼핑몰 주소는?
  • 한글 한 글자 몇 바이트
    남부지방 김장배추 파종시기는 언제가 적절한가요?
  • 한글 한 글자 몇 바이트
    공무원 부모상 휴가일수는 며칠인가요?


    Secret