국제화

국제적인 콘텐츠를 다루기 위해 필요한 HTTP 지원

국제 콘텐츠를 지원하기 위해, 서버는 클라이언트에게 가 문서의 문자와 언어를 알려줘서 클라이언트가 올바르게 문서를 이루고 있는 비트들을 문자들로 풀어내고, 올바르게 처리해서 콘텐츠를 제공한다.

서버는 HTTPS Content-Type charset 매개변수와 Content-Language 헤더를 통해서 문서의 문자와 언어를 알려준다. 클라이언트는 사용자가 어떤 언어를 이해할 수 있고, 어떤 알파벳의 코딩 알고리즘이 부라우저에 설치되어 있는지 Accept-Charset과 Accept-Language 헤더를 통해 말해준다.

![[image-261.png]]

image-261.png

문자 집합과 HTTP

차셋(Charset)은 글자를 비트로 변환하는 인코딩이다.

HTTP 차셋값 : 어떻게 엔터티 콘텐츠 비트들을 특정 문자 체계의 글자들로 바꾸는지 말해준다. 차셋 태그는 비트들을 글자들로 변환하거나 혹은 그 반대의 일을 하는 알고리즘을 명명한다. 차셋 테그틑 MIME 문자집합에 표준화되어있고, IANA가 관리한다. ![[image-262.png]]

image-262.png

문자집합과 인코딩은 어떻게 동작하는가?

세상에는 여러 문자가 있고, 컴퓨터는 비트를 이해하므로, 해당 비트를 어떻게 문자로 변환할지에 대한 디코딩 알고리즘이 존쟇나다. 비트를 문자로 변환할 때는 아래의 두 단계로 동작한다.

![[image-263.png]]

image-263.png

잘못된 차셋은 잘못된 글자들을 낳는다.

잘못된 charset 매개변수를 사용하면 클라이언트는 깨진 글자를 보여주게 될 것이다. ![[image-264.png]]

image-264.png