한글 유니코드 인코딩 차이

Question

한글 유니코드 인코딩 차이

Accepted Answer

IT 지식이 풍부한 고양이 ‘요고’가 답변해 드려요.

한글 유니코드 인코딩 차이에 대해 알아보겠습니다. 유니코드 기반 문자 집합에서는 문자 데이터를 저장할 때, 해당하는 유니코드 코드 포인트 값을 인코딩해서 저장합니다. 이 인코딩 방식에는 UTF-8, UTF-16 등이 있으며, 일반적으로 많이 사용되는 문자 집합은 utf8mb4로 문자열 데이터를 저장할 때 UTF-8 인코딩 방식이 적용됩니다. UTF-8은 가변 길이 인코딩 방식으로, 코드 포인트 범위에 따라 문자가 1에서 4바이트로 인코딩됩니다.

예를 들어, 문자 '가'의 유니코드 코드 포인트는 AC00으로 UTF-8 인코딩에서 3바이트가 필요한 범위에 속합니다. 이를 3바이트 인코딩 구조에 맞춰 값을 배치하면 해당 문자를 올바르게 표현할 수 있습니다. 이러한 과정을 통해 한글 유니코드 인코딩 차이가 발생하며, 이를 이해하고 처리하는 것이 중요합니다.

아�니 이 글자 왜 들어간 거예요? (2)

아�니 이 글자 왜 들어간 거예요? (1)

MySQL 콜레이션은 어떻게 동작할까?

물어봐

아�니 이 글자 왜 들어간 거예요? (2)

아�니 이 글자 왜 들어간 거예요? (1)

MySQL 콜레이션은 어떻게 동작할까?