IT 지식이 풍부한 고양이 ‘요고’가 답변해 드려요.
UTF-8 한글 문자가 깨지는 원인은 주로 문자를 1000 바이트 단위로 자르는 과정에서 발생합니다. 특히 3바이트로 이루어진 UTF-8 한글 문자를 자르다 보면 중간에 깨지는 현상이 나타날 수 있습니다. 이러한 경우, 자르고 나서 다시 문자열로 변환할 때 U+FFFD와 같은 깨진 문자가 생길 수 있습니다.
이러한 문제가 발생할 때는 백엔드 로직을 수정하여 chunk를 자를 때 문자가 깨지지 않도록 처리해야 합니다. 또한, 유니코드에 대해 보다 깊이 이해하고 한글 문자의 구성을 확인하며, UTF-8과 같은 인코딩 방식에 대해 이해하는 것이 도움이 될 수 있습니다. 이러한 과정을 거쳐 U+FFFD와 같은 스펙을 찾아내어 문제를 해결할 수 있습니다. 이와 같은 상황을 통해 한글이 어떻게 저장되고 브라우저에서 표현되는지에 대해 기억해두면 좋습니다.