Loading...
MySQL 9.5 Reference Manual 9.5의 12.9.1 The utf8mb4 Character Set (4-Byte UTF-8 Unicode Encoding)의 한국어 번역본입니다.
아래의 경우에 피드백에서 신고해주신다면 반영하겠습니다.
감사합니다 :)
utf8mb4 문자 집합은 다음과 같은 특징을 가집니다:
BMP 및 보조 문자(supplementary character)를 지원합니다.
다중 바이트 문자당 최대 4바이트가 필요합니다.
utf8mb4는 utf8mb3 문자 집합과 대조되는데,
utf8mb3는 BMP 문자만 지원하고
문자당 최대 3바이트를 사용합니다:
BMP 문자의 경우, utf8mb4와
utf8mb3는 동일한 저장 특성을 가집니다:
동일한 코드 값, 동일한 인코딩, 동일한 길이.
보조 문자의 경우, utf8mb4는
이를 저장하는 데 4바이트가 필요하지만,
utf8mb3는 해당 문자를 전혀 저장할 수 없습니다.
utf8mb3 컬럼을 utf8mb4로 변환할 때,
보조 문자를 변환하는 것에 대해 걱정할 필요가 없습니다.
왜냐하면 그런 문자가 존재하지 않기 때문입니다.
utf8mb4는 utf8mb3의 상위 집합(superset)이므로,
다음과 같은 연결(concatenation) 작업에서 결과는
문자 집합 utf8mb4와
정렬 규칙(collation) utf8mb4_col을 갖습니다:
1SELECT CONCAT(utf8mb3_col, utf8mb4_col);
마찬가지로, WHERE 절의 다음 비교는
utf8mb4_col의 정렬 규칙에 따라 동작합니다:
1SELECT * FROM utf8mb3_tbl, utf8mb4_tbl 2WHERE utf8mb3_tbl.utf8mb3_col = utf8mb4_tbl.utf8mb4_col;
다중 바이트 문자 집합과 관련된 데이터 타입 저장에 대한 정보는, String Type Storage Requirements를 참조하십시오.
12.9 Unicode Support
12.9.2 The utf8mb3 Character Set (3-Byte UTF-8 Unicode Encoding)