Loading...
MySQL 9.5 Reference Manual 9.5의 12.2 Character Sets and Collations in MySQL의 한국어 번역본입니다.
아래의 경우에 피드백에서 신고해주신다면 반영하겠습니다.
감사합니다 :)
12.2.1 Character Set Repertoire 12.2.2 UTF-8 for Metadata
MySQL Server는 여러 문자 집합을 지원하며, 이에는 여러 Unicode 문자 집합도 포함됩니다. 사용 가능한 문자 집합을 표시하려면 INFORMATION_SCHEMA CHARACTER_SETS 테이블 또는 SHOW CHARACTER SET 문을 사용하십시오. 일부 목록은 다음과 같습니다. 보다 완전한 정보는 Section 12.10, “Supported Character Sets and Collations”를 참조하십시오.
1mysql> SHOW CHARACTER SET; 2+----------+---------------------------------+---------------------+--------+ 3| Charset | Description | Default collation | Maxlen | 4+----------+---------------------------------+---------------------+--------+ 5| big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 | 6| binary | Binary pseudo charset | binary | 1 | 7... 8| latin1 | cp1252 West European | latin1_swedish_ci | 1 | 9... 10| ucs2 | UCS-2 Unicode | ucs2_general_ci | 2 | 11... 12| utf8mb3 | UTF-8 Unicode | utf8mb3_general_ci | 3 | 13| utf8mb4 | UTF-8 Unicode | utf8mb4_0900_ai_ci | 4 | 14...
기본적으로 SHOW CHARACTER SET 문은 사용 가능한 모든 문자 집합을 표시합니다. 이 문은 어떤 문자 집합 이름을 매칭할지 나타내는 선택적 LIKE 또는 WHERE 절을 사용할 수 있습니다. 다음 예제는 일부 Unicode 문자 집합(Unicode 변환 형식을 기반으로 하는 것들)을 보여 줍니다:
1mysql> SHOW CHARACTER SET LIKE 'utf%'; 2+---------+------------------+--------------------+--------+ 3| Charset | Description | Default collation | Maxlen | 4+---------+------------------+--------------------+--------+ 5| utf16 | UTF-16 Unicode | utf16_general_ci | 4 | 6| utf16le | UTF-16LE Unicode | utf16le_general_ci | 4 | 7| utf32 | UTF-32 Unicode | utf32_general_ci | 4 | 8| utf8mb3 | UTF-8 Unicode | utf8mb3_general_ci | 3 | 9| utf8mb4 | UTF-8 Unicode | utf8mb4_0900_ai_ci | 4 | 10+---------+------------------+--------------------+--------+
특정 문자 집합은 항상 최소 하나의 정렬 규칙을 가지며, 대부분의 문자 집합은 여러 개의 정렬 규칙을 가집니다. 어떤 문자 집합에 대한 표시용 정렬 규칙을 나열하려면 INFORMATION_SCHEMA COLLATIONS 테이블 또는 SHOW COLLATION 문을 사용하십시오.
기본적으로 SHOW COLLATION 문은 사용 가능한 모든 정렬 규칙을 표시합니다. 이 문은 어떤 정렬 규칙 이름을 표시할지 나타내는 선택적 LIKE 또는 WHERE 절을 사용할 수 있습니다. 예를 들어, 기본 문자 집합인 utf8mb4에 대한 정렬 규칙을 보려면 다음 문을 사용하십시오:
1mysql> SHOW COLLATION WHERE Charset = 'utf8mb4'; 2+----------------------------+---------+-----+---------+----------+---------+---------------+ 3| Collation | Charset | Id | Default | Compiled | Sortlen | Pad_attribute | 4+----------------------------+---------+-----+---------+----------+---------+---------------+ 5| utf8mb4_0900_ai_ci | utf8mb4 | 255 | Yes | Yes | 0 | NO PAD | 6| utf8mb4_0900_as_ci | utf8mb4 | 305 | | Yes | 0 | NO PAD | 7| utf8mb4_0900_as_cs | utf8mb4 | 278 | | Yes | 0 | NO PAD | 8| utf8mb4_0900_bin | utf8mb4 | 309 | | Yes | 1 | NO PAD | 9| utf8mb4_bin | utf8mb4 | 46 | | Yes | 1 | PAD SPACE | 10| utf8mb4_croatian_ci | utf8mb4 | 245 | | Yes | 8 | PAD SPACE | 11| utf8mb4_cs_0900_ai_ci | utf8mb4 | 266 | | Yes | 0 | NO PAD | 12| utf8mb4_cs_0900_as_cs | utf8mb4 | 289 | | Yes | 0 | NO PAD | 13| utf8mb4_czech_ci | utf8mb4 | 234 | | Yes | 8 | PAD SPACE | 14| utf8mb4_danish_ci | utf8mb4 | 235 | | Yes | 8 | PAD SPACE | 15| utf8mb4_da_0900_ai_ci | utf8mb4 | 267 | | Yes | 0 | NO PAD | 16| utf8mb4_da_0900_as_cs | utf8mb4 | 290 | | Yes | 0 | NO PAD | 17| utf8mb4_de_pb_0900_ai_ci | utf8mb4 | 256 | | Yes | 0 | NO PAD | 18| utf8mb4_de_pb_0900_as_cs | utf8mb4 | 279 | | Yes | 0 | NO PAD | 19| utf8mb4_eo_0900_ai_ci | utf8mb4 | 273 | | Yes | 0 | NO PAD | 20| utf8mb4_eo_0900_as_cs | utf8mb4 | 296 | | Yes | 0 | NO PAD | 21| utf8mb4_esperanto_ci | utf8mb4 | 241 | | Yes | 8 | PAD SPACE | 22| utf8mb4_estonian_ci | utf8mb4 | 230 | | Yes | 8 | PAD SPACE | 23| utf8mb4_es_0900_ai_ci | utf8mb4 | 263 | | Yes | 0 | NO PAD | 24| utf8mb4_es_0900_as_cs | utf8mb4 | 286 | | Yes | 0 | NO PAD | 25| utf8mb4_es_trad_0900_ai_ci | utf8mb4 | 270 | | Yes | 0 | NO PAD | 26| utf8mb4_es_trad_0900_as_cs | utf8mb4 | 293 | | Yes | 0 | NO PAD | 27| utf8mb4_et_0900_ai_ci | utf8mb4 | 262 | | Yes | 0 | NO PAD | 28| utf8mb4_et_0900_as_cs | utf8mb4 | 285 | | Yes | 0 | NO PAD | 29| utf8mb4_general_ci | utf8mb4 | 45 | | Yes | 1 | PAD SPACE | 30| utf8mb4_german2_ci | utf8mb4 | 244 | | Yes | 8 | PAD SPACE | 31| utf8mb4_hr_0900_ai_ci | utf8mb4 | 275 | | Yes | 0 | NO PAD | 32| utf8mb4_hr_0900_as_cs | utf8mb4 | 298 | | Yes | 0 | NO PAD | 33| utf8mb4_hungarian_ci | utf8mb4 | 242 | | Yes | 8 | PAD SPACE | 34| utf8mb4_hu_0900_ai_ci | utf8mb4 | 274 | | Yes | 0 | NO PAD | 35| utf8mb4_hu_0900_as_cs | utf8mb4 | 297 | | Yes | 0 | NO PAD | 36| utf8mb4_icelandic_ci | utf8mb4 | 225 | | Yes | 8 | PAD SPACE | 37| utf8mb4_is_0900_ai_ci | utf8mb4 | 257 | | Yes | 0 | NO PAD | 38| utf8mb4_is_0900_as_cs | utf8mb4 | 280 | | Yes | 0 | NO PAD | 39| utf8mb4_ja_0900_as_cs | utf8mb4 | 303 | | Yes | 0 | NO PAD | 40| utf8mb4_ja_0900_as_cs_ks | utf8mb4 | 304 | | Yes | 24 | NO PAD | 41| utf8mb4_latvian_ci | utf8mb4 | 226 | | Yes | 8 | PAD SPACE | 42| utf8mb4_la_0900_ai_ci | utf8mb4 | 271 | | Yes | 0 | NO PAD | 43| utf8mb4_la_0900_as_cs | utf8mb4 | 294 | | Yes | 0 | NO PAD | 44| utf8mb4_lithuanian_ci | utf8mb4 | 236 | | Yes | 8 | PAD SPACE | 45| utf8mb4_lt_0900_ai_ci | utf8mb4 | 268 | | Yes | 0 | NO PAD | 46| utf8mb4_lt_0900_as_cs | utf8mb4 | 291 | | Yes | 0 | NO PAD | 47| utf8mb4_lv_0900_ai_ci | utf8mb4 | 258 | | Yes | 0 | NO PAD | 48| utf8mb4_lv_0900_as_cs | utf8mb4 | 281 | | Yes | 0 | NO PAD | 49| utf8mb4_persian_ci | utf8mb4 | 240 | | Yes | 8 | PAD SPACE | 50| utf8mb4_pl_0900_ai_ci | utf8mb4 | 261 | | Yes | 0 | NO PAD | 51| utf8mb4_pl_0900_as_cs | utf8mb4 | 284 | | Yes | 0 | NO PAD | 52| utf8mb4_polish_ci | utf8mb4 | 229 | | Yes | 8 | PAD SPACE | 53| utf8mb4_romanian_ci | utf8mb4 | 227 | | Yes | 8 | PAD SPACE | 54| utf8mb4_roman_ci | utf8mb4 | 239 | | Yes | 8 | PAD SPACE | 55| utf8mb4_ro_0900_ai_ci | utf8mb4 | 259 | | Yes | 0 | NO PAD | 56| utf8mb4_ro_0900_as_cs | utf8mb4 | 282 | | Yes | 0 | NO PAD | 57| utf8mb4_ru_0900_ai_ci | utf8mb4 | 306 | | Yes | 0 | NO PAD | 58| utf8mb4_ru_0900_as_cs | utf8mb4 | 307 | | Yes | 0 | NO PAD | 59| utf8mb4_sinhala_ci | utf8mb4 | 243 | | Yes | 8 | PAD SPACE | 60| utf8mb4_sk_0900_ai_ci | utf8mb4 | 269 | | Yes | 0 | NO PAD | 61| utf8mb4_sk_0900_as_cs | utf8mb4 | 292 | | Yes | 0 | NO PAD | 62| utf8mb4_slovak_ci | utf8mb4 | 237 | | Yes | 8 | PAD SPACE | 63| utf8mb4_slovenian_ci | utf8mb4 | 228 | | Yes | 8 | PAD SPACE | 64| utf8mb4_sl_0900_ai_ci | utf8mb4 | 260 | | Yes | 0 | NO PAD | 65| utf8mb4_sl_0900_as_cs | utf8mb4 | 283 | | Yes | 0 | NO PAD | 66| utf8mb4_spanish2_ci | utf8mb4 | 238 | | Yes | 8 | PAD SPACE | 67| utf8mb4_spanish_ci | utf8mb4 | 231 | | Yes | 8 | PAD SPACE | 68| utf8mb4_sv_0900_ai_ci | utf8mb4 | 264 | | Yes | 0 | NO PAD | 69| utf8mb4_sv_0900_as_cs | utf8mb4 | 287 | | Yes | 0 | NO PAD | 70| utf8mb4_swedish_ci | utf8mb4 | 232 | | Yes | 8 | PAD SPACE | 71| utf8mb4_tr_0900_ai_ci | utf8mb4 | 265 | | Yes | 0 | NO PAD | 72| utf8mb4_tr_0900_as_cs | utf8mb4 | 288 | | Yes | 0 | NO PAD | 73| utf8mb4_turkish_ci | utf8mb4 | 233 | | Yes | 8 | PAD SPACE | 74| utf8mb4_unicode_520_ci | utf8mb4 | 246 | | Yes | 8 | PAD SPACE | 75| utf8mb4_unicode_ci | utf8mb4 | 224 | | Yes | 8 | PAD SPACE | 76| utf8mb4_vietnamese_ci | utf8mb4 | 247 | | Yes | 8 | PAD SPACE | 77| utf8mb4_vi_0900_ai_ci | utf8mb4 | 277 | | Yes | 0 | NO PAD | 78| utf8mb4_vi_0900_as_cs | utf8mb4 | 300 | | Yes | 0 | NO PAD | 79| utf8mb4_zh_0900_as_cs | utf8mb4 | 308 | | Yes | 0 | NO PAD | 80+----------------------------+---------+-----+---------+----------+---------+---------------+
이러한 정렬 규칙에 대한 자세한 정보는 Section 12.10.1, “Unicode Character Sets”를 참조하십시오.
Collation은 다음과 같은 일반적인 특성을 가집니다:
서로 다른 두 문자 집합은 동일한 정렬 규칙을 가질 수 없습니다.
각 문자 집합에는 기본 _정렬 규칙_이 있습니다. 예를 들어, utf8mb4와 latin1의 기본 정렬 규칙은 각각 utf8mb4_0900_ai_ci와 latin1_swedish_ci입니다. INFORMATION_SCHEMA CHARACTER_SETS 테이블과 SHOW CHARACTER SET 문은 각 문자 집합의 기본 정렬 규칙을 나타냅니다. INFORMATION_SCHEMA COLLATIONS 테이블과 SHOW COLLATION 문에는 각 정렬 규칙이 해당 문자 집합의 기본값인지 여부를 나타내는 열이 있습니다(기본값이면 Yes, 아니면 비어 있음).
Collation 이름은 연관된 문자 집합의 이름으로 시작하며, 일반적으로 다른 정렬 규칙 특성을 나타내는 하나 이상의 접미사가 뒤따릅니다. 명명 규칙에 대한 추가 정보는 Section 12.3.1, “Collation Naming Conventions”를 참조하십시오.
어떤 문자 집합에 여러 개의 정렬 규칙이 있는 경우, 특정 애플리케이션에 어떤 정렬 규칙이 가장 적합한지 명확하지 않을 수 있습니다. 부적절한 정렬 규칙 선택을 피하려면, 대표적인 데이터 값으로 몇 가지 비교를 수행하여 특정 정렬 규칙이 기대하는 방식으로 값을 정렬하는지 확인하십시오.
12.1 Character Sets and Collations in General
12.2.1 Character Set Repertoire