Codificaciones de caracteres admitidas
Actualmente, el módulo mbstring
admite las siguientes condificaciones
de caracteres. Cualesquiera de estas codificaciones de caracteres
se pueden especificar en el parámetro encoding
de las funciones de
mbstring
.
Esta extensión de PHP admite las siguientes codificaciones de
caracteres:
- UCS-4*
- UCS-4BE
- UCS-4LE*
- UCS-2
- UCS-2BE
- UCS-2LE
- UTF-32*
- UTF-32BE*
- UTF-32LE*
- UTF-16*
- UTF-16BE*
- UTF-16LE*
- UTF-7
- UTF7-IMAP
- UTF-8*
- ASCII*
- EUC-JP*
- SJIS*
- eucJP-win*
- SJIS-win*
- ISO-2022-JP
- ISO-2022-JP-MS
- CP932
- CP51932
- SJIS-mac** (alias: MacJapanese)
- SJIS-Mobile#DOCOMO** (alias: SJIS-DOCOMO)
- SJIS-Mobile#KDDI** (alias: SJIS-KDDI)
- SJIS-Mobile#SOFTBANK** (alias: SJIS-SOFTBANK)
- UTF-8-Mobile#DOCOMO** (alias: UTF-8-DOCOMO)
- UTF-8-Mobile#KDDI-A**
- UTF-8-Mobile#KDDI-B** (alias: UTF-8-KDDI)
- UTF-8-Mobile#SOFTBANK** (alias: UTF-8-SOFTBANK)
- ISO-2022-JP-MOBILE#KDDI** (alias: ISO-2022-JP-KDDI)
- JIS
- JIS-ms
- CP50220
- CP50220raw
- CP50221
- CP50222
- ISO-8859-1*
- ISO-8859-2*
- ISO-8859-3*
- ISO-8859-4*
- ISO-8859-5*
- ISO-8859-6*
- ISO-8859-7*
- ISO-8859-8*
- ISO-8859-9*
- ISO-8859-10*
- ISO-8859-13*
- ISO-8859-14*
- ISO-8859-15*
- ISO-8859-16*
- byte2be
- byte2le
- byte4be
- byte4le
- BASE64
- HTML-ENTITIES
- 7bit
- 8bit
- EUC-CN*
- CP936
- GB18030**
- HZ
- EUC-TW*
- CP950
- BIG-5*
- EUC-KR*
- UHC (CP949)
- ISO-2022-KR
- Windows-1251 (CP1251)
- Windows-1252 (CP1252)
- CP866 (IBM866)
- KOI8-R*
- KOI8-U*
- ArmSCII-8 (ArmSCII8)
* denota codificaciones que también pueden ser utilizadas en expresiones regulares.
** denota codificaciones que están disponibles desde PHP 5.4.0.
Cualquier entrada en php.ini que acepte un nombre de codificación
también puede utilizar los valores "auto
" y
"pass
".
Las funciones de mbstring
que aceptan un nombre de codificación
también pueden utilizar el valor "auto
".
Si se establece el valor "pass
", no se realizará
ninguna conversión de la codificación de caracteres.
Si se establece el valor "auto
", se utilizará la lista
de codificaciones definida por el NLS.
Por ejemplo, si el NLS está configurado como Japanese
,
el valor que se asume será
"ASCII,JIS,UTF-8,EUC-JP,SJIS
".
Véase también mb_detect_order()
Tomolimo (olivier dot moron at raynet-it dot com) ¶11 years ago
Apart of this list, GB2312 encoding is also supported.
It is Chinese Simplified encoding which is now superseded by GB18030, but GB2312 is not in the list.
If you try to us it, the result will allright even if it is not in the list.
Regards,
Tomolimo
akniep at rayo dot info ¶11 years ago
Use mb_list_encodings() to check if an encoding is supported by mbstring before using its functions for it.
Anonymous ¶10 years ago
CP850 (DOS-Latin-1) is also supported.