Même si la plupart des langues peuvent être représentées grâce à un jeu de 128 caractères, il y a d'autres langues qui requièrent des jeux de caractères bien plus grands. Des méthodes de caractères multioctets ont été développées pour résoudre ce type de problème.
Lorsque vous manipulez des chaînes de caractères multioctets, pour couper, rechercher ou nettoyer une chaîne, vous devez utiliser deux octets consécutifs, qui représentent un seul caractère. Si vous n'y prenez pas garde, vous allez obtenir une chaîne corrompue et invalide, avec une représentation totalement incompréhensible.
mbstring
fournit les fonctions spécifiques de manipulations
de chaînes qui vous permet de travailler avec les encodages multioctets en PHP.
En plus de cela, mbstring
gère la traduction
entre les jeux de caractères disponibles. mbstring
est
également connu pour gérer l'Unicode, comme UTF-8 et UCS-2 ainsi que de
nombreux autres jeux mono-octets (listés dans
Encodages de caractères pris en charge).