L'Unicode utilisé pour près de 50% de l'Internet mondial, d'après des statistiques de Google
Google vient de publier un graphique analysant les divers encodages de caractères sur Internet (ASCII, Latin-1, Windows 1252 ou l'Unicode). La plupart des encodages ne sont compatibles qu'avec un (ou une poignée) de langages, alors que l'Unicode les prend tous en charge, du chinois au zoulou.
Longtemps, l'Unicode a été utilisé en interne par le géant de Mountain View pour tous les textes recherchés. Tout autre encodage est préalablement converti en Unicode avant que le moteur de recherche ne se mette en marche.
La graphique suivant est tiré de données de Google obtenues lors de l'indexation des pages webs. La position dominante de l'Unicode s'y voit clairement. Son utilisation majoritaire autour du globe ne fait aucun doute, et allège pour Google le processus de prise en charge des différents langages.
Mais l'Unicode ne s'étend pas qu'en terme d'usage, mais aussi par le nombre de caractères qu'il prend en charge. Sa dernière version, la 5.2, en rajoute plus de 6.000 nouveaux.
Source : Le blog de Google
L'Unicode utilisé pour près de 50% de l'Internet mondial
D'après des statistiques de Google
L'Unicode utilisé pour près de 50% de l'Internet mondial
D'après des statistiques de Google
Le , par Katleen Erna
Une erreur dans cette actualité ? Signalez-nous-la !