L'Unicode utilisé pour près de 50% de l'Internet mondial
D'après des statistiques de Google

Le , par Katleen Erna, Expert éminent sénior
L'Unicode utilisé pour près de 50% de l'Internet mondial, d'après des statistiques de Google

Google vient de publier un graphique analysant les divers encodages de caractères sur Internet (ASCII, Latin-1, Windows 1252 ou l'Unicode). La plupart des encodages ne sont compatibles qu'avec un (ou une poignée) de langages, alors que l'Unicode les prend tous en charge, du chinois au zoulou.

Longtemps, l'Unicode a été utilisé en interne par le géant de Mountain View pour tous les textes recherchés. Tout autre encodage est préalablement converti en Unicode avant que le moteur de recherche ne se mette en marche.

La graphique suivant est tiré de données de Google obtenues lors de l'indexation des pages webs. La position dominante de l'Unicode s'y voit clairement. Son utilisation majoritaire autour du globe ne fait aucun doute, et allège pour Google le processus de prise en charge des différents langages.



Mais l'Unicode ne s'étend pas qu'en terme d'usage, mais aussi par le nombre de caractères qu'il prend en charge. Sa dernière version, la 5.2, en rajoute plus de 6.000 nouveaux.

Source : Le blog de Google


Vous avez aimé cette actualité ? Alors partagez-la avec vos amis en cliquant sur les boutons ci-dessous :


 Poster une réponse

Avatar de s4mk1ng s4mk1ng - Membre éprouvé https://www.developpez.com
le 29/01/2010 à 10:55
Bah ce qui m'etonnes c'ets pourquoi il n'a "que" 50% si il prend en cherge un panel de languages assez importants.
Avatar de Uther Uther - Expert éminent https://www.developpez.com
le 29/01/2010 à 12:00
Certainement parce que ce n'est pas l'encodage par défaut de pas mal d'OS et d'outils de développement.
Avatar de khayyam90 khayyam90 - Responsable Portail https://www.developpez.com
le 29/01/2010 à 15:22
Citation Envoyé par Uther  Voir le message
Certainement parce que ce n'est pas l'encodage par défaut de pas mal d'OS et d'outils de développement.

Et parce que ça nécessite des objets particuliers puisque traditionnellement en développement un caractère équivaut à un octet, ce qui n'est plus toujours vrai si on travaille en utf8.
La progression en flèche de l'Unicode montre bien que c'est la voie à suivre pour tous les futurs développements web.
Avatar de Aurelien.Regat-Barrel Aurelien.Regat-Barrel - Expert éminent https://www.developpez.com
le 30/01/2010 à 14:50
Citation Envoyé par Katleen Erna  Voir le message
[B][SIZE="3"]La plupart des encodages ne sont compatibles qu'avec un (ou une poignée) de langages, alors que l'Unicode les prend tous en charge, du chinois au zoulou.

Apparement le Zoulou est un mauvais exemple, puisqu'il semble que ce soit une des rares langues qui puissent s'écrire en bon vieux ASCII ! Pour le fun, voici la liste des langues qu'on peut écrire en ASCII constituée par cet auteur :
http://blogamundo.net/dev/2006/12/06...nly-languages/

Bali
Basque
Bemba
Bicolano, Central
Bislama
Bugis
Cebuano
Chokwe
Chuukese
English
Ganda
Hiligaynon
Hmong Njua
Hmong, Northern Qiandong
Hmong, Southern Qiandong
Ido
Ilocano
Indonesian
Interlingua
Inuktitut, Greenlandic
Javanese
K'iche', Central
Kaonde
Konjo
Koongo
Latin
Latin (1)
Lozi
Luba-Kasai
Lunda
Luvale
Madura
Malagasy, Plateau
Mam, Northern
Marshallese
Ndebele
Ndonga
Nyanja (Chechewa)
Nyanja (Chinyanja)
Nyankore
Oromo, Borana-Arsi-Guji
Palauan
Pampangan
Pidgin, Nigerian
Pijin
Pohnpeian
Q'eqchi'
Rundi
Rwanda
Shona
Somali
Sotho, Southern
Sunda
Swahili
Swati
Tagalog
Tetun
Tonga
Totonac, Papantla
Uzbek, Northern (Latin)
Waray-Waray
Xhosa
Yao
Zhuang, Northern
Zulu

Offres d'emploi IT
Ingénieur conception en électronique de puissance H/F
Safran - Ile de France - Moissy-Cramayel (77550)
Ingénieur développement fpga (traitement vidéo) H/F
Safran - Ile de France - 100 rue de Paris 91300 MASSY
Ingénieur analyste programmeur (H/F)
Safran - Auvergne - Montluçon (03100)

Voir plus d'offres Voir la carte des offres IT
Contacter le responsable de la rubrique Accueil