La version 12.0 du standard Unicode est disponible, apporte 554 nouveaux caractères
Et prend en charge les langues moins utilisées

Le , par Bill Fassinou

185PARTAGES

13  0 
Unicode Inc. a annoncé hier dans un billet de blog que la version 12.0 du standard Unicode est maintenant disponible. Il comporte un ajout de 554 nouveaux caractères, portant le total de caractères dans la norme à 137 912. Ces ajouts incluent également quatre nouveaux scripts, pour un total de 150 scripts, ainsi que 61 nouveaux caractères emoji. Selon le site, la norme Unicode fournit un numéro unique pour chaque caractère, quels que soient la plateforme, le périphérique, l'application et la langue. Il a été adopté par tous les fournisseurs de logiciels modernes et permet désormais le transport des données sur de nombreux plateformes, appareils et applications différents sans aucune corruption.

La prise en charge d'Unicode constitue le fondement de la représentation des langues et des symboles dans les principaux systèmes d'exploitation, moteurs de recherche, navigateurs, ordinateurs portables et téléphones intelligents, ainsi qu'Internet et le Web (URL, HTML, XML, CSS, JSON, etc.). La prise en charge de l’Unicode est un moyen de mettre en œuvre ISO/CEI 10646. L'émergence de la norme Unicode et la disponibilité des outils qui la prennent en charge comptent parmi les tendances les plus récentes de la technologie logicielle mondiale. Dans le billet, le consortium a indiqué que les nouveaux scripts et caractères de la version 12.0 prennent en charge les langues moins utilisées dans le monde entier.


On peut citer parmi elles l’Elymaic qui est historiquement utilisé pour écrire l'araméen achéménide dans la partie sud-ouest de l'Iran moderne, le Nyiakeng Puachue Hmong utilisé pour écrire des langues modernes en Hmong au Laos, en Thaïlande, au Vietnam, en France, en Australie, au Canada et aux États-Unis. Il y a également le Wancho utilisé pour écrire la langue moderne wancho en Inde, au Myanmar et au Bhoutan, et pour finir le Nandinagari historiquement pour écrire en sanscrit et en kannada dans le sud de l'Inde. Un soutien supplémentaire pour les langues moins utilisées et les travaux universitaires a été étendu dans le monde entier, notamment :

  • des ajouts au script Miao pour écrire plusieurs dialectes Miao et Yi en Chine ;
  • hiragana et Katakana en petites lettres, utilisées pour écrire le japonais archaïque ;
  • les fractions et les symboles historiques tamouls utilisés en Inde du Sud ;
  • les lettres laotiennes utilisées pour écrire le Pali ;
  • les lettres latines utilisées dans la translittération égyptologique et ougaritique ;
  • les contrôles du format des hiéroglyphes, permettant le formatage complet des quadrats pour les hiéroglyphes égyptiens.

Dans Unicode 12.0, les ajouts de symboles populaires incluent 61 nouveaux personnages d’emojis, dont plusieurs nouveaux emojis pour l’accessibilité, les symboles d'échecs hétérodoxes et féeriques, etc. De plus, les annexes standards Unicode suivantes présentent des modifications notables liées aux modifications apportées aux propriétés des caractères. En particulier, il y a des changements dans :

  • UAX n° 14 : algorithme de rupture de ligne Unicode ;
  • UAX n° 29 : segmentation du texte Unicode ;
  • UAX n° 31 : identificateur Unicode et syntaxe des motifs ;
  • UAX n° 38 : base de données Unicode Han (Unihan) ;
  • UAX n° 45 : U-Source Ideographs.

Une autre nouvelle qu'apporte l'annonce est la mise à jour de trois autres spécifications Unicode. Il s’agit de :

  • UTS n° 10 : algorithme de classement Unicode - tri du texte Unicode ;
  • UTS n ° 39 : mécanisme de sécurité Unicode - réduction de l’usurpation d'identité Unicode ;
  • UTS n° 46 : traitement de compatibilité IDNA Unicode - traitement compatible des URL non-ASCII.

Certains parmi les internautes se disent émerveillés de voir les nouveaux changements dans la norme Unicode, mais déplorent le fait que les systèmes d’exploitation les plus utilisés sont en retard dans la prise en charge des spécifications Unicode et notamment Linux. « Google a cessé de travailler sur son initiative de polices Noto et les versions modernes d'Android sont bloquées avec la version antérieure à Unicode 10. Apple a très bien réussi à ajouter Emoji sur iOS, mais Mac OS semble être laissé pour compte.

Quant à Linux, l'installation d'Unifont donne une couverture, mais la plupart des distributions ne semblent pas avoir le moyen de mettre à jour les polices de base. Il semble que la majorité des systèmes ne s'en soucient pas, car leurs scripts natifs sont déjà supportés », a déclaré l’un d’eux. Pour plus d’informations sur les nouveautés et les apports de la version 12.0 d’Unicode, vous pouvez consulter sa note de version sur le site Web du consortium.

Source : Billet de blog

Et vous ?

Que pensez-vous des nouveautés apportées dans cette version d'Unicode ?

Voir aussi

La version 9.0 du standard Unicode est disponible et apporte 7500 nouveaux caractères parmi lesquels 72 emojis

Le standard Unicode (traitement de données XML)

Java : le JDK 12 est disponible en version bêta, il prend en charge Unicode 11 et dispose d'un nouveau format de clé privée codé x25519 et x448

Unicode donne la liste finale des emoji avec la version Emoji 12.0 l'un d'eux est bien parti pour s'ajouter dans la liste des emoji suggestifs

Une erreur dans cette actualité ? Signalez-le nous !

Avatar de ndjpoye
Membre du Club https://www.developpez.com
Le 07/03/2019 à 15:15
comptent parmi les tendances les plus récentes de la technologie logicielle mondiale
He tendance récente ?
Le temps passe !
1  0 
Avatar de Volgaan
Membre averti https://www.developpez.com
Le 07/03/2019 à 16:26
Citation Envoyé par ndjpoye Voir le message
He tendance récente ?
Le temps passe !
La première publication de la norme Unicode date de 1991 et le premier système Microsoft qui implémentait Unicode (dans le codage UCS-2) était Windows NT, sorti en 1993. Puis UTF-16 depuis Windows 2000.

Pas de doutes, c'est récent
0  0 
Avatar de Steinvikel
Membre expérimenté https://www.developpez.com
Le 10/03/2019 à 18:28
Citation Envoyé par la publication
L'émergence de la norme Unicode et la disponibilité des outils qui la prennent en charge comptent parmi les tendances les plus récentes de la technologie logicielle mondiale.
Combien de langage de programmation offre enfin un support fiable et complet d'Unicode (ne serait-ce que UTF-8 ou 16) ?
Combien de logiciels le supportent, les CMS, les framework, les extensions de correcteur orthographique, de reconnaissance de caractère (OCR), combien de font familly, etc.

Oui, il y a des parties logicielles qui le supportent depuis les 90', mais cette généralité est toute récente. ^^' ...ce sont les propos de l'article --> "tendances les plus récentes de la technologie logicielle mondiale".

Sans le support d'Unicode par l'OS, je doute qu'UTF-8 ce serait déployé aussi "rapidement". On aurait surement attendu 5-10 ans de plus.
0  0 

 
Contacter le responsable de la rubrique Accueil

Partenaire : Hébergement Web