Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Abstract Wikipedia, le projet expérimental de l'encyclopédie en ligne, utilise un langage de description
Pour générer du contenu dans d'autres langues

Le , par Stéphane le calme

546PARTAGES

10  0 
Wikipédia est disponible dans plus de 300 langues. Cependant, la portée de l'encyclopédie en ligne gratuite varie considérablement selon la langue. De plus, si un article dans une langue vient à être complété par de nouvelles informations, cela peut prendre un certain temps avant que ces modifications soient apportées dans d'autres langues, si cela venait même à se produire. La Fondation Wikimedia voudrait désormais s'attaquer à ce problème avec le projet Abstract Wikipedia .

À l'aide d'un langage de description, Abstract Wikipedia devrait être capable de capturer des informations indépendamment de la langue. Le résultat devrait ensuite être facilement traduit dans les différentes langues de Wikipédia. Derrière cette idée figure Denny Vrandečić, qui a posé les fondations d’Abstract Wikipédia il y a sept ans avec la base de connaissances Wikidata .

La patronne de Wikimedia, Katherine Maher, a expliqué dans un billet que :

« Abstract Wikipedia propose une nouvelle façon de générer un contenu encyclopédique de base de manière multilingue, permettant à plus de contributeurs et à plus de lecteurs de partager plus de connaissances dans plus de langues. Il s'agit d'une approche qui vise à faciliter la coopération multilingue sur nos projets, à accroître la durabilité de notre mouvement en élargissant l'accès à la participation, à améliorer l'expérience utilisateur pour les lecteurs de toutes les langues et à innover dans la connaissance gratuite en reliant certaines des forces de notre mouvement pour créer quelque chose de nouveau.

« Il s'agit de notre premier nouveau projet en plus de sept ans. Abstract Wikipedia a été soumis en tant que proposition de projet par Denny Vrandečić en mai 2020 après des années de préparation et de recherche, conduisant à un plan détaillé et à des discussions animées dans les communautés Wikimedia. Nous savons que l'énergie et la créativité de la communauté se heurtent souvent à des barrières linguistiques, et les informations disponibles dans une langue peuvent ne pas arriver dans d'autres Wikipédias. Abstract Wikipédia a l'intention de ressembler à un Wikipédia, mais de s'appuyer sur les puissants modèles conceptuels indépendants de la langue de Wikidata, dans le but de permettre aux bénévoles de créer et de maintenir des articles Wikipédia dans notre monde Wikimedia polyglotte.

« Le projet permettra aux volontaires de rassembler les bases d'un article en utilisant des mots et des entités de Wikidata. Parce que Wikidata utilise des modèles conceptuels censés être universels dans toutes les langues, il devrait être possible d'utiliser et d'étendre ces blocs de connaissances pour créer des modèles d'articles qui ont également une valeur universelle. À l'aide de code, les volontaires pourront traduire ces ‘articles’ abstraits dans leur propre langue. En cas de succès, cela pourrait éventuellement permettre à tout le monde de lire n'importe quel sujet dans Wikidata dans sa propre langue.

« Comme vous pouvez l'imaginer, ce travail nécessitera beaucoup de développement logiciel et beaucoup de coopération entre Wikimédiens. Afin de rendre cet effort possible, Denny rejoindra la Fondation en tant que membre du personnel en juillet et dirigera cette initiative. »


Abstract Wikipédia n'est pas destiné à remplacer l'encyclopédie en ligne existante

Le projet a été proposé pour la première fois dans un article de 22 pages par Denny Vrandečić, fondateur de Wikidata, plus tôt cette année. Il avait lancé une nouvelle idée qui permettrait aux contributeurs de créer du contenu en utilisant une notation abstraite qui pourrait ensuite être traduite dans différentes langues naturelles, équilibrant le contenu de manière plus égale, quelle que soit la langue que vous parlez.

Il a suggéré un projet qui pourrait être utilisé par n'importe qui dans le monde pour entrer des informations sous forme de notation abstraite, puis un outil appelé Wikilambda hébergerait une collection de fonctions qui pourraient transformer la notation en texte en langage naturel. Selon lui, le projet ne nécessiterait pas une percée majeure dans les connaissances actuelles sur la génération du langage naturel ou la représentation des connaissances lexicales.

Vrandečić ne voit pas son projet comme un remplacement du modèle Wikipedia existant, dans lequel les auteurs écrivent les textes. Selon Vrandečić dans sa proposition publiée en avril, leur qualité ne pourrait jamais être égalée par la qualité des textes traduits automatiquement. « Précisons que cette proposition ne nécessite pas le remplacement des Wikipédias actuelles. Il est conçu comme une offre aux communautés pour combler les lacunes qui existent actuellement », indiquait-il sur la plateforme.

Et de continuer en disant « Il serait présomptueux de supposer qu'un texte généré par Wikilambda atteindra jamais l'éclat et la subtilité qui ont fait briller bon nombre de nos articles Wikipédia actuels. Et bien qu'il existe également plusieurs avantages pour de nombreuses parties de Wikipédia en anglais (par exemple pour les modèles globaux ou le contenu qui est en fait plus riche dans une langue locale), je serais surpris si la communauté de Wikipédia en anglais commençait à adopter plutôt largement ce que Wikilambda propose. Mais il semble qu'il soit difficile de surestimer l'effet que cette proposition pourrait avoir sur les petites communautés, et éventuellement sur l'ensemble de notre mouvement afin de nous rapprocher un peu plus de notre vision d'un monde dans lequel chacun peut partager la somme de toutes les connaissances. »

Maintenant que ce projet a été approuvé, il permettra aux volontaires de rassembler les bases d'un article en utilisant des mots et des entités de Wikidata. Les volontaires pourront traduire ces « articles » abstraits dans leur propre langue.

Abstract Wikipédia a l'intention de ressembler à un Wikipédia, mais de s'appuyer sur les puissants modèles conceptuels indépendants de la langue de Wikidata. L'annonce officielle mentionne qu'il s'agit d'un projet expérimental et peut offrir à certaines communautés de grands avantages tandis que d'autres communautés peuvent moins s'engager.


Abstract Wikipedia

Comment cela fonctionne ?

Dans un billet, Vrandečić donne l’illustration suivante :

« Imaginez un instant que nous commencions à résumer le contenu d'un texte. Au lieu de dire "afin de lui refuser l'avantage du titulaire, le conseil d'administration vote en janvier 2018 pour la remplacer par Mark Farrell comme maire intérimaire jusqu'aux élections spéciales", imaginons que nous disions quelque chose de plus abstrait comme elect(elector: Board of Supervisors, electee: Mark Farrell, position: Mayor of San Francisco, reason: deny(advantage of incumbency, London Breed)) et plus encore, tous ces identificateurs seraient indépendants de la langue, de sorte que cette chose ressemblerait en fait davantage à Q40231 (Q3658756, Q6767574, Q1343202 (Q6015536, Q6669880)). À première vue, cela ressemble beaucoup à une déclaration dans Wikidata, mais simplement en mettant cela dans une série d'autres déclarations abstraites, et en ayant un tissu de connexion entre ces déclarations nues, nous nous rapprochons beaucoup plus de ce dont a besoin un texte.

« Mais évidemment, nous ne montrerions pas ce contenu abstrait aux lecteurs. Nous devons encore traduire le contenu abstrait en langage naturel. Nous devons donc savoir que le constructeur elect mentionné ci-dessus prend les trois paramètres de l'exemple et que nous devons créer un modèle tel que {elector} elected {electee} to {position} in order to {reason} Et puisque la création de tels traducteurs doit être faite pour chaque langue prise en charge, nous devons avoir un endroit pour créer de tels traducteurs afin qu'une communauté puisse le faire.

« Pour cela, je propose un nouveau projet Wikimedia, appelé au préalable Wikilambda (et je suis nul avec les noms, donc je ne m'attends pas à ce que le projet s'appelle réellement ainsi). Wikilambda serait un nouveau projet pour créer, maintenir, gérer, cataloguer et évaluer une nouvelle forme d'actifs de connaissances: les fonctions ».

Ce sont donc ces fonctions qui vont prendre le contenu abstrait comme Q40231(Q3658756, Q6767574, Q1343202(Q6015536, Q6669880)) et retourner du texte traduit en une autre langue.

Sources : Annonce Abstract Wikipedia, Denny

Et vous ?

Que pensez-vous de ce projet ?
Vous semble-t-il réalisable ?
Si oui, dans quelle mesure ? Si non, pourquoi ?

Une erreur dans cette actualité ? Signalez-le nous !

Avatar de abriotde
Membre expérimenté https://www.developpez.com
Le 06/07/2020 à 13:48
inventer une langue de toute pièce c'était perdu d'avance et ça n'a aucun intérêt
Bien sûr que si, ça en a beaucoup a commencer par le fait de ne pas favoriser les puissants. Car si tu veux aller par là, le chinois est bien plus fcile a apprendre que l'anglais. D'accord, il est très difficile à écrire mais il peut s'écrire en phonétique et c'est une "vrai" langue déjà plus ou moins bien parlé par plus d'1/7° de la planette.

Tu dis que l’espéranto ne sert à rien car tu habite dans un pays ou tous le monde parle la même langue. Mais en Inde l'esperanto connait un vrai succès pour son côté non dominant et pratique.

Un autre inconvénient de l'anglais c'est son accent. Souvent il n'y a que les français à comprendre les français parlant anglais. Idem pour les indiens ou les africains. L’espéranto est dans les plus simple a prononcer (contrairement au chinois ou il y a la notion de tonalité qui n'est pas facile à maîtriser).

PS : une langue d'échange n'a pas besoin d'être pratique (avec des raccourcis pour les mots courant comme les verbes être et avoir). Cela lui évite de trop changer ce qui est aussi un autre handicap des "vrai" langues.
6  0 
Avatar de Voïvode
Membre émérite https://www.developpez.com
Le 06/07/2020 à 20:01
Citation Envoyé par Sodium Voir le message
Parce que vous ne consommez pas de programmes culturels anglophones vous ? Il y a un équivalent francophone à Breaking Bad, Games of throne...
Tu ne réagis pas sur le fond de ma remarque : Tu consommes ce contenu, sans effort particulier, parce que tes origines t’y prédisposent. Partant de là, l’aisance que tu ressens avec l’anglais n’est certainement pas partagée par une grande partie de la population de cette planète. En considérant les 1,2 milliards de locuteurs anglophones (chiffre optimiste, car cela compte 850 millions de locuteurs non-natifs estimés), cela fait au moins 5,5 milliards de gens qui ne partageront probablement pas ton point de vue.

D’ailleurs, pourquoi faudrait-il un « équivalent » à Breaking Bad ou Game of Thrones ? On peut vivre avec des séries complètement différentes, ou pas de série du tout (comme moi, car ça ne m’intéresse pas).

Ce n'est pas un préjugé c'est une question technique (je suis chanteuse, j'ai un peu étudié la question). L'anglais avec ses percussives et ses consonnes comme voyelles facilement interchangeables est très adapté au chant tout en restant compréhensible. Le français pas du tout. Par exemple si tu ne roules pas un R, ça casse le flux d'air et on y perd en qualité vocale. C'est pour ça qu'on ne pige absolument rien aux opéras, la prononciation est adaptée pour être facile à chanter mais du coup on n'y bite rien.

Un peu de doc ici pour ceux que ça intéresse :
https://www.thenakedvocalist.com/qui...-substitution/
Je ne sais pas d’où tu sors cette analyse, mais cela ressemble fortement à de l’avis personnel. Des gens qui pensent que l’anglais n’est pas idéal pour chanter, ça existe aussi.

L’anglais est pauvre en voyelles ouvertes et truffées de diphtongues. La substitution de voyelles est précisément une correction pour rendre l’anglais plus pratique pour le chant. Au prix de sonner parfois bizarrement pour un natif.

Peut-on faire des choses intéressantes avec ça ? Oui, j’imagine. Cela rend-il l’anglais intrinsèquement meilleur qu’une autre langue pour chanter ? Non.
6  0 
Avatar de esperanto
Membre expérimenté https://www.developpez.com
Le 06/07/2020 à 7:49
Citation Envoyé par Sodium Voir le message
J'ai la flemme de me lancer dans un débat de dix pages sur quelle langue est la plus mieux que l'autre, mais le point à retenir c'est qu'à ce niveau, c'est toujours l'usage qui s'impose. Tu ne feras pas passer une nouvelle loi universelle. On en a une qui fait déjà plus ou moins bien le taf, l'anglais, qui permet de se faire comprendre à peu près partout dans le monde. Donc plutôt que de chercher à révolutionner, renforçons l'existant.
Super, en moins de trois messages tu nous a sorti l'argument massue qui permet depuis des années à Windows et tous les logiciels propriétaires d'écraser toute argumentation du monde du libre. Parce que les logiciels propriétaires, eux aussi ils font plus ou moins bien le taf, moi je dirais plutôt moins que plus, mais puisqu'ils sont là faisons avec...
6  1 
Avatar de Voïvode
Membre émérite https://www.developpez.com
Le 06/07/2020 à 16:50
Citation Envoyé par Sodium Voir le message
Donc pourquoi est-ce que je parle très bien anglais de mon côté ? Je n'y ai jamais mis le moindre effort, je me suis contentée de consommer des produits culturels (jeux-vidéo, littérature, films/série) sans jamais montrer de l'intérêt pour les cours académiques (qui étaient d'ailleurs ridiculement peu nombreux en plus d'arriver beaucoup trop tard dans le cursus).
La réponse est à moitié dans la question : Tu as consommé des produits culturels anglophones. Et tu as pu les consommer parce que tu as toi-même le bagage culturel nécessaire, en tant qu’européenne.

90 % du vocabulaire anglais a un lien avec le français, le latin ou une langue germanique (à parts à peu près égales) et avec des notions grammaticales communes. Si tu ne sens pas que connaitre l’allemand et le français aide un peu, eh bien… tu peux essayer d’expliquer à un Russe, un Iranien, un Japonais, un Thaï ou un Indonésien que l’anglais est une langue facile.

Citation Envoyé par Sodium Voir le message
Et l'anglais est très adapté au chant là où le français ne l'est pas du tout, ce qui explique une partie de sa diffusion.
Et l’allemand est très adapté pour donner des ordres, ce qui explique en partie son industrie lourde et ses victoires militaires. Ton préjugé est du même niveau.
Ne pas confondre cause et conséquence, tout ça tout ça…

Citation Envoyé par Sodium Voir le message
On se comprend très bien en anglais avec les hollandais ou les allemands (et dans de très nombreux autres pays), imposer une autre langue sous prétexte que certains ont la flemme ou sont de mauvaise volonté correspond également à un gâchis d'argent et de d'énergie énorme.

Apprenez l'anglais, c'est tout.
La Chine représente 28 % de la production manufacturière mondiale. Avec ses 1,2 milliards de Chinois, parler autre chose que le mandarin et écrire autre chose que le chinois est un gâchis d’argent et d’énergie énorme. Avec son industrie audiovisuelle de masse et sa littérature, il n’y a pas d’effort particulier à faire pour apprendre. Il suffit de consommer !

Apprenez le chinois, c’est tout.
5  0 
Avatar de Pyramidev
Expert confirmé https://www.developpez.com
Le 04/07/2020 à 20:57
Dans un monde idéal, la langue internationale :
  • serait simple à apprendre, ce qui permettrait à un maximum de personne de savoir l'utiliser, y compris pour manipuler des concepts avancés, et
  • aurait une grammaire non ambigüe, ce qui permettrait de l'analyser plus facilement par programme.


Hélas :
  • La langue qui s'est imposée à l'international est l'anglais à cause du poids culturel des États-Unis.
  • L'espéranto est plus rapide à apprendre que la plupart des langues, mais a une grammaire ambigüe et est moins connu que l'anglais.
  • Le lojban a, paraît-il, une grammaire non ambigüe, mais il est encore moins connu que l'espéranto.


Concernant Abstract Wikipedia, l'idée de sauvegarder directement un arbre syntaxique traduisible vers plein de langues naturelles est intéressante, mais je me demande comment se passera l'édition de cet arbre syntaxique.
4  0 
Avatar de esperanto
Membre expérimenté https://www.developpez.com
Le 06/07/2020 à 9:15
Citation Envoyé par Sodium Voir le message
L'anglais est de loin celle qui m'a semblé la plus simple à apprendre
Vu que plus loin je comprends que le français n'est pas ta langue maternelle, peux-tu comprendre que l'anglais est beaucoup plus facile pour celui dont la langue maternelle est germanique que pour un français ou un espagnol?

Citation Envoyé par Sodium Voir le message
et c'est également de loin ma langue préférée.
ce qui prouve que ton argumentation est purement subjective.

Citation Envoyé par Sodium Voir le message
L'esperanto bah... osef ? Quel intérêt sérieusement, inventer une langue de toute pièce c'était perdu d'avance et ça n'a aucun intérêt.
Encore une fois, avec une telle argumentation, arrêtons de développer ou alors allons tous travailler pour les GAFAM, parce que leurs produits font tellement bien le job... Quoique non, évidemment on va nous dire "concurrence libre et non faussée", et faudrait pas perdre un point de croissance...
5  1 
Avatar de SimonDecoline
Expert confirmé https://www.developpez.com
Le 06/07/2020 à 14:32
Citation Envoyé par Sodium Voir le message
Heu non, en Belgique le français, l'allemand et le néerlandais sont trois langues officielles et l'anglais est très parlé à Bruxelles. Au Luxembourg les natifs parlent généralement au moins Français/Luxembourgeois/Anglais/Allemand plus Portugais pour beaucoup.
Faut arrêter de généraliser. Bruxelles et le Luxembourg sont certainement très polyglottes mais c'est beaucoup moins le cas du reste du Benelux (qui déjà est une région particulièrement ouverte aux langues). Et puisqu'on en est à raconter notre vie, je suis déjà allé plusieurs fois dans des petites villes des Pays-Bas et on est quand même loin du "tout le monde parle l'anglais".

Citation Envoyé par Sodium Voir le message
Votre argumentaire n'a aucun sens, le seul véritable problème est que l'anglais n'est pas comme il le devrait enseigné dès la petite enfance. Une bonne partie de la planète parle déjà anglais, la résolution logique est donc d'instruire le reste plutôt que d'en rajouter une nouvelle. Mais on a toujours le réflexe de vouloir réformer la société parce que l'on est incapable de se réformer, soi-même, comme disait Asimov...
C'est vraiment insupportable cette condescendance. Tu ne comprendra donc jamais que tes vérités absolues ne sont que tes croyances et que les autres ont également le droit d'avoir des arguments et des priorités différentes des tiennes ?
5  1 
Avatar de esperanto
Membre expérimenté https://www.developpez.com
Le 06/07/2020 à 15:38
Citation Envoyé par Sodium Voir le message
Le français est ma langue maternelle, j'ai par contre grandi au Luxembourg et ma première langue à l'écrit a donc été l'allemand.
Je n'avais pas envisagé ce cas là, mais alors si tu remplaces "langue maternelle" par "première langue écrite", sachant que tu as parlé de ta maîtrise écrite de l'anglais, ça ne fait qu'aller dans le sens de ce que je dis: plus facile de maîtriser l'anglais quand on maîtrise l'allemand que le français (vrai à l'oral, à l'écrit, ou les deux), parce que les langues sont bien plus proches.

Citation Envoyé par Sodium Voir le message
Je ne suis pas sûre que comparer la langue qui est une chose culturelle issue de millénaires de civilisations avec des technologies informatiques qui vont et viennent à toute vitesse soit pertinent.
La domination de l'anglais, ça ne fait pas mille ans que ça existe. Moins d'un siècle, assurément: en 1920 nous aurions probablement eu la discussion exactement inverse, les francophones défendant leur pré carré... en particulier contre l'usage de l'espéranto, sérieusement envisagé par la Société des Nations. On connaît la suite...
4  0 
Avatar de SimonDecoline
Expert confirmé https://www.developpez.com
Le 06/07/2020 à 21:07
Citation Envoyé par Sodium Voir le message
j'ai le droit de vous expliquer pourquoi vous avez tort.
Formidable, tu détiens la Vérité ! Arrête tout de suite l'informatique et fait des articles scientifiques sur la linguistique et la sociologie... c'est le prix Nobel assuré !

où trouve-t-on les enseignants pour former les sept milliard et des poussières restants ? Il faudrait faire preuve d'un peu de pragmatisme et non d'idéologie.
Donc, tu as appris l'anglais en regardant des séries américaines mais pour apprendre l'espéranto (qui est réputé 10 fois plus rapide à apprendre), il faut absolument des enseignants ? Perso, je savais parler, marcher, respirer et me retenir de me faire caca dessus avant qu'un enseignant ne me l'apprenne...

Parce que vous ne consommez pas de programmes culturels anglophones vous ?
C'est quoi des "programmes culturels anglophones" ? Le cinéma des frères Lumières ? Les Walt Disney qui viennent directement de vieilles légendes européennes ? Le blues afro-américain ? La gastronomie ? Le théâtre ? La philosophie ? Le père Noel couleur rouge coca-cola-temps-de-cerveau-disponible ?

Il y a un équivalent francophone à Breaking Bad, Games of throne...
Aucune idée, je ne les ai pas vu mais tu oublies aussi Dallas et toutes les autres séries même pas bonnes pour la poubelle. Et des équivalents anglophones des Studio Ghibli, Jules Vernes, Goethe, Dostoïevski... ?

L'anglais avec ses percussives et ses consonnes comme voyelles facilement interchangeables est très adapté au chant
Non. C'est juste de l'habitude culturelle. Au moyen-age l'intervalle de tierce, c'était de la grosse merde; aujourd'hui il y en a partout (de l'intervalle de tierce, pas de la grosse merde... quoique...).

Le français pas du tout. Par exemple si tu ne roules pas un R, ça casse le flux d'air et on y perd en qualité vocale.


Et c'est justement parce que l'anglais est riche en sonorités qu'il permet cela.
Non. Il y a plein de langues qui ont plus de sonorités que l'anglais. Par exemple le chinois, où chaque voyelle a 15 façon d'être prononcée.

comparables à Freddie Mercury, Ronnie James Dio ou Bruce Dickinson
Tes gouts personnels sont censés être un argument ? En plus de nous apprendre la Vérité, tu veux aussi nous apprendre le Bon Gout ? Au passage Freddie Mercury est né à Zanzibar et avait des problèmes de santé qui ont influencé ses cordes vocale... par vraiment de rapport avec l'anglais.
4  0 
Avatar de SimonDecoline
Expert confirmé https://www.developpez.com
Le 06/07/2020 à 22:26
Citation Envoyé par Sodium Voir le message
Oui non vous n'avez absolument rien compris en fait. Les R sont un problème majeur dans le chant français car ils cassent le flux d'air et ne permettent pas de tenir une note, la seule solution est donc de les rouler. Sauf qu'on n'est plus en 1930. L'anglais est plus adapté justement parce qu'il n'y a pas ce problème.
Oui donc vous n'avez rien écouté en fait. La plupart des anglais et des français ne roulent pas les R même si certains le font (écossais, texans... toulousains...). Donc chanter en anglais ou en français ne change rien à ce niveau. Et chanter ce n'est pas forcément "tenir une note".

Citation Envoyé par Sodium Voir le message
Pareillement, je n'ai rien contre le chant lyrique mais ça limite tout de même sacrément le répertoire, d'autant plus que pour du chant lyrique on se contrefout pas mal de la langue.
Oui alors que le heavy metal et le rock à la Queen, ça représente des siècles d'art musical...

Citation Envoyé par Sodium Voir le message
Et les chanteurs qui privilégient le texte ... écrire de bons textes ça les occupe tellement qu'ils n'ont pas le temps d'apprendre à chanter ? Ou alors c'est l'inverse, je ne sais pas chanter donc je vais pondre des texte prétentieux qui trouvent des manières très compliquées de dire des choses très simples, il y en aura toujours quelques uns pour crier au génie.
Prend ça dans ta gueule Bob Dylan ! Et fous toi bien ton prix Nobel de littérature dans le fondement...
4  0