Débat : le Web sémantique, une porte ouverte à tous les abus ?
Le projet FOAF pourrait être détourné par les réseaux sociaux

Le , par dourouc05, Responsable Qt
On parle de plus en plus du Web sémantique. Certains le présentent comme le Web 3.0. Pourtant, on peut facilement enregistrer des dérives.

Prenons l'exemple de FOAF, un namespace RDFa (http://www.foaf-project.org/). On peut ainsi indiquer des relations entre les gens. Ne risque-t-on pas de voir les réseaux sociaux tirer profit de cette fonctionnalité (proposer aux utilisateurs d'entrer l'URL de leur site personnel et exploiter les données sémantiques qu'ils y ont ajoutées, par exemple) ? L'étape d'après est logiquement de redistribuer cette même information par le même biais.

Ne risque-t-on pas alors de voir apparaître des sites ou des logiciels qui vont faire le travail de recherche de graphe des connaissances d'une personne, en reliant tous les profils sur les réseaux sociaux ? On peut déjà faire des recherches très pointues sur des gens en moins d'une dizaine de minutes, cela risque de devenir encore plus facile !

Et vous ?

Qu'en pensez-vous ?


Vous avez aimé cette actualité ? Alors partagez-la avec vos amis en cliquant sur les boutons ci-dessous :


 Poster une réponse

Avatar de danielhagnoul danielhagnoul - Rédacteur http://www.developpez.com
le 11/04/2011 à 9:51
Citation Envoyé par Flaburgan  Voir le message
Ça a l'air très intéressant, j'y jetterai un oeil quand j'aurais le temps.
Mais pour les sites relativement réduit, du genre news / photo / qui sommes nous / contact, la grande majorité des sites internet quoi, il est où l'intérêt ?

Bonjour

Si les logiciels, au travers des codes RDF, arrivent à comprendre les textes qu'ils manipulent et à croiser les renseignements trouvés ici et là, ce que l'on appelle aujourd'hui le danger du web sera du pipi de chat par rapport au danger du web dans le futur.
Avatar de snake264 snake264 - Responsable Web sémantique http://www.developpez.com
le 11/04/2011 à 11:16
Citation Envoyé par Flaburgan  Voir le message
Ça a l'air très intéressant, j'y jetterai un oeil quand j'aurais le temps.
Mais pour les sites relativement réduit, du genre news / photo / qui sommes nous / contact, la grande majorité des sites internet quoi, il est où l'intérêt ?

L'intêret il est que le Web de données (sémantique) contrairement au Web actuel (de documents) lie les données contenu dans les documents entre elles et non juste les documents, ce qui fait que l'on pourra plus facilement retrouver les données que l'on cherche sur TOUT les sites (à condition que les sites ce plient à certains standard) et pu avoir de résultat qui n'ont rien à voir avec ce que l'on cherche.

Citation Envoyé par danielhagnoul  Voir le message
Si les logiciels, au travers des codes RDF, arrivent à comprendre les textes qu'ils manipulent et à croiser les renseignements trouvés ici et là, ce que l'on appelle aujourd'hui le danger du web sera du pipi de chat par rapport au danger du web dans le futur.

Ceci est vrai et faux en même temps, il n'y aura de problème que si les utilisateurs ne font pas attention à ce qu'ils publient sinon il n'y a pas de risquent.

Bien entendu quand je dis pas de risque je ne tiens pas compte du "piratage" de sites web car là ça n'a rien à voir, cela vient du site et non de son contenu
Avatar de Firedeal Firedeal - Membre à l'essai http://www.developpez.com
le 11/04/2011 à 11:34
Et cela marche pour toute les villes, département ou région. Si vous faites la même chose sur google cela ne fonctionne pas.

Ca fait assez longtemps que c'est disponible sur google US. Par exemple tu tappes : "who is the president of the united states", ca te réponds.
Donc rien de nouveau ^^
Avatar de snake264 snake264 - Responsable Web sémantique http://www.developpez.com
le 11/04/2011 à 11:42
Citation Envoyé par Firedeal  Voir le message
Ca fait assez longtemps que c'est disponible sur google US. Par exemple tu tappes : "who is the president of the united states", ca te réponds.
Donc rien de nouveau ^^

Justement si du fait que sur google US ça reste réservé aux infos des USA et c'est en anglais donc strictement aucune utilité pour un francophone, puisque si tu écris "qui est le président des Etas-Unis ?" ça marche pas Donc google Francophone (celui qu'utilise tout les francophone donc) ne permet pas ce genre de chose et donc est un peu désavantagé par rapport à Orange.
Avatar de Hellwing Hellwing - Membre chevronné http://www.developpez.com
le 11/04/2011 à 11:44
Citation Envoyé par Firedeal  Voir le message
Ca fait assez longtemps que c'est disponible sur google US. Par exemple tu tappes : "who is the president of the united states", ca te réponds.
Donc rien de nouveau ^^

Il reste à voir jusqu'à quel niveau de questions Google est capable de répondre. Parce que le président des Etats-Unis ou d'autres questions triviales, cela me paraît évident qu'un moteur de recherche soit capable d'y répondre sans trop de difficultés.
Avatar de onjanirina onjanirina - Membre habitué http://www.developpez.com
le 13/04/2011 à 1:51
Félicitations à l'auteur ! Je pense que l'article est assez complet pour ouvrir le débat sur le web sémantique, notamment sur le réel apport qu'une telle technologie pourrait apporter, les éventuelles dérapages ou encore sur une de ses applications, le FOAF.

1) Le web sémantique
Le web sémantique a effectivement pour objectif de permettre/faciliter la tâche des applications ou services dans le raisonnement/la déduction à partir des éléments déjà disponibles. Mais je rassure les lecteurs, il n'est pas prévu (normalement) que de telles exploitations se fassent à l'insu ou aux dépens des internautes.

2) Ce qui nous amène au deuxième point : le web de confiance, qui fait partie des visions de la w3c. Dans la pratique, le web de confiance se traduit par un contrôle en amont des informations : de la source, qui peut être tout utilisateur, aux différents supports (sites, plateformes sociales) par lesquels l'information transite pour arriver aux destinataires finaux. La responsabilité de la publication doit être clairement établie et les relations entre les agents scrupuleusement règlementées. Si une personne publie des/ses données personnelles, elle devra en être la seule responsable. Par contre, si un site qui a promis de conserver une certaine confidentialité aux données ne s'y conforme pas, elle en assumera la responsabilité.
Ce qui nous amène à l'utilité d'un système centralisé ou d'un système de contrôle centralisé, qui est pratiquement impossible à mettre en œuvre au niveau d'Internet (Cf. Le texte cité dans la signature de Flaburgan).

3) Le FOAF
Le FOAF lui-même démontre l'importance d'un système centralisé. Je vais prendre quelques exemples pratiques pour le démontrer :
- Les relations de type "follower" (Twitter) ou "amis/relations" (Facebook) sont clairement définis quant à leurs "sens" (sémantique). Pour le cas des followers, il s'agit pour un follower de suivre un autre compte par l'intérêt que les informations en temps réel de celui-ci lui procure. Il ne s'agit nullement de relations "amicales" mais d'informations. Toute tentative d'exploiter les liens inter-profils ne permettrait aucunement de déduire des relations réelles, amicales ou intimes entre les comptes.
- Pour les relations de type "amis/famille" de Facebook, ou "contacts" de Viadeo, de telles déductions peuvent être faites mais il faut noter l'existence d'un double contrôle. Un contrôle sur le sens (sémantique) des données : une personne ne peut être amie ou membre de la famille de quelqu'un d'autre si ce dernier n'a pas aussi acceptée la relation. Dans un système décentralisé où tout le monde peut dire ce qu'il veut, à l'aide de pages ou de fichier FOAF, tout le monde peut aussi dire qu'il est le fils d'un tel ou l'ami(e) intime d'une telle. Ce qui serait terriblement agaçant pour certaines personnes.
Par contre, ce qui serait normale, et très facile, c'est que quand une personne A affirme qu'elle est la mère de la personne B (assertion confirmée par la personne B aussi). Et que de l'autre côté, la personne B affirme qu'elle est la mère de la personne C (assertion confirmée par la personne C) : il ne serait pas étonnant, voire logique, que Facebook propose à la personne C : "Voilà votre grand-mère, voulez-vous l'ajouter à votre liste d'amis ? ".
Cet exemple nous montre l'utilité du deuxième moyen de contrôle : la portée de la publication. Si une personne ne souhaite pas publier des informations sur sa vie privée, elle ne devrait pas y être contrainte ou abusivement manipulée. C'est sur ce deuxième contrôle que certains sites semblent se laisser aller à diverses libertinages et manipulations. Suivez mon regard !

En conclusion, je dirais que le web sémantique, qui permettra une meilleure utilisation (exploitations, déductions) des informations, doit être accompagné par un changement de la notion d'information décentralisée que représente jusqu'à présent le web. Un système qui permettrait à tout le monde de publier des données non vérifiées, mais facilement exploitable grâce au web sémantique, ne ferait que créer un autre web plus difficile à utiliser/exploiter que celui des pages. Il faudrait disposer non seulement de moteur de recherche mais aussi de moteur de vérification, de validation, de déduction, etc.
Le vrai danger est celui de mettre à la disposition des esprits malsains un outil aussi puissant que le web sémantique.
Avatar de snake264 snake264 - Responsable Web sémantique http://www.developpez.com
le 13/04/2011 à 11:22
Citation Envoyé par onjanirina  Voir le message
Mais je rassure les lecteurs, il n'est pas prévu (normalement) que de telles exploitations se fassent à l'insu ou aux dépens des internautes.

C'est bien de vivre dans le monde des bisounours Actuellement il existe beaucoup d'entreprises et d'institutions qui ont des scripts qui analysent toutes les pages public des réseaux sociaux pour stocker ces données et s'en servir. Et depuis récemment les pages de descriptions FOAF.

Citation Envoyé par onjanirina  Voir le message
Ce qui nous amène à l'utilité d'un système centralisé ou d'un système de contrôle centralisé, qui est pratiquement impossible à mettre en œuvre au niveau d'Internet (Cf. Le texte cité dans la signature de Flaburgan).

Ce n'est pas "pratiquement impossible" mais "impossible" (pour le moment avec les moyens que l'on a). Il y a quelques chercheurs en France qui travaillent sur un moyen de vérification de toutes les données mise à disposition par une personne. Et ils galèrent. Ces vérifications ne sont possibles que dans un cadre défini (que sur facebook, que sur twitter, que sur viadeo, etc...). Car il y a aussi le problème que certaines personnes ont plusieurs profils sur le même site ou alors que certains profil ne sont jamais mis à jour, etc.

Citation Envoyé par onjanirina  Voir le message
Le FOAF lui-même démontre l'importance d'un système centralisé. Je vais prendre quelques exemples pratiques pour le démontrer :
- Les relations de type "follower" (Twitter) ou "amis/relations" (Facebook) sont clairement définis quant à leurs "sens" (sémantique). Pour le cas des followers, il s'agit pour un follower de suivre un autre compte par l'intérêt que les informations en temps réel de celui-ci lui procure. Il ne s'agit nullement de relations "amicales" mais d'informations. Toute tentative d'exploiter les liens inter-profils ne permettrait aucunement de déduire des relations réelles, amicales ou intimes entre les comptes.
- Pour les relations de type "amis/famille" de Facebook, ou "contacts" de Viadeo, de telles déductions peuvent être faites mais il faut noter l'existence d'un double contrôle. Un contrôle sur le sens (sémantique) des données : une personne ne peut être amie ou membre de la famille de quelqu'un d'autre si ce dernier n'a pas aussi acceptée la relation. Dans un système décentralisé où tout le monde peut dire ce qu'il veut, à l'aide de pages ou de fichier FOAF, tout le monde peut aussi dire qu'il est le fils d'un tel ou l'ami(e) intime d'une telle. Ce qui serait terriblement agaçant pour certaines personnes.
Par contre, ce qui serait normale, et très facile, c'est que quand une personne A affirme qu'elle est la mère de la personne B (assertion confirmée par la personne B aussi). Et que de l'autre côté, la personne B affirme qu'elle est la mère de la personne C (assertion confirmée par la personne C) : il ne serait pas étonnant, voire logique, que Facebook propose à la personne C : "Voilà votre grand-mère, voulez-vous l'ajouter à votre liste d'amis ? ".
Cet exemple nous montre l'utilité du deuxième moyen de contrôle : la portée de la publication. Si une personne ne souhaite pas publier des informations sur sa vie privée, elle ne devrait pas y être contrainte ou abusivement manipulée. C'est sur ce deuxième contrôle que certains sites semblent se laisser aller à diverses libertinages et manipulations. Suivez mon regard !

Facebook est déjà en train de développer une API pour le Web sémantique qui va pouvoir permettre ce genre de chose.

Citation Envoyé par onjanirina  Voir le message
Un système qui permettrait à tout le monde de publier des données non vérifiées, mais facilement exploitable grâce au web sémantique, ne ferait que créer un autre web plus difficile à utiliser/exploiter que celui des pages. Il faudrait disposer non seulement de moteur de recherche mais aussi de moteur de vérification, de validation, de déduction, etc.

Le Web sémantique n'a pas été prévu pour ça, il a été prévu pour qu'il soit exploitable non pas par des humains mais par des machines. Donc les moteurs de vérifications et de validations ne sont vraiment pas d'actualité pour le moment. Quant à la déduction c'est implicite avec la définition du Web sémantique.

Citation Envoyé par onjanirina  Voir le message
Le vrai danger est celui de mettre à la disposition des esprits malsains un outil aussi puissant que le web sémantique.

Il faut juste faire attention à ce que l'on publie c'est tout
Avatar de pandark pandark - Membre à l'essai http://www.developpez.com
le 14/04/2011 à 13:37
Citation Envoyé par danielhagnoul  Voir le message
Le web sémantique permet d’effectuer des requêtes explicites sur des informations structurées ainsi que sur des données liées sur différentes sources de données. Mais le web sémantique fait face à un problème de taille, il n’y pas assez de contenu au format RDF, et il manque des ontologies dans un grand nombre de domaines.

RDF, langage de base du web sémantique.

RDF n'est pas le seul format utilisé pour le web sémantique.
Par exemple, les microformats et leurs successeurs microdata peuvent s'utiliser dans du html tout bête.
Ça ne sert pas juste à traquer les gens, mais à faire des rapprochements entre les contenus, à différentiel des homonymes (ex : orange), à pouvoir chercher des informations dans la masse et pouvoir les exploiter de manière automatique (ex : data.gov)…
Avatar de snake264 snake264 - Responsable Web sémantique http://www.developpez.com
le 14/04/2011 à 14:03
Citation Envoyé par pandark  Voir le message
RDF n'est pas le seul format utilisé pour le web sémantique.

Il n'est pas le seul, mais c'est le principal, c'est LE format qui permet de faire de la sémantique puisque sans ça lui reste des langages en est incapable.

Citation Envoyé par pandark  Voir le message
Par exemple, les microformats et leurs successeurs microdata peuvent s'utiliser dans du html tout bête.
Ça ne sert pas juste à traquer les gens, mais à faire des rapprochements entre les contenus, à différentiel des homonymes (ex : orange), à pouvoir chercher des informations dans la masse et pouvoir les exploiter de manière automatique (ex : data.gov)…

Tu confons encore beaucoup de choses, il faut déjà que tu saches que les microformats sont très très peux utilisés et dépréciés, pour faire de la description de données c'est RDFa.

Quant aux microdata, c'est encore beaucoup trop jeune puisque cela fonctionne qu'avec HTML 5.

Ensuite lorsque tu mets du RDFa dans ta page XHTML, tu transforme les données de ta page en triplets RDF, ce qui montre bien que l'on ne peut strictement rien faire sans RDF.

Ensuite les langages de description de données ne sont pas vraiment le Web sémantique. Cela y contribue mais ils sont plus là pour utiliser le Web sémantique
Avatar de onjanirina onjanirina - Membre habitué http://www.developpez.com
le 14/04/2011 à 21:37
Les syntaxes, basés sur XML, RDF, OWL, ne représentent que l'aspect communication (échanges, persistance) du web sémantique.

Il ne faut pas oublier que le web sémantique, c'est avant tout une structure conceptuelle destinée à la représentation des connaissances d'un domaine, utilisant notamment des normes de conception tels que UML (Unified Modeling Language), MOF (Meta-Object Facility).
Avatar de snake264 snake264 - Responsable Web sémantique http://www.developpez.com
le 15/04/2011 à 8:30
Citation Envoyé par onjanirina  Voir le message
utilisant notamment des normes de conception tels que UML (Unified Modeling Language), MOF (Meta-Object Facility).

Oui et non car justement en représentation des connaissances on t'enseigne qu'il faut savoir t'abstraire des modèles de conceptions que l'on t'apprend en ingénieri logiciel, car par exemple quand tu écris ton ontologie par la logique de description (ce qui doit toujours être fait mais que quasiment personne ne fait) tu remarques que si tu le transpose en graphique ça ne ressemble vraiment pas beaucoup à ce que tu aurais pu faire en UML ou autre langage de modélisation standard utilisé en BDD ou en ingénieri logiciel.
Offres d'emploi IT
Chef de projet SI confirmé (H/F)
Société Générale - Ile de France - Val-de-Fontenay
Analyste SI-métier (poste également ouvert aux stagiaires, alternants et VIE du groupe)-(H/F)
Société Générale - Ile de France - Val-de-Marne
Technical leader / moe perle (H/F)
Société Générale - Ile de France - Val de Marne

Voir plus d'offres Voir la carte des offres IT
Contacter le responsable de la rubrique Accueil