Developpez.com

Le Club des Développeurs et IT Pro

Le projet « 404-No-More » se propose de réinventer le « 404 not found »

Une initiative qui pourrait révolutionner le Web

Le 2014-04-22 12:26:03, par Arsene Newman, Expert éminent sénior
Quelle intense frustration que l'on ressent lorsque des liens web sont cassés et que l'unique affichage est un « 404 not found »!

C'est ainsi que le projet « 404-No-More » a vu le jour et récemment, son évolution a atteint un stade avancé, de quoi donner l'espoir aux internautes de ne plus faire face à cette fâcheuse situation. Pour ce faire, le projet propose l'implémentation d'un nouveau mécanisme, qui permettra d'afficher des versions antérieures de ladite page web.

Toutefois, le projet ne se résume pas à cela, son autre objectif majeur est la lutte contre la censure, en proposant une nouvelle méthode pour référencer plusieurs cibles d'un même lien.

Le projet est soutenu par des membres issus de différentes organisations comme la Harvard Library Innovation Lab, le laboratoire national de Los Alamos, l'Université d'Old Dominion et le centre Berkman pour l'Internet et la société.

Quant au mécanisme développé par le projet, il se présente sous la forme d'une extension du langage HTML, où la fameuse balise <a> est étendue avec le nouvel attribut mset, qui permet de dater et de citer les différentes cibles possibles pour un même lien, le code ci-dessous en est un exemple :

<a href="http://www.w3.org/MarkUp/html-spec/html-spec_toc.html
mset="2014-03-17,
http://web.archive.org/web/20140211110349/http://www.w3.org/MarkUp/html-spec/html-spec_toc.html">
HTML 2.0
</a>
Plusieurs personnes se sont exprimées sur le sujet : « si chaque hyperlien était annoté avec sa date de publication, alors vous seriez automatiquement en mesure de voir des versions archivées du contenu tel que décider par l'auteur » a déclaré l'un des responsables du projet. Quant à Roger Macdonald, directeur de l'Internet Archive, il décrit le projet comme étant « une importante contribution pour la préservation du savoir ».

Enfin, il est important de noter que ce projet ne servira pas uniquement les internautes, mais aussi le gouvernement américain. Une récente étude a révélé que plus de 49 % des liens cités dans des procédures judiciaires la court suprême américaine mènent vers des « 404 not found ».

Source : The mset Attribute

Et vous ?

Qu'en pensez-vous ?

Est ce que cette initiative va réinventer le web ? Pourquoi ?
  Discussion forum
15 commentaires
  • Saverok
    Expert éminent
    Au niveau juridique, cela pose pas mal de questions

    Prenons l'exemple d'un journal attaqué pour diffamation ou violation de la vie privée du style de Closer avec l'affraie Gayet.
    La page d'origine comporte l'article avec la photos.
    Suite à la plainte et condamnation devant le tribunal, Closer doit retirer la page ou la modifier avec un grand encart de décision de justice.
    Par contre, avec ces liens d'archivage, la page d'origine est toujours accessible alors qu'elle est en infraction avec la décision de justice...
    Que se passe t'il dans ce cas ?
  • Zefling
    Expert confirmé
    Les 404 quelques décrits, c'est valable pour du contenu statique, pour le reste ça me semble plus compliqué à mettre en œuvre.

    Pour le contenu dynamique, si les donnée envoyer ne sont plus d'actualité, il serait mauvais d'avoir une version archivé dans certains cas qui pourrait engendrer encore plus de 404.

    En tout cas, perso j'aimerais ne pas avoir d'erreur 404, mais une erreur dans l'une URL ça arrive. Je n'ai qu'à voir le nombre les liens qui pointent vers mon site où les types n'ont pas été foutu d'écrire l'URL correctement et forcement le contenu en question n'existe pas et n'a jamais existé telle que demandé.
  • I_Pnose
    Membre chevronné
    A voir si c'est viable, je trouve ça intéressant.
    Personnellement je me sers pas mal de la machine à voyager dans le temps, une fois sur dix ça me permet de récupérer du contenu perdu.

    (en bonus notre developpez.com en 2000)
  • sekaijin
    Expert éminent
    Perso je suis pour maintenir la 404
    mais c'est au fournisseur de contenu de faire leur boulot.

    Dans les années 90 on avait émit les règles suivante pour les sites de ma boites.

    1. Tout 404 doit produire une remonté d'alerte pour le gestionnaire du site (le webmasteur doit être en mesure de corriger la problème si c'en est un)
    2. Tout 404 doit être adapté au site qui le produit.
    3. Tout 404 doit contenir dans sa réponse au moins un lien permettant à l'utilisateur de continuer son parcours.
    4. Tout 404 doit pouvoir permettre à l'utilisateur d'être conscient de ce qui ce passe

    On peut ajouter
    1. Toute erreur 4xx 5xx ne doit pas fournir d'information susceptible de mettre en danger le site.

    bien sur ça demande du travail au webmaster. mais cela permet d'améliorer le site.

    mais c'est juste du bon sens
    A+JYT
  • MClerc
    Membre régulier
    "des versions archivées du contenu tel que décider par l'auteur"

    Utiliser l'infinitif "décider" est incorrect. Cette faute est souvent commise, mais du coup, ici, la phrase peut avoir deux significations très différentes :
    "des versions archivées du contenu telLES que décidÉES par l'auteur"
    ou bien
    "des versions archivées du contenu tel que décidÉ par l'auteur"

    Ce n'est pas du tout la même chose ! Alors quelle est la bonne ?
  • benjani13
    Membre extrêmement actif
    Code :
    1
    2
    3
    4
    5
    <a href="http://www.w3.org/MarkUp/html-spec/html-spec_toc.html
    mset="2014-03-17,
    http://web.archive.org/web/20140211110349/http://www.w3.org/MarkUp/html-spec/html-spec_toc.html">
    HTML 2.0
    </a>
    C'est cool ça mais mais c'est "côté client", c'est à dire du côté du site tiers pointant sur notre site.
    Si le lien est envoyé par une personne dans un mail ou un commentaire d'un forum, cette solution ne marche plus.
    Pourquoi ne pas prévoir plutôt quelque chose côté serveur?

    En tout cas je ne vois pas trop bien l’intérêt.
  • Shuty
    Membre éprouvé
    Je préfère de loin la page 404 avec les gens disparues...
  • abriotde
    Membre chevronné
    Leur vision est complètement utopiste
    Non, c'est techniquement faisable et pas difficile. Il ne s'agit pas d'historiser tout le WEB. On peut même imaginer un plugin javascript pour le faire. Mais si c'est gérer nativement par le navigateur se sera plus efficace.

    Ce qui est plus complexe mais mieux, c'est de le gérer au niveau du réseau avec un protocole dédié. Cela risquerais alors aussi de poser des problème de sécurité, et de maintenabilité. Je verrais ça un peu comme un routeur/proxy évolué. Ce ne serait pas alors destiné a tous les liens mais a certains critique (Comme les liens judiciaires, les articles de journaux). Charge au site / sous-réseau de garder l'historique (ou une version retro-compatible) quelques part.

    Actuellement on sait rediriger spécifiquement une url. L'idée est de créer un annuaire d'url pour que la page 404 sache quel doit être l'url actuel correspondant à la demande. Ça c'est techniquement faisable en l'état mais jamais fait.
  • esperanto
    Membre émérite
    Envoyé par Arsene Newman

    « vous seriez automatiquement en mesure de voir des versions archivées du contenu tel que décider par l'auteur »
    J'espère surtout que la partie en italique sera prise en compte: faire disparaître une page peut être un choix, faudrait pas qu'elle réapparaisse parce qu'un site sur lequel je n'ai aucun contrôle a décidé de l'archiver à mon insu!

    Envoyé par Saverok
    Au niveau juridique, cela pose pas mal de questions

    Prenons l'exemple d'un journal attaqué pour diffamation ou violation de la vie privée du style de Closer avec l'affraie Gayet.
    [...]
    Par contre, avec ces liens d'archivage, la page d'origine est toujours accessible alors qu'elle est en infraction avec la décision de justice...
    Que se passe t'il dans ce cas ?

    Ben justement, vue l'incompétence de nos politiques en matière d'internet (l'affaire Altern ça vous rappelle quelque chose?) j'imagine bien que le site pourrait être condamné pour ne pas s'être opposé à l'archivage par un tiers...
  • Mishulyna
    Traductrice
    Au chargement de la page il n'y a que le fond bleu qui s'affiche, pour un instant j'ai eu peur....