Developpez.com

Le Club des Développeurs et IT Pro

Forum du Club : affichage des discussions similaires

Pour découvrir d'autres discussions sur le même sujet

Le 2015-07-08 12:22:56, par Anomaly, Responsable technique
Chers membres du Club,

A titre d'essai nous avons décidé de réactiver une fonctionnalité : les discussions similaires.

Qu'est-ce que cela apporte ?

En bas de chaque discussion, vous pourrez trouver un petit encart qui donne 5 discussions considérées comme "similaires" à celle que vous visualisez. Cette similarité est déterminée via un algorithme automatique basé sur les mots-clés, le but étant de vous afficher des discussions qui semblent traiter du même sujet ou d'un sujet proche de la discussion originelle.

Comme tout algorithme, il est faillible : il se peut que certaines discussions n'aient strictement aucun rapport. D'un autre côté, cela peut faire découvrir aux lecteurs de la discussions des discussions sur le même sujet qu'ils n'auraient pas trouvées autrement.

La fonctionnalité est activée depuis plusieurs jours mais une reconstruction de la base était requise. Elle est presque achevée à l'heure où je vous parle, il est donc temps de vous en parler.

Qu'en pensez-vous ?
  Discussion forum
12 commentaires
  • Anomaly
    Responsable technique
    Le titre est le premier critère, d'où l'importance d'écrire les titres correctement. Donc il serait en théorie possible d'afficher des discussions similaires en saisissant un titre, à supposer que le débutant écrive un bon titre et pas URGENT HELP PLZ.

    Et oui on peut avoir des discussions datant d'avant la première guerre mondiale, mais ce n'est pas forcément invalide ; oui, il y a des choses qui évoluent, et donc tout ce qui était vrai en 2000 n'est plus forcément vrai en 2015, mais ce n'est pas non plus forcément faux en 2015.

    PS : Si vous voulez nous aider à éditer les titres et déplacer les sujets dans les bon sous forums on recrute des modérateurs
  • prgasp77
    Membre émérite
    Félicitation pour cette nouvelle mise en prod' !
    Pour aller plus loin, vous pourriez proposer quelques discussions similaires lorsqu'un utilisateur (nouveau membre du club ?) ouvre un sujet. Ca limiterait l'utilisation de ce smilley .
  • Anomaly
    Responsable technique
    Parce qu'un algorithme de ce type est forcément faillible et parce que le titre d'origine lui-même n'est pas terrible, et qu'il met en évidence le passage d'un élément à un autre "le de" et "vers" au lieu de parler de "migration" ou "mise à jour" qui aurait été largement mieux. Le fait que version et 4 soient collés n'arrangent rien. Avec un titre mal formé ou incomplet, l'algorithme ne pourra pas faire de miracles.
  • prgasp77
    Membre émérite
    Envoyé par Auteur
    Je ne vois pas trop comment cela pourrait être possible puisque pour proposer une discussion similaire il faut d'abord poster le message
    Ce n'est qu'un détail technique ; qui peut être contourné de plusieurs manières ; tiens, en voici deux :
    • lorsque l'utilisateur clique sur le bouton Poster, une page lui propose de consulter des messages similaires ou de créer définitivement sa discussion ;
    • alors que l'utilisateur rédige sa question, un encart dynamique se met à jour avec une liste de discussions similaires.


    Mais je laisse le soin à ceux qui ont les compétences et les clés en main de penser à tout ça.
  • Logan Mauzaize
    Rédacteur/Modérateur
    Envoyé par Auteur
    En effet, je n'y avais pas pensé. Mais analyser le contenu de plusieurs milliers de messages pour afficher les 3 ou 4 similaires pendant la frappe ça doit prendre du temps et des ressources ?
    Bref, ceci dit, je pense que le débat n'est pas dans cette discussion
    Avec ElasticSearch, cela se fait très rapidement (quelques millisecondes). Le plus long c'est presque la transformation de l'entrée (élimination des mots vides, lemmatisation, rapprochement lexical, etc.)

    Envoyé par Paul_Le_Heros
    Puisque les posts sont systématiquement (?) lus par une personne nommée "modérateur", ce pourrait-être à elle de dégrossir en fixant les "premiers" mots clés, non ?
    Nous sommes tous bénévoles et faisons cela sur notre temps libre. Ce que tu demandes représentes un travail colossal. Nous faisons en revanche un effort pour modifier les titres non explicites mais :
    1. Nous sommes pas toujours pas spécialistes dans le domaine de la question
    2. La question originale n'a pas toujours de lien avec le vrai problème
    3. La discussion peut avoir majoritairement dévié. Ex : je pose une question sur un problème de conversion et finalement le reste traite des différentes librairies pour gérer le problème.


    Sans compter la dynamique des discussions qui peuvent évoluer sans qu'un modérateur ne repasse par là. D'autres communautés ont fait le choix d'associer des mots-clés aux discussions, l'auto-administration (plus tu as de "points" plus tu as de droits), ce qui fait que même sans être "modérateur", tu peux par exemple "modérer" les mots-clés.
  • Anomaly
    Responsable technique
    Envoyé par prgasp77
    Pour aller plus loin, vous pourriez proposer quelques discussions similaires lorsqu'un utilisateur (nouveau membre du club ?) ouvre un sujet. Ca limiterait l'utilisation de ce smilley .
    C'est en cours d'étude.
  • Auteur
    Expert éminent sénior
    Envoyé par prgasp77
    Félicitation pour cette nouvelle mise en prod' !
    Pour aller plus loin, vous pourriez proposer quelques discussions similaires lorsqu'un utilisateur (nouveau membre du club ?) ouvre un sujet.
    Je ne vois pas trop comment cela pourrait être possible puisque pour proposer une discussion similaire il faut d'abord poster le message

    D'ailleurs pour l'algo qui propose les discussions similaires est-ce que le critère date est pris en compte ? En effet, si en 2015 je poste un message sur un langage particulier est-ce que l'algo va me proposer des messages vieux de 10 ans ? Car un langage évolue au fil du temps et la réponse à une question postée aujourd'hui sera sans doute différente de la réponse d'il y a 10 ans ?
  • Auteur
    Expert éminent sénior
    En effet, je n'y avais pas pensé. Mais analyser le contenu de plusieurs milliers de messages pour afficher les 3 ou 4 similaires pendant la frappe ça doit prendre du temps et des ressources ?
    Bref, ceci dit, je pense que le débat n'est pas dans cette discussion
  • Jipété
    Expert éminent sénior
    Salut,

    Ça y est, c'est en service on dirait : je lisais une question sur le forum "Virtualisation" et en bas de la page se sont affichées les discussions similaires.
    Similaires, vraiment ?

    La question en cours était "virtualbox de la version4 vers la 5" et voilà les discussions similaires proposées :

    [VirtualBox] Export VM&snapshot vers autre machine/session
    Par gui80 dans le forum VirtualBox

    Socket:Envoyer du texte d'un serveur vers tout les clients
    Par cedm78 dans le forum Web & réseau

    [Kylix] De delphi vers Kylix : Et les HLP ?
    Par Beuz dans le forum Kylix

    extraire des pixels d'une BMP vers un tableau [x][y]
    Par dodo dans le forum MFC

    [Kylix] Tutoriels pour migrer une application Delphi vers Ky
    Par lutin_vert dans le forum Kylix
    Mis à part la préposition "vers", il n'y a rien de similaire, àmha...
  • Pierre GIRARD
    Expert éminent
    C'est plutôt une bonne idée. Et pour que ça marche, plus les titres seront précis et court, mieux ça sera