Quelles sont les entreprises qui contribuent le plus aux projets open source ?
Microsoft positionné en tête sur GitHub

Le , par Michael Guilloux, Chroniqueur Actualités
Fin 2016, GitHub a publié un rapport dans lequel étaient consignés plusieurs indicateurs relatifs à l'activité des développeurs sur sa plateforme. Entre autres points, le rapport indiquait les organisations les plus actives en considérant le nombre de contributeurs et le nombre de réviseurs de code uniques. Précisons qu’est considéré comme contributeur tout utilisateur ayant poussé un code, ouvert ou commenté un problème ou un pull request. Il faut également préciser qu’il s’agit de tous les développeurs qui contribuent aux projets open source des entreprises, qu’ils soient ou non employés dans ces entreprises. Sur cette base, Microsoft est arrivé en tête, suivi par des entreprises comme Facebook, Docker et Google.

Pour l’année qui vient de s’écouler, GitHub a mis à jour son rapport en mettant en avant cette fois les projets ayant le plus de contributeurs et non les organisations. Cela permet de voir Visual Studio Code de Microsoft en tête des projets ayant eu le plus de contributeurs uniques en 2017, devant React Native de Facebook et NPM.


Mais qu’en est-il des organisations dont les employés contribuent le plus aux projets open source ? GitHub n’ayant pas fourni d’indicateurs sur ce point, d’autres développeurs ont essayé de manière indépendante de répondre à la question en utilisant les données mises à disposition par la plateforme d’hébergement de code. C’est le cas par exemple du développeur Fil Maj d’Adobe.

Il a utilisé l'API REST GitHub pour extraire les informations publiques de tous les 2 millions d'utilisateurs de GitHub actifs en 2017. Entendez par utilisateur actif, un utilisateur ayant enregistré plus de dix commits dans des projets publics. Fil Maj a analysé les informations de profil des développeurs sur GitHub (en particulier, le champ réservé au nom de l'entreprise). Certes, ce n'est pas une mesure parfaite, puisque cela exclut les développeurs qui préfèrent ne pas afficher le nom de leur entreprise sur leur profil. Mais on peut quand même admettre que le pourcentage de développeurs qui préfèrent ne pas renseigner le nom de leur entreprise sur leur profil GitHub n'est pas significativement différent d'une entreprise à l'autre. Si cela est admis, alors l'analyse du développeur d'Adobe donne une bonne mesure du nombre total d’employés contributeurs par entreprise.

Cela dit, il a ainsi pu faire ressortir le nombre total d'employés par entreprise qui contribuent activement à des projets open source sur GitHub, et les résultats pourraient surprendre beaucoup. Ci-dessous les 30 premières entreprises, avec le nombre d'employés actifs sur GitHub :

1 - Microsoft : 4550
2 - Google : 2267
3 - Red Hat : 2027
4 - IBM : 1813
5 - Intel : 1314
6 - Amazon.com : 881
7 - SAP : 747
8 - ThoughtWorks : 739
9 - Alibaba : 694
10 - GitHub : 676
11 - Facebook : 619
12 - Tencent : 605
13 - Pivotal : 591
14 - EPAM Systems : 585
15 - Baidu : 584
16 - Mozilla : 469
17 - Oracle : 455
18 - Unity Technologies : 414
19 - Uber : 388
20 - Yandex : 351
21 - Shopify : 345
22 - LinkedIn : 343
23 - Suse : 325
24 - ESRI : 324
25 - Apple : 292
26 - Salesforce.com : 291
27 - VMware : 271
28 - Adobe Systems : 270
29 - Andela : 259
30 - Cisco Systems : 233

Encore une fois, ce classement confirme la position de premier plan de Microsoft en tant que contributeur dans le monde open source, mais ce que ne dit pas ces différents rapports, c'est à quels projets contribuent les employés de Microsoft.

Sous Satya Nadella, le géant du logiciel a adopté une nouvelle stratégie avec un engagement plus accentué pour Linux et l’open source en général. La société est devenue un grand promoteur de l’open source avec de plus en plus de technologies ouvertes, comme Visual Studio Code par exemple. C'est le cas notamment avec sa plateforme cloud Azure qui mise sur l'ouverture et où tous les nouveaux produits sont pour la plupart tournés en open source. Microsoft a donc besoin de beaucoup de contributeurs pour faire avancer ses différents projets. Le géant du logiciel doit donc lui-même commencer par mobiliser ses propres ressources humaines sur ses projets avant de pouvoir compter sur la communauté. Cela pourrait donc expliquer en partie pourquoi Microsoft est l'entreprise ayant le plus d'employés contribuant aux projets open source sur GitHub.

Sources : Twitter, Classement GitHub 2017

Et vous ?

Qu’en pensez-vous ?
Comment expliquez-vous la place de Microsoft dans ce classement ?

Voir aussi :

Microsoft adhère à l'organisation Open Source Initiative en tant que sponsor premium, pour soutenir davantage la communauté open source
Open source : les projets de Microsoft attirent plus de contributeurs que ceux des autres organisations, d'après le rapport annuel de GitHub


Vous avez aimé cette actualité ? Alors partagez-la avec vos amis en cliquant sur les boutons ci-dessous :


 Poster une réponse Signaler un problème

Avatar de Matthieu76 Matthieu76 - Membre éclairé https://www.developpez.com
le 20/02/2018 à 13:03
J'ai l'impression que ces chiffres veulent un peut tout et rien dire. C'est un peu comme compter le nombre de chaton sauvé par une personne pour évaluer son niveau de gentillesse, ça n'a pas vraiment de sens. De plus dans dans ce rapport coder 1 ligne de code ou en coder 10 000 revient au même. Et je dirais même plus, la quantité ne fait pas la qualité.

Ps : Je suis très négative mais en vrai c'est quand même sympa de savoir ça même si je pense que l’étude aurait pu être un peu plus pousser.
Avatar de joublie joublie - Membre confirmé https://www.developpez.com
le 20/02/2018 à 23:45
Pardon, mais je n'ai pas trouvé la NSA dans la liste.
Avatar de tracfoil tracfoil - Candidat au Club https://www.developpez.com
le 23/02/2018 à 16:49
surtout que "open source" et "logiciel libre" c'est un peu différent
Avatar de FatAgnus FatAgnus - Membre actif https://www.developpez.com
le 25/02/2018 à 18:10
Être l'organisation ayant le plus grand nombre d'employés contribuant sur GitHub signifie être l'organisation ayant le plus d'employés contribuant à l'open source ? Le raccourci n'est pas un peu rapide ? Cet article a une petite odeur de piège à clics.

Bien que GitHub héberge beaucoup de projets open source, les plus gros projets open source ne sont pas sur GitHub. Voici une liste de projets open source n'utilisant pas GitHub comme dépôt (ou juste comme miroir en lecture seule pour certains) :

  • Noyau Linux : 25 millions de lignes de code
  • LibreOffice : 9 millions de lignes de codes
  • Mozilla Firefox : 36 millions de lignes code
  • GNOME : 8 millions lignes de code
  • Android : 14 millions de lignes de code
  • Google Chromium : 18 millions de lignes de code
  • KDE : 57 millions de lignes de code
  • Mesa : 1,5 millions de lignes de code
  • Qt5 : 8 millions lignes de code


De plus rien ne prouve que Microsoft est le plus gros contributeur sur GitHub, puisque Microsoft aurait 4 550 utilisateurs ayant fait plus de dix commits sur des projets publics, donc ça ne donne aucune indication pertinente sur la quantité totale de commits faits ou sur le nombre de lignes ajoutées ou modifiées. On nage dans le grand n'importe quoi.

Et même si par hasard Microsoft serait le plus gros contributeur sur GitHub, ce qui n'est pas prouvé, ce ne serait pas le plus gros contributeurs open source, car GitHub n'accueille pas tous les projets open source, loin de là. Les plus gros projets open source ne sont pas hébergés sur GitHub.

Ensuite je ne comprends pas trop les graphiques donnés par GitHub, Microsoft Visual Code est donné comme le projet ayant le plus de contributeurs, 15 000 d'après le graphique, alors que la page GitHub de Visual Studio Code donne 517 contributeurs pour 29 982 commits, en comparaison Ansible, qui arrive en dixième position, possède 3 302 contributeurs pour 36 036 commits sur la page GitHub Ansible.
Avatar de Matthieu76 Matthieu76 - Membre éclairé https://www.developpez.com
le 27/02/2018 à 14:53
Citation Envoyé par FatAgnus Voir le message
Ensuite je ne comprends pas trop les graphiques donnés par GitHub, Microsoft Visual Code est donné comme le projet ayant le plus de contributeurs, 15 000 d'après le graphique, alors que la page GitHub de Visual Studio Code donne 517 contributeurs pour 29 982 commits
Peut-être que Github compte aussi les commit sur les fork mais ça ne serait pas très pertinent de mon point de vue.
Avatar de Marco46 Marco46 - Modérateur https://www.developpez.com
le 27/02/2018 à 23:43
Peut-être que Github compte aussi les commit sur les fork mais ça ne serait pas très pertinent de mon point de vue.
Ça serait vraiment n'importe quoi puisque la plupart du temps les commits ajoutés à un fork finissent dans le repo d'origine si la PR est acceptée !

Je pense plutôt qu'ils agrègent tous les repos liés à un projet via les topics. Aucun des repos listés n'a autant de contributeurs dans leur liste sur le profil github.

Le raccourci n'est pas un peu rapide ?
C'est pas faux c'est un peu rapide mais la plupart des projets opensource sont quand même sur github. Il n'y a probablement que quelques gros gros qui ont leur propre solution dédiée. Donc bon ...

On notera que les Lyonnais de GitBook sont dans les 5 applis github les plus utilisées par les organisations : Cocorico
Avatar de FatAgnus FatAgnus - Membre actif https://www.developpez.com
le 03/03/2018 à 14:34
Citation Envoyé par Marco46 Voir le message

C'est pas faux c'est un peu rapide mais la plupart des projets open source sont quand même sur GitHub. Il n'y a probablement que quelques gros gros qui ont leur propre solution dédiée. Donc bon...
GitHub attire de nombreux développeurs et de nombreux projets open source, mais beaucoup de gros projets open source ont leurs propres dépôts (noyau Linux, LibreOffice, Firefox, Android, Google Chromium, OpenJDK, Eclipse, ...) ce qui représente plusieurs centaines millions de ligne de codes. Ne pas oublier les projets qui sont encore hébergés sur SouceForge (MinGW, FreeDOS, ...). La fondation Apache héberge également ses dépôts (Struts, Subversion, Tomcat, ...) tout comme la FSF (GCC, Bash, ...). Donc réduire les projets GitHub aux projets open source est une aberration. La société Google doit être, à mon humble avis, un plus gros contributeur que Microsoft, vu le nombre de projets dans lesquels elle est impliquée (Android, ChromeOS, Google Chrome, ...).
Avatar de Mickael_Istria Mickael_Istria - Membre émérite https://www.developpez.com
le 04/03/2018 à 21:09
Citation Envoyé par FatAgnus Voir le message
ça ne donne aucune indication pertinente sur la quantité totale de commits faits ou sur le nombre de lignes ajoutées ou modifiées.[...] GitHub n'accueille pas tous les projets open source, loin de là. Les plus gros projets open source ne sont pas hébergés sur GitHub.
J'ai recemment eu cette discussion justement avec pas mal de gens plutot sensibles au marketing qui disaient que VSCode etait largement au dessus du lot en popularite et qu'Eclipse IDE (il me semble dans le 80M lignes de codes, avec un historique de plus de 2000 contributeurs et un actif de peut-etre 200, repos pas tous chez GitHub, et organises de maniere modulaire si bien qu'aucun repo n'affiche les gros nombres) etait en train de mourir. Justement, ils s'appuyaient sur ce genre de stats. Et on en est arrive a la meme conclude 1. les stats sont deja discutables en soi parce qu'on ne retrouve pas forcement les memes et 2. quand on etudie la "qualite" des commits on voit bien qu'il y a beaucoup de "petits" commits sur les projets chez GitHub alors que pour Eclipse IDE -qui utilise plutot Gerrit- on est sur des commits plus charnus. Et en effet, quand on compare le workflow GitHub pull-request au workflow Gerrit, on comprend qu'on arrive sur des plus petits nombres avec Gerrit pour des commits qui sont individuellement de meilleur qualite.
Tout ca pour enfoncer le clou que ce genre de stats, il faut s'en mefier comme de la peste; mais malheureusement beaucoup de gens les prennent telles quelles et prennent leurs decision en fonction de ca, menant notre domaine sur des chemins pas forcement tres innovants ou utiles a moyen/long terme.
Les stats GitHub sont plus des stats de hype que des stats de developpement.

Ensuite je ne comprends pas trop les graphiques donnés par GitHub, Microsoft Visual Code est donné comme le projet ayant le plus de contributeurs, 15 000 d'après le graphique, alors que la page GitHub de Visual Studio Code donne 517 contributeurs pour 29 982 commits, en comparaison Ansible, qui arrive en dixième position, possède 3 302 contributeurs pour 36 036 commits sur la page GitHub Ansible.
Peut-etre comptent-ils les rapports de bug comme une contribution? Ca serait pas si mal.

Pour ceux qui veulent bosser dans l'opensource, plutot que de regarder ce classement et de penser que Microsoft ou Google sont les meilleurs employeurs pour faire une carriere OSS, je vous recommande de prendre le nombres de contributeurs, et de le diviser par le nombre d'employes de l'entreprise, c'est plus revelateur de la realite d'une boite X ou Y, et ca remet un peu Microsoft a sa place de "contributeur occasionel". Une autre stat interessante ce serait le nombre de projets dans lesquels sont impliquees les entreprises (au sens d'activite reguliere de commit), et la, on verrait aussi que ces grosses boites ne ratissent pas si larges.
Contacter le responsable de la rubrique Accueil