BiopSci

La science à portée de tous

Analyse des liens entre blogs de science

Par | Catégorie: Analyse | Le 10 fév 2014

Il y a maintenant deux semaines, la blogosphère scientifique française a connu une rare effervescence suite à un billet de Marc questionnant justement l’existence d’une telle blogosphère et les relations entre les différents acteurs de communication scientifique en français.
Je ne résumerai pas les quelques 90 commentaires publiés à ce jour en réponse à cet article (que je vous invite cependant à lire si le sujet vous intéresse) mais propose une approche personnelle et en partie quantitative à cette question.

Comme je l’ai énoncé à l’occasion de ce billet mon impression est que différents sous réseaux vivaient en vase clos et ne se citaient que peu entre eux. Cette impression me semble encore plus vraie lorsque l’on prend en compte les médias grand public (tels lemonde.fr, Rue89, libération,…) qui ne cite qu’extrêmement rarement des billets de blog dans leurs articles (ou alors des blogs anglophones) quand bien même il existe un contenu francophone de qualité disponible. Un fait qui n’a d’ailleurs pas été réfuté par les journalistes ayant participé au débat.

Plutôt que de seulement me fier à des impressions et quelques avis j’ai donc mené une rapide analyse des liens qui unissent les différents médias scientifiques francophones. Pour cela j’ai écrit une petit script (en R pour les curieux) qui « lit » le flux RSS de 41 blogs et extrait les liens qui y sont présents. Pour des raisons de lisibilité, le détail des méthodes se trouve en fin d’article.

Blogosphère ou pas blogosphère?

Le graphique ci-dessous montre les liens qui existent entre billets des différents blogs étudiés. Le code couleur rassemble les blogs appartenant à un même réseau. Pour des raisons techniques, il ne m’est pas possible de savoir vers quel blog de scilogs.fr ou de l’Agence Science Presse (ASP) pointe un lien, ces deux réseaux sont donc représentés comme un seul point représentant tous les blogs y appartenant (voir méthodes pour plus de détails). Par blog libre, comprendre blog n’appartenant à aucune de ces plateformes (R était fâché avec les accents =)). L’épaisseur des flèches est proportionnelle au nombre de liens par article qu’un blog reçoit de la part d’un autre.

graphnoselfsmall3Liens entre blogs de sciences francophones. Les données brutes sont visibles ici. Cliquer sur l’image pour une plus haute résolution.

Qu’apprend on à partir de ce graphe?

  • Il existe tout de même quelques connexions entre blogs et réseaux. Les blogs du C@fé des Sciences se lient entre eux mais aussi l’ASP, scilogs.fr et les blogs du monde.
  • De nombreux blogs se la joue solo. Hormis un lien de Passeur de Sciences vers le fameux billet de Marc, aucun autre blog « média » ne lie un quelconque autre blog non « média » étudié ici. Des 5 blogs indépendants inclus dans l’analyse, seul un cite un autre blog de l’analyse. Trois d’entre eux n’apparaissent pas car ils n’envoient ou reçoivent aucune citation.
  • Sans grande surprise, tous les blogs ne sont pas égaux en terme de liens reçus ou envoyés, plus de détail ci dessous.
  • Toutes les gammes de blogs ont leur place. Par exemple, un blog comme Bioinfo-Fr (numéro 19) qui est très technique est cité par d’autres blogs afin d’orienter les lecteurs curieux vers un article plus poussé.

Pour ceux souhaitant repérer leur blog préféré sur ce graphe, la légende se trouve ci dessous:

Identifiant Domaine
0 sciencepresse.qc.ca
1 scilogs.fr
2 passeurdesciences.blog.lemonde.fr
3 biopsci.com
4 toutsepassecommesi.cafe-sciences.org
5 anthropoblog.fr
6 homofabulus.com
7 stripscience.cafe-sciences.org
8 bacterioblog.com
9 comptoir.cafe-sciences.org
10 webinet.cafe-sciences.org
11 tomroud.cafe-sciences.org
12 drgoulu.com
13 sciencetonnante.wordpress.com
14 scienceabilly.com
15 archeo.blog.lemonde.fr
16 fossilandmrdarwin.wordpress.com
17 alasource.blog.lemonde.fr
18 binaire.blog.lemonde.fr
19 bioinfo-fr.net
20 alamain.info
21 pourquoilecielestbleu.cafe-sciences.org
22 kidiscience.cafe-sciences.org

Qui sont les champions des liens?

Passons maintenant à des mini classements qu’il faut tout de même relativiser car la méthode utilisée est loin d’être exhaustive (de nombreux blogs n’ont pas été inclus dans l’étude, voir méthodes).

Premièrement, qui inclue le plus de liens (de tout type mais non internes) dans ses articles?


Blog Nombre lien sortant
Psycho info 0.10
Scientaisies 0.10
L’énervement me gagne 0.30
Jean Pierre Urbain 0.33
Mémoire et cie 0.33
Accros de la foret 0.50
Bruno Fortin 0.50
Physique et objets du quotidien 0.50
Secrets du sommeil 0.50
Gravite zero absolu 0.80
Best of Bestioles 0.90
Réflexions stochastiques 1.00
Melanie Jean 1.25
Cerveau aux hormones 1.25
Ecoblog 1.43
A la main 1.50
Complexites 1.71
Ariel Fenster 1.83
Binaire 1.90
Signal sur bruit 2.00
Blogue ta science 2.17
Diane Ostiguy 2.17
L’actu sur le divan 2.20
Bruno Letarte 2.33
Couleur Science 2.95
Yvan Dutil 3.00
Revue de blogs 3.00
Maman Eprouvette 3.17
Kidisciences 3.50
Arizona 3.60
Alexis Reymbaut 3.67
Nathalie Guimond 3.80
Eric Leuuwerk 4.00
David Carter 4.17
Pourquoi le ciel est bleu 4.20
Gail Ouellette 4.33
Intelligence mécanique 4.40
Stripsciences 4.40
Josée Nadia Drouin 4.67
Cathy Bazinet 4.67
Vincent Menuz 4.67
Bruno Geoffroy 4.67
Mon Climat Ma sante 5.25
Bactérioblog 5.50
Matières vivantes 5.50
A la source 5.60
Envi2bio 6.00
Raison et psychologie 6.00
MyScienceWork 6.20
Prospective spatiale 6.20
The fossil and Mr Darwin 6.25
Alterscience 6.43
Labo Journalisme Scientifique 6.67
Le comptoir du Café 6.75
Audrey Yank 7.00
Archeo 7.00
La grande equation 7.33
Laurent Olivier 7.50
Science à Billy 7.50
Science, croyances et idées reçues 7.80
Cercle scientifique 7.83
J Bouchez 8.00
Homo Fabulus 8.00
Bio-info -Fr 8.30
Le cerveau a tous les niveaux 8.50
Science étonnante 8.60
Sebastien Carassou 9.17
Pauline Gagnon 9.67
Le journal des chouettes savantes 10.00
Le webinet des curiosités 10.00
Florence Piron 10.67
Pascal Lapointe 11.17
Tout se passe comme si 12.40
Passeur de sciences 12.70
Biopsci 12.80
Antoine Bonvoisin 13.83
Anthropoblog 23.70
Pourquoi comment combien 24.40

Ce classement rend bien compte des disparités qui existent. Quand certains comme Pourquoi comment combien ou l’anthropoblog incluent environ 24 liens par article en moyenne, d’autres se contentent d’un lien tous les dix articles. Malgré son faible nombre de liens vers la blogosphère, un blog comme Passeur de sciences (lemonde.fr) figure tout de même dans le top 5 des fournisseurs de liens externes.

Second point, quels sont les blogs recevant le plus de liens de la part des autres blogs inclus dans cette analyse.

Blog/Domaine Nombre de liens entrants par article (sur blog externe)
scilogs.fr 0.10
alasource.blog.lemonde.fr 0.10
binaire.blog.lemonde.fr 0.10
alamain.info 0.10
kidiscience.cafe-sciences.org 0.10
archeo.blog.lemonde.fr 0.20
bioinfo-fr.net 0.30
biopsci.com 0.30
tomroud.cafe-sciences.org 0.30
pourquoilecielestbleu.cafe-sciences.org 0.30
sciencetonnante.wordpress.com 0.50
webinet.cafe-sciences.org 0.95
passeurdesciences.blog.lemonde.fr 1.06
toutsepassecommesi.cafe-sciences.org 1.37
sciencepresse.qc.ca 1.90

L’ASP est en tête des blogs les plus cités mais le doit au fait que tous les blogs de la plateforme sont analysés comme un seul blog. Le blog Tout se passe comme ci est le second le plus cité, certainement car il aime générer des discussions (à l’image de celle à l’origine de ce billet) et est ainsi cité par d’autres blogueurs. Passeur de sciences complète le podium, profitant certainement de la qualité de ses billets et de la visibilité offerte par le site de lemonde.fr. A noter que malgré l’agrégation de tous ses blogs en un seul point de données, la plateforme scilogs.fr ne reçoit que peu de citations, peut être en raison de son jeune âge.

Troisièmement, je me suis intéressé aux liens qui sont faits vers les sites des journaux scientifiques publiant les résultats originaux de recherche scientifique. Cela me permet de voir quels blogs citent le plus souvent les sources originales donnant ainsi à leurs lecteurs le désirant l’opportunité de consulter eux mêmes les résultats rapportés par les équipes de scientifiques. La liste des sites de journaux scientifiques a été faite manuellement à partir des plus de 1000 domaines cités dans l’étude et n’est certainement pas exhaustive, les résultats sont donc certainement légèrement différents de la réalité.


Blog Nombre de liens vers un article original de recherche par billet
A la main 0.10
Kidisciences 0.10
Science étonnante 0.10
Gravite zero absolu 0.10
Alterscience 0.14
Ecoblog 0.14
Couleur Science 0.15
Pascal Lapointe 0.17
Bruno Letarte 0.17
Blogue ta science 0.17
La grande equation 0.17
Audrey Yank 0.17
Florence Piron 0.17
Le cerveau a tous les niveaux 0.17
Yvan Dutil 0.17
Maman Eprouvette 0.17
L’actu sur le divan 0.20
Bio-info -Fr 0.20
Le journal des chouettes savantes 0.22
Le comptoir du Café 0.25
Bactérioblog 0.30
Matières vivantes 0.30
Pourquoi comment combien 0.30
Alexis Reymbaut 0.33
Gail Ouellette 0.33
David Carter 0.50
Cerveau aux hormones 0.62
Science, croyances et idées reçues 0.70
Pourquoi le ciel est bleu 0.70
The fossil and Mr Darwin 0.75
A la source 0.80
Homo Fabulus 0.80
Le webinet des curiosités 0.80
Labo Journalisme Scientifique 0.83
Raison et psychologie 1.00
Passeur de sciences 1.10
Tout se passe comme si 1.20
Biopsci 2.50

Ce même blog se hisse en tête de ce classement talonné par Tout se passe comme si et Passeurs de sciences qui montre que les journalistes savent aussi citer les travaux originaux, une pratique dont nombreux de ses confrères devraient s’inspirer. Parmi les raisons emmenant certains blogueurs à ne pas citer les articles originaux on peut recenser: une mauvaise pratique à éliminer, l’impossibilité d’accéder à certaines publications en accès fermé, l’absence de pertinence pour certains types d’articles.

Enfin, je me suis intéressé aux références citées par les blogueurs en général. Ci dessous un aperçu des 18 domaines les plus cités dans les blogs analysés.

Domaine Nombre de citations par article (cumulé)
echosciences-grenoble.fr 2.20
wikipedia.org 2.30
ledevoir.com 2.33
sciencemag.org 2.42
monclimatmasante.qc.ca 2.50
podcastscience.fm 2.50
nature.com 2.71
sciencedirect.com 2.92
pourlascience.fr 3.53
lemonde.fr 3.71
facebook.com 4.39
lecerveau.mcgill.ca 4.58
mysciencework.com 4.80
quantumdiaries.org 6.00
youtube.com 9.07
en.wikipedia.org 10.39
twitter.com 10.61
fr.wikipedia.org 40.71

Sans surprise, Wikipedia est parmi les plus cité (que ce soit en français ou en anglais). Les réseaux sociaux sont aussi très cités montrant qu’il prennent de la place dans la communication scientifique. Les médias scientifiques ou généralistes tels lemonde.fr ou pourlascience.fr s’en sortent aussi bien étant donnés leur visibilité et professionnalisme. Les blogs sont loin derrière (les plus haut classés ont des scores entre 1 et 2 comme vu précédemment).

Que conclure

Cette petite étude, bien qu’incomplète, concentre une bonne quantité d’informations que chacun sera libre d’interpréter selon l’angle qu’il préfère.
Pour ma part, je retiendrai qu’il existe tout de même une petite blogosphère scientifique francophone qui n’hésite pas à se citer les uns les autres. Les médias grand publics (ici seul les blogs de lemonde.fr ont pu être analysés) ne sont pas forcément avares en liens mais ne semble pas inclure les blogs francophones dans leur liste de source de confiance (par manque de visibilité?). Aux blogueurs donc de faire un peu de lobbying afin de se faire connaitre et ainsi être considéré comme une source fiable d’information ou de discussion scientifique. A ce propos, on peut féliciter l’initiative du jeune collectif Conscience qui a intégré sur sa page d’accueil un formulaire pour chercher spécifiquement du contenu dans la blogosphère scientifique francophone. Nous n’aurons désormais plus d’excuses pour ne pas citer les blogueurs scientifiques francophones…

Méthodes

  • La liste des blogs a été récupérée manuellement depuis les plateformes scilogs.fr, Agence Science Presse (ASP) et C@fé des Sciences (dont je fais partie). 5 blogs « indépendants » ont aussi été ajoutés à la liste consultable dans la section données ci dessous.
  • De nombreux blogs ont été retirés du jeu d’analyse car les flux RSS ne pouvaient pas être analysés correctement généralement car ils étaient tronqués ou mal formatés. Ceci explique certainement pourquoi votre blog préféré ou personnel n’est pas présent. Notamment, les blogs médias, hormis ceux de lemonde.fr, proposent un flux RSS tronqué ce qui empêche de les intégrer dans cette analyse.
  • Les flux RSS ne contiennent qu’un nombre limité d’articles (généralement 10) et leur analyse n’est donc pas représentative de l’ensemble d’un blog, seulement de ses derniers billets.
  • Les liens internes (lien vers son propre blog) ne sont pas inclus dans les analyses.
  • Le nombre de liens rapporté est normalisé par article. Un score de 1 indique qu’un site est cité en moyenne une fois par article.
  • Pour des raisons techniques les blogs de l’ASP et de scilogs.fr sont reduites à un seul point pour les liens entrants (pour les analyses ou le graphe). Le script utilisé détecte vers quel sous domaine pointe un lien. Par exemple biopsci.com ou toutsepassecommesi.cafe-sciences.org. Ces deux plateformes ne permettent pas d’identifier un blog grâce au sous-domaine. En d’autres termes, lorsqu’un lien pointe vers l’une de ces deux plateformes je n’ai pas le moyen de facilement savoir quel blog précis est cité. Les liens vers ces plateformes sont donc agrégés à la plateforme dans son ensemble. Il n’y a cependant pas de problèmes pour les liens sortants car ils sont déterminés à partir du flux RSS propre à chaque blog.

Données

Ensemble des liens étudiés – TXT (délimitation: tabulations)
Ensemble des billets étudiés – RData (peut être ouvert avec le logiciel R)
Ensemble des blogs étudiés – TXT (délimitation: tabulations)
Blogs non pris en compte pour raisons techniques – TXT

créateur de BiopSci
Voir tous les articles de

15 commentaires »

  1. Analyse très intéressante, merci !

    Cela confirme qu’il y a déjà une blogosphère au sein du C@fé sciences, et que les blogs des médias se la jouent solo. J’aime beaucoup les chiffres des références vers les journaux scientifiques aussi. :-)

    En ce qui concerne les chiffres vers mon blog, je me demande ce qui se passerait en excluant le fameux billet « blogosphère » (j’ai la flemme de refaire ton analyse). De manière générale, la robustesse de l’analyse se vérifierait bien par un jackknife (enlever un billet à la fois et voir si cela impacte beaucoup les résultats).

  2. Voilà des résultats édifiants qui feraient un beau papier pour Journal of Scientific Blogging ;) (il ne manque plus qu’à créer cette revue).
    Merci infiniment d’avoir cité CONSCIENCE. J’en profite pour signaler que suite à des réglages de dernière minute, la barre de recherche a été déplacée vers une page dédiée : http://collectifconscience.com/rech-blogs/
    Il serait intéressant de refaire la même étude dans un an ou plus pour voir l’impact potentiel de ces articles sur les habitudes des bloggeurs (en espérant qu’il soit positif!).

  3. @MRR: merci. Sur une moyenne de 10 billets par blog les résultats devraient être un minimum robustes pour les hauts scores. Pour un score de 0.1 (une citation tous les 10 billets) ce sera évidemment plus aléatoire. C’est notamment pour cela que j’ai fait une description du graphe plus qualitative que quantitative, faute d’avoir des stats robustes.

    @Valentine: merci pour le lien. J’essaieria de répéter l’analyse dans quelques temps pour voir un peu comment évoluent les choses, mais bon, je ne promets rien.

  4. Bravo pour cette analyse. Il faut aussi souligner le très grand nombre de blogueurs qui ne font presque pas de liens. Au final, c’est une bonne leçon pour tout le monde: oui, les journalistes ne sont pas doués pour faire des liens vers les blogueurs, mais les blogueurs eux-mêmes n’en font pas beaucoup vers les autres blogueurs! Ça rejoint les discussions lancées par Marc, et les observations que nous avions de notre côté après la sortie du livre: pour construire une communauté de blogueurs de science, il faut se parler davantage, et ceci passe avant tout par une meilleure connaissance des blogues des autres.

  5. A propos des liens sur des journaux en accès fermé, un coup de Google Scholar permet en général très facilement de trouver le PDF en accès libre, souvent sur des sites de chercheurs ou de labos. Ca ne marche pas à tous les coups, mais souvent, surtout pour des papiers un peu connus.

    Pour ma part je mets ces liens vers des PDF libres autant que possible, plutôt que faire le site du journal en accès payant (ce qui d’ailleurs je pense explique mon faible score en « citations des sources » alors que je suis plutôt assez exigeant sur ce point)

  6. @Pascal: Effectivement, il y a encore quelques progrès à faire en matière d’échanges de liens. Mais il y a eu pas mal d’émulation et discussions autour du sujet dernièrement. Espérons donc qu’il y ait du changement. =)

    @David: Effectivement avec un coup de Google on peut souvent trouver l’article que l’on souhaite mais dans un tel cas faire un lien gratuit vers cet article est illégal… Les liens directs vers les PDF ne seront pris en compte que si ils sont hébergés sur le domaine du journal en question, ceci peut effectivement expliquer pourquoi certains blogs citant souvent leurs sources ont un score assez faible (comme indiqué dans l’article, la méthode est loin d’être optimale mais donne juste une vision d’ensemble).

  7. « Effectivement avec un coup de Google on peut souvent trouver l’article que l’on souhaite mais dans un tel cas faire un lien gratuit vers cet article est illégal… »

    Que veux-tu dire ? Copier le PDF sur son propre serveur est potentiellement illégal, mais faire un hyperlien vers le PDF disponible sur une page externe ne me semble pas être illégal.

  8. Le cas est effectivement ambigü et peut différer entre pays et selon les jurisprudences. On peut en effet penser que si tu n’héberges pas le lien toi même tu ne risques rien. Mais il y a de nombreuses condamnations pour des sites n’hébergeant aucun contenu illégal mais facilitant l’accès à ces contenus (Pirate Bay par exemple). Mais il est vrai que, de ce que j’ai lu, les éditeurs de journaux demandent généralement à ceux hébergeant un contenu « illégal » de le retirer mais pas à ceux qui font des liens vers ces articles (ce qui au final reviendra au même car le lien sera mort).

  9. [...] les détails, vous pouvez jeter un oeil à l’article consacré à cette analyse. Niveau: Difficile. Demande de l’expertise en analyse de données, extraction [...]

  10. Les hetres humain et les autres especes brizaient leurs carcasses osseuse et mangeai leurs moilles .ceci leurs confrimai une vie beaucoups plus long et resistance au maladie et au climat extrement rude de lepoq. Et ma descendance a comtinee plus tard. Ils se sont fait ejecter du pays ou il vivaient . L’inde il ne devait rien rester des osement suite au legeandes et au superstipns de grande craint. Je vai essayer de continuer plus de place pour ecrir.

  11. Sai pour cela q lont ne retrouve rient de certain hetres rare. Ils prefere ne rient laisser, car ceci les condaneraient iremediablement. Ceci ma ete transmi par descendance de bouche a orielles.

  12. Il ne faut pas oublier q les animaux et les insectes se soigne par les plantes.je ne dit pas q je descent des yeti. Je suis pas idiot. Mai il faut comprendre se q certain scentifiq refuse de voir.et moi j’admet q’il existe plusieurs sortes et formes d’inteligences.or es q vous les scientifiq vous admeter ceci ?????

  13. De meme certain hetres humain ou animaux emette des sortes d’ondes q l’ont ne soupesonne pas leur importance. Sai se qi les fait survivreleur especes. Es q vous les scientifiq vous etes capable de l’admetre. Et es q vous etes capable d’admetre q la terre peu etre un tres long recomencemant. Oui ou non.?????

  14. Car pour certaine personne, il existe d’autre stade et epoque et sicles de vie dans le temp de la terre. Et ceci vous en avez entendu parler et vous ne voulez pas l’admetre. Exemples l’epoque des geants, ont retouvent des tetes geantes et des jambes en fossil en ameriq du sud et en australi .meme si sai devant vos yeux vous refuser de l’admtre.

  15. Jespere q vous me repondrez. Merci. Je veu faire un grand projet sur plusieurs comunes de france en bio je ne peu pas tout dire sur se. Ceci avec des grands nom coffe ou autres perspnnes qi poura me conseiller avec des dossiers.

Laisser un commentaire