L’édition scientifique, un titan qui dévore ses enfants (janvier 2013)

Par Olivier Michel, Claire Le Strat et Stéphane Guillemarre

Le récent décès de l’américain Aaron Swartz, âgé de 26 ans, illustre de façon tragique les conséquences du fonctionnement de l’industrie de l’édition scientifique. Comment « un crime sans victime » [1], où rien n’a été endommagé, a-t-il pu aboutir à la disparition d’un informaticien doué, politiquement engagé pour la justice sociale ? Quels enjeux économiques sous-tendent cette dramatique issue ? Existe-t-il des alternatives à un modèle économique supporté par ses contributeurs, mais dont seuls quelques-uns profitent ?

L’affaire JSTOR

Aaron Swartz était un informaticien brillant, ardent défenseur de la libre circulation de l’information. À 14 ans, il a participé au développement du format RSS [2] qui permet un accès automatique aux nouveaux contenus mis en ligne sur un site Internet. Il cofonde, par la suite, le site communautaire de bookmarking social Reddit [3] et sera à l’origine du lancement du site Demand Progress [4], qui s’est notamment illustré lors de la campagne anti-SOPA/PIPA [5], ayant entraîné l’abandon de ces projets de loi.

Ce qui intéressait fondamentalement Aaron Swatrz, c’était l’usage et la diffusion libres des informations financées sur fonds publics. Dans ce cadre, il s’était intéressé à JSTOR, une société américaine à but non lucratif spécialisée dans l’archivage de publications scientifiques. En septembre 2010, alors étudiant en éthique à l’université d’Harvard, il a utilisé illégalement un accès du MIT [6] (dont il ne faisait pas partie), pour avoir un libre accès à l’intégralité des articles disponibles chez JSTOR et télécharger, sur une période de 5 mois environ, 4 millions d’articles du fonds documentaire [7]. Alors que JSTOR a finalement décidé de ne pas poursuivre Aaron Swartz, le procureur du Massachusetts a choisi de le faire, aux titres de fraude par moyens de communication, fraude informatique, gain illégal d’informations d’un ordinateur protégé et dommages par imprudence d’un ordinateur protégé, chefs d’accusation qui pouvaient lui valoir jusqu’à 35 ans d’emprisonnement et 1M$ d’amende.

Vendredi 11 janvier, Aaron Swartz s’est pendu dans son appartement de Brooklyn.

L’édition scientifique, laboratoire du capitalisme total

Ce que révèle cette affaire – qui n’intéresse pas que les Etats-Unis, mais nous concerne aussi de ce côté de l’Atlantique -, c’est l’importance des enjeux recouverts par le marché des publications académiques [8], et le peu de cas que fait cette industrie de la vie de ceux qui s’y opposent. Ce marché est à lui seul un modèle de la logique du capitalisme (forte concentration des acteurs, coûts exorbitants des usages pour les auteurs et les lecteurs, privatisation des résultats des investissements publics via la captation de la propriété intellectuelle), et pose ainsi la question du statut de la connaissance, bien commun ou marchandise.

La concentration, tout d’abord. N’en déplaise à ses nombreux acteurs, tant publics que privés, on a assisté cette dernière décennie à un important mouvement de concentration de l’édition scientifique. Ainsi, en 2009 [9], ce « marché » concernait 24 000 journaux scientifiques à comité de lecture, abondés par 1M d’auteurs avec, en moyenne, 1.5M de publications, consultées par 10 à 15M de lecteurs, dans plus de 10 000 institutions. Ce marché, en croissance de 6 à 7 % par an, est concentré dans les mains de trois acteurs [10] qui en détiennent 90%, représentant plus de 7 560 M$ de CA en 2007 [11], pour le seul secteur STM [12].

On aurait pu imaginer que cette importante concentration engendrerait des coûts faibles pour les auteurs et les lecteurs : c’est exactement l’inverse qui se produit, et chacun est sommé de s’acquitter de frais importants à chaque étape du processus d’édition des travaux d’un chercheur dans une revue scientifique.

Revenons sur ce processus. Un scientifique rédige un article, qui résume un travail de recherche, et le soumet à une revue dont la cote correspond à la qualité du travail réalisé [13]. Il s’ensuit une étape de sélection, via la relecture par des pairs (des collègues anonymes) du travail de notre chercheur. Ceux-ci vont décider, avec le directeur de rédaction, si le niveau de qualité requis est atteint. Si c’est le cas, des échanges avec l’auteur permettent de mettre en forme le document selon les contraintes de style imposées par la revue ; sinon, l’article peut être proposé à révision, ou simplement rejeté. Si l’article est accepté, il sera obligatoirement demandé à l’auteur de céder tous ses droits, de façon définitive et irrévocable, au bénéfice de l’éditeur. Il peut, de plus, être demandé à l’auteur le paiement de frais annexes, qui peuvent êtres très élevés [14]. Une fois édité, l’article sera disponible en consultation sur le site Internet de l’éditeur, et parfois en version papier.

Comment l’éditeur va-t-il rentabiliser au maximum toutes ces étapes ? En commençant par considérer que le travail du chercheur est gratuit : il n’est pas question de rémunérer son article, comme c’est le cas dans tous les journaux classiques. En considérant aussi comme gratuit le travail de relecture et de sélection fait par les pairs [15]. En considérant encore comme gratuit le travail de mise en page réalisé en grande partie par le chercheur [16]. Quand ce n’est pas le cas et qu’il reste des tâches d’édition à effectuer, en délocalisant toutes les tâches de réalisation : c’est avec des interlocuteurs indiens ou chinois que les scientifiques négocient la mise en page finale de leur article. Enfin, en faisant payer l’accès aux publications en ligne à ceux-là mêmes qui les ont produites, à des tarifs exorbitants [17] !

L’édition scientifique est un parfait laboratoire du capitalisme total : exploitation maximale de travail gratuit, délocalisation des tâches peu qualifiées, ajout de frais annexes importants, captation de la propriété intellectuelle. Un lecteur qui souhaite consulter la publication d’un chercheur d’un institut de recherche public doit ainsi la payer quatre fois : une première fois en finançant le chercheur, une deuxième fois en finançant le travail de relecture des pairs, une troisième fois en finançant les coûts de publication et, enfin, une quatrième fois pour y avoir accès. Tout cela pour consulter un document qui n’appartient plus à la collectivité qui l’a financé [18] ! Et, à chaque fois, l’éditeur est gagnant. On comprend que les marges opérationnelles des éditeurs atteignent facilement 30 %.

Les alternatives

Les intérêts des éditeurs scientifiques sont largement antagonistes de ceux des chercheurs : les premiers cherchent à maximiser les gains produits par la vente des publications des résultats scientifiques, quand les seconds souhaitent rendre leurs travaux visibles, à des fins collaboratives et pour gagner en notoriété, sans tirer aucun profit direct de ces publications [19].

En cette période de crise économique, les institutions de recherche ont pris la mesure des coûts prohibitifs exigés par les éditeurs [20] et, des universités californiennes au Max Planck Institute allemand, en passant par l’université Pierre et Marie Curie en France, de nombreux contrats d’abonnement aux éditeurs scientifiques ont été rompus. Mais est-ce la solution ? Les travaux de recherche financés sur fonds publics ne devraient-ils pas être librement consultables par ceux qui les ont financés, plutôt que de devenir des rentes pour éditeurs ?

Plusieurs voies existent. La première, législative, consisterait à réglementer la propriété intellectuelle liée aux travaux de recherche, en établissant que les droits d’auteur de toute publication liée à un travail réalisé par un chercheur d’un institut public, ou financé pour partie par des fonds publics, sont incessibles à un éditeur. Et c’est à l’échelle européenne, d’abord, qu’il serait nécessaire d’agir, afin de ne pas mettre en concurrence les états membres, pour étendre ensuite rapidement cette réglementation à l’ensemble de l’espace de recherche mondial, qui ne connaît pas de frontières.

Une seconde voie a été ouverte par « L’initiative de Budapest pour le libre accès », à l’occasion d’une conférence tenue en février 2002, et par la « Déclaration de Berlin sur le libre accès à la connaissance », lors d’une conférence organisée par le Max Planck Institute en 2003, qui propose la notion d’Open Access (OA). L’OA propose aux chercheurs de publier dans une revue scientifique, tout en effectuant l’auto-hébergement de leurs publications [21] : c’est le Green OA, qui ne concerne à ce jour que 7 à 15 % des publications scientifiques [22]. Un second type d’OA existe, qui propose aux scientifiques (ou à leurs institutions) de financer la publication de leurs travaux dans des revues scientifiques, par la suite librement consultables par tous : c’est le Gold OA [23].

Il est clair qu’aucun des deux types d’OA ne constitue une solution : passer du modèle lecteur/payeur au modèle auteur/payeur (dans le meilleur des cas) ne saurait être satisfaisant. Il est plus qu’urgent que la communauté des chercheurs [24] se saisisse de ce qui la concerne directement, afin d’assurer un processus de sélection des articles, puis de stockage et de diffusion, qui assure à la fois la meilleure qualité des travaux retenus et la plus grande visibilité possible : les communautés scientifiques de lecteurs existent, les outils techniques sont disponibles, il ne manque qu’une volonté politique forte pour les mettre en place.

Conclusion

Si, selon Kant, une « puissance extérieure, qui enlève aux hommes la liberté de communiquer publiquement leurs pensées, leur ôte aussi la liberté de penser » [25], l’édition scientifique, elle, par son bras séculier, n’hésite pas, 2 400 ans après le procès de Socrate, à condamner à mort ceux qui s’opposent à elle. Aaron Swartz était un enfant d’Internet et de l’édition scientifique [26], qui ne faisait que défendre les principes fondamentaux selon lesquels Internet offre aujourd’hui la possibilité de constituer une représentation sans intermédiaires, globale et interactive, des connaissances humaines, accessible mondialement, et dont le libre accès constitue une ressource et un patrimoine universels. En agissant pour qu’Internet soit un lieu interactif et transparent, il sera devenu le premier militant tombé au champ d’honneur du combat pour une connaissance libre.

Olivier Michel, professeur d’université en informatique, Claire Le Strat, politiste, Stéphane Guillemarre, enseignant en philosophie, sont membres de la Fondation Copernic.

[1] Selon l’expression du communiqué officiel de ses parents et partenaire (http://soupsoup.tumblr.com/post/403…).

[2] Acronyme de Really Simple Syndication (http://fr.wikipedia.org/wiki/RSS).

[3] http://www.reddit.com

[4] http://demandprogress.org/

[5] Projets de loi américains Stop Online Piracy Act et Preventing Real Online Threats to Economic Creativity and Theft of Intellectual Property Act.

[6] Le Massachusetts Institute of Technology est un organisme de recherche et une université de premier plan spécialisée dans les sciences et la technologie.

[7] On ne connaît pas le motif de ce téléchargement massif des articles de JSTOR. L’hypothèse la plus courante retient la volonté de leur mise en accès libre. Il semblerait pourtant que la véritable motivation regarde davantage l’analyse de documents dans le cadre d’une étude sur “l’influence de la corruption des institutions par de gros capitaux”. Tout cela à prendre au conditionnel, Aaron Swartz n’ayant pu aller au bout de sa démarche. – http://kottke.org/11/07/aaron-swart…

[8] Université et établissements publics de recherche (en France, CNRS, INRIA, INRA, INSERM… par exemple).

[9] Données issues du très bon article de Laurence Bianchini, http://www.mysciencework.com/fr/MyS….

[10] Par ordre d’importance décroissant (données du GFII d’août 2012, http://www.gfii.fr/fr/amico/260) : Reed Elsevier (avec sa division Elsevier pour l’édition technique et scientifique, 1193 M€ de CA sur 6 mois et une marge opérationnelle de 35 % du CA) ; Springer Science+Business Media (dont Springer, CA estimé de 400M€ sur 6 mois) ; Thomson Reuters (dont la division Intellectual Property & Science génère 338 M€ de CA sur 6 mois et une marge opérationnelle de 26 % du CA).

[11] Données de 2010 issues de http://www.gfii.fr/uploads/docs/gro…, p.17.

[12] STM est l’acronyme de Scientifique, Technique et Médical, n’incluant donc pas les SHS (Sciences de l’Homme et de la Société).

[13] Les meilleures revues internationales bénéficient d’un facteur d’impact (IF) qui correspond à l’audience de la revue et à sa sélectivité. Les IF commencent à des valeurs inférieures à 1 pour des disciplines peu visibles et peuvent atteindre des valeurs supérieures à 50 (en médecine et en biologie). Plus l’IF est élevé, plus il est difficile de voir son article sélectionné, mais le travail est davantage valorisé.

[14] Les Proceedings of the National Academy of Sciences (PNAS) réclament pour leur version Plus 215 $ par page ; Nature demande environ 500 $ pour la première figure en couleur, puis environ 250 $ pour les suivantes (les tarifs varient selon la section de publication).

[15] On ne dédommage que très rarement ce travail très technique, qui peut prendre plusieurs journées de travail pour un chercheur ; autant de temps qui n’est pas utilisé directement pour la recherche. Une étude anglaise de 2007 a montré qu’au taux horaire de 56 £, le travail de relecture coûtait entre 110 M£ et 165 M£ par an aux institutions (http://www.jisc-collections.ac.uk/R…). A comparer avec le coût des abonnements aux revues scientifique : 113 £ par an.

[16] On parle de version Camera-ready pour signifier que le document est intégrable en l’état à la revue.

[17] Le coût d’abonnement d’une grande université peut atteindre 50 000 $ par an, pour un accès numérique à un bouquet de revues (http://news.yahoo.com/feds-harvard-…). Une étude a montré qu’en 2007, les universités anglaises ont dépensé 80 M£ en licences d’accès aux revues en ligne, sur un total de 113 M£.

[18] On lira le très bon article de David Monniaux sur ce sujet – http://david.monniaux.free.fr/dotcl…

[19] La réalité est en fait plus contrastée : un chercheur est partiellement évalué sur ses publications scientifiques, et sa carrière comme les projets qu’il peut développer en dépendent directement.

[20] A titre indicatif, pour les 127 établissements français, dont les achats d’abonnements électroniques sont gérés par l’Agence bibliographique de l’enseignement supérieur (ABES), les publications Elsevier ont coûté 13,6 M€ en 2010 (cf. Richard Monvoisin, Le Monde Diplomatique, décembre 2012, p. 27). Par ailleurs, l’édition scientifique ne connaît pas la crise : le coût des revues ne cesse d’augmenter (de 4 à 5 % par an), alors que le budget des bibliothèques de recherche subit des réductions constantes.

[21] Hébergement sur les sites web de leurs institutions ou dans des sites nationaux, comme HAL, administré par le CNRS en France, DARE aux Pays-Bas, The Depot en Angleterre, ou même DRIVER au niveau européen.

[22] Donnée GFII, janvier 2010, Synthèse des discussions du groupe de travail sur le libre accès.

[23] Le Directory of Open Access Journals recense 4 400 revues scientifiques, dont les trois principales sont BioMed Central, PLoS et Hindawi.

[24] Une pétition sur Internet, « The cost of knowledge », a été mise en place en janvier 2012 et a réuni plus de 13 000 engagements de chercheurs à ne pas participer aux processus de publication, relecture ou travail éditorial pour la revue Elsevier, afin de lutter contre les tarifs excessifs demandés par cet éditeur.

[25] E. Kant, Qu’est-ce que s’orienter dans la pensée ?, traduction par Joseph Tissot, Mélanges de logique, Ladrange, 1862 (p. 315-341). Disponible en ligne : http://fr.wikisource.org/wiki/Qu’…

[26] En effet, Aaron Swartz a publié en 2002 un article scientifique, « MusicBrainz : A Semantic Web service », dans la prestigieuse revue IEEE Intelligent Systems (Swartz, A. « MusicBrainz : A Semantic Web service », IEEE Intelligent Systems, vol. 17, n° 1, Jan/Feb 2002, p.76–77.