Les big data dans les sciences de l'environnement : pratiques scientifiques, ontologies, politiques

Mardi 13 septembre 2022 (09h00)

Aix-en-Provence, Maison de la Recherche

Organisateur·trice(s) du CGGG : S. Dutreuil– L. Trocme-Nadal

Intervenant·e(s) du CGGG : S. Dutreuil– Y. Meinard– L. Trocme-Nadal

**Workshop : Les big data dans les sciences de l'environnement : pratiques scientifiques, ontologie, politiques.**

Mardi 13 septembre en salle 2.44 de la Maison de la recherche à Aix-en-Provence.

Organisation : Sébastien Dutreuil et Léo Trocme-Nadal
Porteur du projet : Sébastien Dutreuil CR CNRS, Centre Gilles Gaston Granger.

Deux pratiques ont profondément transformé les sciences ces dernières décennies : l’élaboration de modèles numériques prédictifs et la constitution de larges bases de données digitales. Historiquement considéré, l’essor d’un style scientifique alliant modèle prédictif et collecte d’une quantité importante de données nourrissant ces modèles prend son essor dans un contexte de guerre froide : il permet de mener à bien les calculs nécessaires à l’élaboration de la bombe thermonucléaire (Galison 1996) ; et pendant cette période, les savoirs de la géophysique et de l’écologie incarnent exemplairement ce style et prennent leur essor comme savoirs stratégique et militaire, avant qu’ils ne deviennent, à partir des années 1970, les « savoirs de l’environnement (e.g. Edwards 2010, Turchetti & Roberts 2014, Hamblin 2005, 2013).
Ce style scientifique, donnant lieu à un nouveau type de rationalité (e.g. Erickson et al. 2013) a depuis percolé dans l’ensemble des sciences et des savoirs. Plus récemment, à partir du début des années 2000, de nouveaux discours se sont structurés autour du label « Big data », initialement forgé dans les domaines de l’industrie numérique et du commerce au tournant des années 2000. Il désigne un ensemble de technologies d’accumulation massive et d’outils puissants de visualisation et d’analyse automatisée de données numériques, appelé à révolutionner les pratiques et les cadres théoriques de la recherche, voire à s’imposer comme un nouveau modèle unique de production de connaissances. Les sciences de l’environnement (écologie, climatologie, océanographie, etc.) se sont saisies, comme d’autres savoirs, de ces nouvelles pratiques. L’histoire, la sociologie et la philosophie des sciences ont, ces dernières années et décennies, abondamment étudié le statut épistémologique des modèles et simulations numériques - s’agit-il d’un type nouveau de production de savoir ? quelles sont ses pratiques centrales (vérification, validation, confirmation, etc) (e.g. Humphreys 2004 ; Morgan et Morrison 1999 ; Varenne et al. 2013, 2014 ; Weisberg 2013 ; Winsberg 2010, etc) - et leur histoire matérielle et politique (e.g. Armatte & Dahan 2004 ; Edwards 2010). Par contraste, les big data ont été l’objet de moins d’attention. Et, parmi les travaux notables, l’attention s’est davantage portée sur les sciences biologiques et médicales, s’intéressant à l’intérieur des organismes (Keller 2003, Leonelli 2016, Strasser 2018) qu’aux sciences de l’environnement.
Ce workshop vise à réfléchir aux enjeux épistémologiques, ontologiques et politiques des big data et des modèles numériques dans les sciences de l’environnement. Il réunira des spécialistes de l’histoire, de la philosophie et la sociologie des sciences, ainsi que des scientifiques travaillant directement avec ces outils. Il s’articule autour de trois axes de réflexion : (i) un axe descriptif et historique visant à analyser la nature des pratiques de « big data » et les nouveautés qu’elles introduisent ; (ii) un axe ontologique s’intéressant à la manière dont ces pratiques transforment les objets d’étude des sciences de l’environnement (iii) un axe historique et politique s’intéressant plus largement au régime de production des savoirs dans lequel s’inscrivent ces pratiques.

Axe 1. Quelles pratiques ?
Le label « big data » a été l’occasion de revendiquer l’essor de sciences radicalement nouvelles, qui auraient pour effet la disparition de certaines pratiques, et notamment de la théorisation. Vu de loin, la collecte de données en sciences de la nature ne semble avoir rien de fondamentalement nouveau puisqu’elle hérite de la grande tradition des pratiques de classification de l’Histoire Naturelle. Pour apprécier les effets de nouveauté éventuel, il est nécessaire de disposer d’une description concrète des pratiques qui sont en jeu. Les praticiennes et praticiens participant à ce workshop auront ici un rôle décisif. Quels dispositifs matériels sous-tendent les big data : appareils de mesure et de collecte de données (e.g., télédétection, séquençage haut débit), infrastructures de stockage, de classification et de partage de l’information (banques de données, internet), ou des outils d’aide à l’analyse (e.g., modèles numériques et intelligence artificielle) ? Quelle est la nature des éventuelles transformations contemporaines (quantitatives et/ou qualitatives) liées à la création de larges bases de données digitales ? Quelles continuités et ruptures avec les pratiques préexistantes ? De manière plus fine, y a-t-il continuité ou rupture dans les pratiques de collecte de données entre la seconde moitié du vingtième siècle qui voit l’essor du style modèle prédictif/données et les big data des deux dernières décennies ? Quelles transformations sont introduites dans les rapports épistémologiques entre modèles et données ?

Axe 2. Transformation des objets d’étude des sciences de l’environnement
Les changements dans la pratique de collecte de données ont-ils transformé (et comment) les objets des sciences de l’environnement ? Des travaux préliminaires invitent à s’interroger sur ce point. On sait le succès qu’a connu la métaphore comparant les écosystèmes à des machines cybernétiques en équilibre, fondant l’écologie des écosystèmes et sous-tendant le financement de larges programmes de recherche de récoltes de données et d’élaboration de modèles dans les années 1960 et 1970 (comme l’IBP) (Kwa 1987, 1993 Golley 1993). On dispose d’analyses philosophiques de l’ontologie de l’écologie des communautés et de ses modèles mathématiques (e.g. Justus 2014 ; Huneman 2014). On sait également que l’essor de sciences des changements globaux et de modèles prédictifs de ces changements a été accompagné de réflexions sur un nouvel objet d’étude pour les sciences de la Terre – le « système Terre » - (Steffen et al. 2020 ; Dutreuil 2016), et que l’écologie, prise dans ces programmes, a été incitée à modifier ses échelles d’étude pour fournir des données globales (Kwa 2005). Plus récemment, des travaux ont analysé la manière dont la « biodiversité » avait été mise en donnée (Devictor 2016). Le workshop prolongera ces réflexions : si l’essor des modèles prédictifs dans la seconde moitié du vingtième siècle a accompagné des transformations importantes de l’écologie et des sciences de la Terre, quels changements plus récents, ont été corrélatifs de l’essor des big data ?

Axe 3. Régime de production des savoirs
Dans quel régime de production des savoirs ces transformations se déploient-elles ? L’essor du style modèle prédictif/donné est lié à un agenda particulier : la prédiction du futur de l’environnement pour mieux le gérer (e.g. Coreau et al. 2009, 2010 ; Mouquet et al. 2015 ; Maris et al. 2018) – si cet idéal demeure avec les big data, comment est-il articulé avec une ambition purement descriptive, d’enregistrement, de « collecte pour la collecte », qui sous-tend certains discours des big data ? L’essor de la mise en donnée de la biodiversité a déjà été analysé comme dispositif de gouvernement de la nature (Devictor 2016). Quel paradigme d’action publique en matière de gestion de l’environnement sous-tend l’essor des Big Data en sciences de l’environnement ? Quelle place occupe les dispositifs récents de « science citoyenne » ou de « science participative » dans cette économie des sciences ? Quelle place reste-t-il pour un travail d’élaboration théorique, perçu comme devenu obsolète face à la puissance des algorithmes nourris par les big data (Maris et al. 2018) ? Quels liens entretiennent ces tendances épistémologiques avec le renforcement d’une appréhension marchande et utilitariste de la nature du côté des pouvoirs publics ? Le cas du climat a exemplairement montré que le modèle suivant lequel une bonne connaissance entrainerait une bonne action était défaillant. Quelles autres conceptions du rôle de la science en situation de crise environnementale peuvent être élaborées et quels types de pratiques scientifiques seraient alors favorisées ?

Liste des participants
Plusieurs intervenants travaillent à AMU ou y sont directement associés : Thierry Tatoni (IMBE, AMU), écologue reconnu travaillant sur les big data, et co-encadrant avec Sébastien Dutreuil (CGGG, AMU, porteur du projet) de la thèse de Léo Trocme Nadal portant précisément sur les sujets au centre du workshop (big data et écologie) ; Léo Trocme Nadal (Centre Gilles Gaston Granger, AMU) doctorant en deuxième année sur les sujets de ce workshop (cf. supra) ; le porteur du projet ; Baptiste Morizot (CGG, AMU) philosophe spécialiste du vivant, menant une réflexion d’anthropologie philosophique dont les travaux ont une réception importante en France, dans les milieux savants et auprès du grand public, apportera des contributions importantes à l’axe 2 et 3 ; Jean Pierre Llored (Centrale Casablanca ; Casablanca) philosophe des sciences prodigue, travaillent notamment sur les relations entre complexité et questions environnementales. Jean Pierre Llored est membre associé du CGGG et intégré au collectif ECOCOMPLEX que coordonnent Jean-Marc Layet, Thierry Tatoni et Pascal Taranto (directeur du CGGG), collectif auquel je participe moi-même.
Plusieurs collègues montpellierains participeront, proches géographiquement d’AMU, avec lesquels nous avons noué des liens par le passé sur d’autres projets et que nous voudrions maintenir et prolonger. Vincent Devictor (ISEM, Montpellier) écologue et récemment titulaire d’une thèse de philosophie des sciences portant sur la biodiversité, les big data et leur gouvernance, est une référence internationale sur les questions au centre du workshop. Solange Haas (CEFE, Montpellier) doctorante en philosophie de l’écologie (sous la direction de Philippe Jarne, écologue ; et Philippe Huneman, philosophe des sciences) travaille sur les rapports entre pratique de modélisation et statut des prédictions, une question importante de ce workshop. Virginie Maris (CEFE, Montpellier) philosophe de l’environnement a publié des ouvrages faisant autorité sur la philosophie de la biodiversité et les services écosystémiques ; elle apportera des réflexions précieuses aux axe 2 et 3 de ce workshop. Sonia Kéfi (Biodicée, Montpellier) écologue au centre des recherches en France portant sur l’usage des données et de techniques innovantes de modélisation pour comprendre la stabilité des écosystèmes face aux changements globaux.
Bruno strasser (Institut Confucius, Genève) historien des sciences renommé à l’international a publié récemment un des rares livres faisant autorité et référence sur les big data en biologie (Strasser, 2018). Philippe Huneman (IHPST, Paris) le philosophe de la biologie et des sciences le plus actif en France a abondamment travaillé sur plusieurs questions au centre de ce workshop comme l’ontologie de l’écologie (axe 2), le statut épistémologique des modèles (axe 1), des enjeux de politique des sciences (axe 3) et prépare un livre important sur les big data et les sociétés de profilage. David Chavalarias (ISC-PIF, Paris) dirige l’institut à la pointe des recherches en France sur les big data (l’ISC-PIF). Cecile Callou (MNHN, Paris) est directrice l’importante UMS 3468 « Bases de données sur la Biodiversité, écologie, Environnement et Sociétés (BBEES) » ; elle nous apportera un éclairage « de l’intérieur » des pratiques de big data en écologie et de ses enjeux institutionnels, scientifiques et politiques. Audrey Coreau (CAK, Paris) travaille sur les politiques publiques de gestion de la biodiversité et a publié des travaux remarqués sur le statut des prédictions en écologie ; elle apportera un regard important sur les axes 1 et 3.

Le workshop réunit scientifiques et chercheur.se.s en sciences humaines et sociales ; la totalité des participant.e.s sont habitué.e.s à ce travail interdisciplinaire ce qui constituera un avantage important pour favoriser échanges et discussions, et d’éventuelles publications issues du workshop. Le workshop comprend la participation de deux doctorants : Léo Trocme Nadal (contrat doctoral inter-ED IMBE/CGGG) et Solange Haas. Ils travaillent tous les deux directement sur les questions au centre de ce workshop et font montre d’un travail d’une excellente qualité. Nous avons veillé à observer une participation qui s’approche de la parité.

Participants :

• Virginie MARIS
• Vincent DEVICTOR
• Solange HAAS
• Philippe HUNEMAN
• Ruppert VIMAL
• Yves MEINARD
• Thierry TATONI
• Dutreuil Sébastien
• Trocme-Nadal Léo

Programme

9h-9h40 Intro + tour de table de présentation des recherches en cours
9h40-10h25 Vincent Devictor - Du rififi dans les data : la politique faible des grands nombres
10h25 - 10h50 Fabrizio Li Vigni - Modélisation et données dans les sciences computationnelles

10h50-11h10 pause

11h10-11h40 Philippe Huneman Signatures et prédiction ? Le tournant épistémique des données massives.
11h40-12h30 Discussion du texte de Philippe Huneman par Solange Haas ; perspectives et conclusions par Léo Trocme Nadal