Waiting..
Auto Scroll
Sync
Top
Bottom
Select text to annotate, Click play in YouTube to begin
00:00:06
bonjour à tous nous abordons notre quatrième séance sur les biens communs et en fait quand ça dit moi on a préparé donc ce programme
00:00:19
nous nous sommes dit qu'on ne pouvait pas parler de bien commun sans parler du bien commun des connaissances parce que les connaissances aujourd'hui sont
00:00:30
partagées plus que jamais grâce en particulier évidemment aux instruments numériques grâce aux plateformes mais grâce à l'ouverture des données et en fait on aurait pu appeler cette séance
00:00:45
est-ce que les données sont caractérise le bien commun etc on a voulu vraiment donner à cette séance l'épithète de la connaissance parce que
00:00:59
ce pose évidemment toujours à propos des progrès du numérique pas des données à propos du progrès du numérique à la fois les progrès de la connaissance et puis les progrès d'une certaine
00:01:11
méconnaissance puisque on s'est parfaitement certains n'ont pas danger mais enfin certaines interrogations que la société civile même certains scientifiques même certains scientifiques extrêmement célèbres qui
00:01:25
s'interroge là-dessus ont par rapport à toutes ces évolutions nous on est ici une maison comme sa dylanou l'a dit de la recherche donc nous nous cantenons
00:01:37
déjà c'est très important et très vaste à au respect de la connaissance et c'est pour ça que nous avons invité trois personnes qui sont à la fois des
00:01:49
chercheurs des spécialistes de la donnée et des spécialistes de la diffusion de la donnée alors je vais évidemment les présenter ce il y en a beaucoup qu'on ne
00:02:02
présente pas je vais commencer par toi en te remerciant d'être extirper de ce trajet un peu compliqué donc oui alors j'ai un problème je l'ai tutoie
00:02:15
tout ça aujourd'hui je les connais donc voilà donc je vais pas vous dire vous pour faire semblant de pas les connaître donc Emmanuel Bacri directeur de recherche au
00:02:29
CNRS et pas surtout mais aussi et directeur du directeur scientifique il me laisse jamais parler mais c'est toujours comme ça du Data Hobb c'est à dire c'est
00:02:47
Monsieur santé dans le domaine de des données numériques et vous l'avez sans doute entendu enfin lu d'une part entendu surtout au moment
00:03:00
du covid etc je suis sûr qu'il y aura des questions alors gauche Magalie et géographe elle est également Ministère de la
00:03:12
Recherche chargée des sciences sociales et aller me rendre du Haut Conseil pour le climat les spécialistes de l'adaptation d'ailleurs c'est là où nous sommes c'est dans ce domaine de l'adaptation changement climatique où
00:03:25
nous avons fait connaissance puisque elle a fait une thèse que moi j'ai lu avec une certaine avidité à cause de souvenirs non pas les miens merci de l'avoir remarqué mais
00:03:37
familiaux sur les inondations 1910 et donc en l'occurrence elle manie évidemment comme géographe beaucoup les données et puis elle nous apportera le
00:03:52
double point de vue de la géographie et de la responsable et spécialiste du climat puisque finalement aujourd'hui les données j'allais dire les données présentes qu'utilisent le
00:04:05
GIE lui donner futures en fait sont au cœur de la réflexion climatique nous avons ensuite Nicolas Berthelot alors Nicolas il est responsable aligéenne à l'Institut Géographique
00:04:19
nationale de quelque chose qui est très joli et qui est particulièrement dans notre sujet puisque ce sont les géo communs évidemment je vais l'interroger sur le sens du mot bien sûr et aussi sur
00:04:32
la transformation complète de l'établissement public et l'IGN par rapport aux données numériques alors pour introduire très rapidement je voudrais dire deux choses et peut-être
00:04:46
immédiatement que tous trois vont me dire que je dis des bêtises mais j'assume et j'interviendrai un peu comme juriste aussi les problèmes des des de l'utilisation
00:04:58
des données dans le dans le domaine de la connaissance en fait se situe en sont assez écartelés en fait entre l'Open Data c'est-à-dire
00:05:10
ouvrir les données ouvrir quelles données ouvrir toutes les données etc et la protection des données ce qui est très souvent la padage en l'occurrence
00:05:22
des scientifiques des laboratoires scientifiques des industriels qui croisent évidemment les secrets industriels etc et donc c'est cette tension qui fait d'une part tout l'intérêt du sujet et qui est aussi
00:05:35
caractéristique en fait du bouleversement qui est notre que connaît notre société dans le domaine alors ce qu'il faut bien voir c'est que il y a justement par rapport à notre sujet global du bien commun une grosse
00:05:49
interrogation parce que dans une espèce de logique simpliste ouvrir toutes les données c'est évidemment servir le bien commun et donc une fois qu'on a confirmer cela est-ce que c'est possible
00:06:04
alors ce qu'il faut voir c'est que la loi de 76 qui est une loi fondamentale en France ce qu'on appelle la loi le maire a fait vraiment pas le même
00:06:15
qu'aujourd'hui c'était une dame a fait vraiment faire un progrès absolument énorme dans tout le domaine des données puisque en fait l'ouverture des données publiques a
00:06:28
été consacrée les données privées c'est un petit peu plus compliqué mais enfin ça a été l'axe etc suivent mais là il est en charge beaucoup plus importantes la législation européenne en fait là il
00:06:42
y a vraiment des intérêts divergents mais enfin on est quand même arrivé un acte européen sur les données qui a mis tout le monde d'accord entre guillemets
00:06:54
sur le papier et en fait il y avait eu à la CNIL à la un colloque qui s'était en 2021 qui s'est appelé entre partage et protection politique pour l'ouverture des données
00:07:07
et je crois vraiment que c'est le sujet central en fait qu'il faut traiter et je dirais pour nous finalement nous aurions pu appeler notre soirée entre partage et
00:07:21
protection où est le bien commun voilà alors peut-être j'étais demandé Emmanuel de de nous faire un peu de science d'abord
00:07:32
étant donné que tu es tu es monsieur sciences dur autour de cette table en fait puisque nos deux chercheurs sont plutôt chercheurs en sciences sociales quoique
00:07:45
quand même avec le Haut Conseil pour le climat tu dois être les deux Magny et mais mais en fait ce qui est tout à fait intéressant c'est que Nicolas au départ a une formation de sociologue donc voilà alors
00:07:58
évidemment on va lui demander de la sociologie aux données donc Emmanuel je voudrais que tu nous brosses un petit peu le sujet pour nous dire qu'est-ce que c'est que les données dans
00:08:11
la société d'accord quel est cet objet non identifié pendant longtemps et très identifié aujourd'hui et surtout quel est son rôle par rapport à ce que nous
00:08:23
nous essayons d'appeler depuis janvier dernier le bien commun mais de ce qui s'appelle dans les textes l'intérêt général merci super merci beaucoup merci de m'avoir invité je suis désolé pour le
00:08:35
retard je vous prie de m'excuser pour le retard dépend de ma volonté bon là c'est un bon je vais essayer de jouer pas de répondre à ta question mais c'est pas facile mais bon je vais faire une réponse en cas de temps bon ça vous a pas échappé que il y a un enjeu autour
00:08:48
des données on en parle de plus en plus aujourd'hui alors où alors j'ai vu là pendant vivatech il y a eu une remise du rapport sur un réel moment de la filière numérique de l'État donc l'état évidemment et se mobilise aux autres ces
00:09:01
sujets là les entreprises privées font leur transition digitale aussi toutes depuis un certain temps en tout cas annonce qu'elle la font il y en a beaucoup qui l'ont qui sont loin d'avoir fini on parle de Lia partout on reviendra
00:09:14
peut-être sur les chats GPT autres qui se nourrissent évidemment avant tout de donner donc les données sont au centre la constitution de base de données de qualité et quelque chose de majeur
00:09:26
aujourd'hui aussi bien pour l'invasion économique que l'innovation sociale je pense et avec des forces enjeux d'intérêt et de biens notamment tout ce qui est optimisation
00:09:39
ou et évaluation des services publics et aussi pourquoi pas des services privés aussi ce qui serait bien alors ça c'est mon premier point deuxième point donc j'ai parlé de base de qualité alors il faut comprendre un tout petit peu qu'est-ce que ça veut dire une base de
00:09:53
qualité qu'est-ce qu'on entend par là avant toute chose peut-être la chose à mettre au premier niveau c'est de parler de base qui sont non biaisées de base non biaisée ça veut dire quoi c'est à
00:10:03
dire qu'il soit représentatif de l'étendue sur laquelle on va là on va appliquer les algorithmes ou les décisions donc c'est je vous donne l'exemple complètement idiots mais si je fais des statistiques ou si je prends des données sur le nord
00:10:19
de la France et ben elles sont pas représentatives de ce qui va se passer dans le sud de la France donc si je me base sur le les données du haut de la France pour prendre des décisions sur le sud de la France ça risque de faire quelque chose de de pas terrible et ça encore c'est c'est pas dramatique on
00:10:32
peut imaginer des situations bien bien plus dramatique que ça et il y en a eu il y en a régulièrement il faut savoir que notamment aujourd'hui
00:10:43
il y a notamment se nourrit de base de données qui sont quasi exclusivement occidentale et même quand on parle de base de occidentale je suis conscient plus du chiffre peut-être que Nicolas tulécot tu connais ce genre de chiffres
00:10:57
mais aux États-Unis je crois que c'est quatre états qu'il y a qui fournissent 90% de des données de l'IA américaine ou quelque chose comme ça donc la représentativité c'est quelque chose d'extrêmement extrêmement important si
00:11:09
on a des données qui sont biaisées les décisions qu'on va prendre sont mauvaises c'est sûr donc ça c'est vraiment un critère de qualité qui est extrêmement important le deuxième mot le deuxième un peu
00:11:21
on va dire dans la qualité des bases mais c'est l'interopérabilité alors qu'est-ce qu'on veut dire par un interopérabilité on peut faire un cours d'une heure dessus mais je vais faire très rapide je vais vous parler de deux sortes il y a une interopérabilité syntaxique en gros interpréalité ça veut
00:11:34
dire qu'on peut prendre des bases de données différentes et les faire travailler ensemble voilà en gros c'est ça que ça veut dire alors ça peut être un problème technique de dire que on a des bases de données qui sont sous des formats différents donc il y a un problème technique pour les faire
00:11:46
coexister etc mais ça c'est pas très compliqué c'est des problèmes techniques par contre vous avez une interopérabilité beaucoup plus complexe qui est l'interopérabilité sémantique qui est de est-ce que quand deux bases de données parlent d'un concept qui est
00:11:58
censé être le même concept elles en parlent de la même façon qui est loin d'être évident au début du covid vous aviez les SAMU codécovid mais la plupart des
00:12:11
amis n'avaient pas accès aux tests PCR ou très peu de ta spéciale donc il y en avait qui que des covid en disant ben moi dès que j'ai un symptôme covid je code covid il y en a qui disent non tant que je suis pas sûr que je ne veux pas que des covid quand vous avez des samues
00:12:23
qui code tous différemment le covid vous avez beau réunir toutes les bases de SAMU pour essayer de faire un suivi extrêmement précis de l'épidémie on sait très bien que c'est des bases extrêmement importantes pour le suivi d'épidémie c'est raté vous pouvez rien faire de ces passes de données là
00:12:35
d'accord donc l'interopérabilité ça c'est quelque chose qui est extrêmement important et troisième point on parle aussi d'un interopérabilité de gouvernance c'est le fait qu'elle soit facilement mobilisable donc là il y a
00:12:48
des problèmes de gouvernance et de régulation qui rentre en jeu donc ça c'est ce qu'on va appeler base de qualité mon troisième point c'est de commencer à parler de l'Open Data a priori ce sont les promesses d'une certaine façon de
00:12:59
l'Open Data c'est tous ces points là et notamment je commençais par le dernier point qui est facilement mobilisable par définition l'Open Data c'est facilement mobilisable bon donc ça on est on est content par rapport à ça
00:13:11
par contre alors quand on parle représentativité non biaisé on se dit bah en tout cas si tout est open on va pouvoir en tout cas couvrir périmètre qui est beaucoup plus large que si tout n'est pas open donc en tout cas on
00:13:24
pourra priori avoir une représentativité qui sera peut-être pas exhaustive mais en tout cas c'est large donc on peut espérer effectivement quelque chose qui est très très large mais encore une fois malgré ces ouvertures de données encore je vous
00:13:37
répète il y a essentiellement occidental aujourd'hui et même de façon très très pointue sur certaines régions de l'Occident et ça ça pose un vrai gros problème il y a beaucoup de mouvements qui militent pour
00:13:50
commencer à entraîner des algorithmes avec des données d'autres continents et notamment l'Afrique est en bonne position parce qu'il faut absolument utiliser ces données là l'interopérabilité
00:14:03
sur les promesses de l'Open Data vous avez une interopérabilité qui est importante c'est de faire de l'interoparité aussi multisectorielle qui est que il y a une chose où ça c'est pas il y a quelque chose qui est extrêmement clair maintenant pour
00:14:16
beaucoup d'experts c'est qu'il y a énormément de verticales énormément de secteurs ou ce qui va être important c'est de croiser différents secteurs donc si je vous parle santé c'est Santé Environnement Santé éducation santé travail mais on peut faire justice
00:14:28
éducation enfin vous pouvez faire toutes les combinaisons entre justice travail Sécurité Environnement Santé vous croisez dans le pays d’autres et vous croisez dans tous les sens et c'est évident qu'on trouve des points
00:14:40
d'accroche extrêmement important santé environnementale c'est un sujet qui est quasiment enfin très peu adressé aujourd'hui par manque de base de données en centre des bases de données de santé environnementale sont très très
00:14:53
peu disponibles aujourd'hui vous avez si je parle par exemple d'un exemple sur le bruit on sait que le bruit est une de d'énormément de mots sérieux et de de pathologie et ça coûte d'ailleurs il y a
00:15:07
le problème économique ça coûte énormément d'argent en santé vous avez pas vous avez des vous avez des bruits parifs vous avez une base de données sur Paris par exemple mais vous avez pas l'équivalent sur d'autres villes enfin voilà il y a énormément de choses qui
00:15:18
manquent on peut et pesticides alors on a des données alors sur la qualité de l'air il y a des il y a des données satellitaires donc là les données satellitaires mais je laisserai Nicolas en parler c'est vraiment sa spécialité mais effectivement on a des données
00:15:32
peut-être pas à la maille suffisante elle est le problème des données satellitaires c'est que vous avez Copernicus mais je parie sous son contrôle là tu me coupes si je dis des bêtises mais vous avez les données Copernicus gros smile c'est-à-dire pas
00:15:45
très précise qui sont ouverts très largement que tout le monde peut utiliser puis alors dès que vous voulez ça c'est un vrai sujet mais dès que vous voulez mobiliser des données qui sont précises même pour la recherche ça coûte une fortune voilà et ça c'est un vrai
00:15:56
problème à l'échelle mondiale ça coûte une fortune donc personne n'y va parce que c'est beaucoup trop cher elles sont pas ouvertes elle sait pas de l'Open Data justement donc c'est pour ça que je dis si on a de l'Open Data toutes ces choses là pourraient se débloquer
00:16:09
donc c'est voilà alors maintenant il y a des limites à l'Open de taille c'est mon dernier point je terminerai par ça ah oui excusez-moi j'avais noté je m'étais pris des petites notes aussi sur l'intérêt de la planète bien sûr il y a aussi une promesse de transparence
00:16:22
démocratique avec des évaluations ouvertes de partout en chacun des services publics voire privé ça c'est des enjeux qui sont évidemment extrêmement importants de pouvoir évaluer les politiques publiques
00:16:34
ou enfin une transparence par rapport à tout ce qui est politique publique donc dans les limites de l'Open Data bah la première limite et la limite essentielle à laquelle on pense évidemment c'est naturel d'y penser et de mettre des
00:16:47
garde-fous et les données personnelles alors est-ce que je fais un petit topo sur quelles sont les catégories du rgpd sur les données personnelles ou pas forcément plus audening ou rapide donc donner personnel si on suit le rgpd vous
00:17:00
avez en gros pour faire simple trois types trois catégories donc vous allez avoir du directement identifiant donc c'est quand des données contiennent votre nom date de naissance d'adresse exacte
00:17:11
numéro de sécu évidemment par exemple ça s'est donné directement identifiant mais il y en a pas un nombre incalculable c'est peut-être une série de 13 sortes différentes mais pas 13 15 pas plus dès que vous avez enlevé à des
00:17:23
données personnelles donc des données d'individus dès que vous avez enlevé cette information là où vous l'avez Bruté vous avez rajouté un bruit dessus par exemple vous gardez pas la date de naissance exacte mais vous gardez l'année de naissance comme ça vous avez quand même l'âge de la personne
00:17:37
on parle de données pseudonymisées donc ça c'est vraiment une particularité du rgpd ça n'existe pas aux États-Unis aux États-Unis quand on est dans le pseudonymisé on est dans ce qu'on appelle l'anonymiser aux États-Unis alors qu'en France pas du tout et en
00:17:49
Europe pas du tout quand même se minimiser c'est différent de l'animé vous allez voir c'est pas rien comme différence donc ce délimiser ça veut dire quoi ça veut dire que on peut pas identifier une personne en regardant
00:18:02
simplement les données par contre si vous venez avec une connaissance extérieure sur la personne que vous cherchez à identifier vous pouvez peut-être la réidentifier si je sais moi si je sais que mon voisin que je connais
00:18:13
très bien est allé aujourd'hui de la place d'Italie je sais pas où et ensuite dépassé à ce café etc si j'ai accès à des données GPS de circulation peut-être que je vais retrouver et du coup je saurais que c'est bon et du coup j'aurais accès à tout ce qu'il a fait
00:18:26
tous les jours voilà sur la santé ça j'appelle j'expliquerai ça après mais ça c'est donc des dents ça c'est des données qui sont pseudonymisées et enfin si la ré-identification n'est pas possible
00:18:38
alors on parle de données qui sont réellement anonymes et en fait il y a une sorte de flou juridique dans le rgpd alors GPD c'est très bien on a un socle commun c'est super il y aura beaucoup à redire mais on en parlera tout à l'heure
00:18:50
c'est qu'en fait il a permis de faire plein de juridictions de rajouter plein de couches de juridiction à tous les pays et tout le monde a rajouté des tonnes donc en fait on est très hétérogènes malgré un rgpd copains mais donc anonymiser en fait la frontière est assez floue parce que
00:19:03
[Musique] parce qu'en fait rigoureusement si vous voulez être anonyme et ben vous pouvez plus avoir donné l'individuel parce qu'elles sont si vous connaissez assez de choses sur une personne où vous allez pouvoir la retrouver donc en fait
00:19:15
normalement pour être anonyme rigoureusement sur la donnée personnelle elle est plus personnelle elle est agrégée vous faites des groupes de personnes de 10 15 personnes et ça ça sera de la donnée réellement anonyme voilà donc vous avez ces trois statuts là avec des
00:19:28
juridictions particulières on reparlera en santé il y a vraiment des encadrements juridiques extrêmement spéciaux et dingue ça vraiment pour comparer aux États-Unis vous avez que deux modes directement identifiants et anonymes si bien qu'il y a même des
00:19:41
bases pseudonymisées au Sancerre GPD qui sont ouvertes aux États-Unis au monde entier que le monde entier utilise mais on pourra si jamais c'était des bases qui étaient françaises ça serait totalement
00:19:53
fermé donc on est dans cette bizarre là ou en fait où la science se fait beaucoup avec des bases américaines parce que parce qu'elles sont plus ouvertes que les bacs françaises alors je dis pas que c'est mieux je suis c'est juste un état de fête là ensuite on
00:20:06
pourra parler de de ces choses là et dernier point sur les limites de l'open data je vous ai dit la qualité c'est important et là par contre quand on fait de l'Open Data vous avez a priori du tout et n'importe quoi c'est pas du tout un gage de qualité alors c'est peut-être
00:20:18
un gage de représentativité parce que on va couvrir un plus grand enfin une plus grande étendue de personne ou de lieu et ainsi de suite mais mais sur la qualité des données ça ne garantit rien et même on pourrait dire c'est presque pire
00:20:32
parce que s'il y a pas un organisme qui est là pour certifier qu'en fait ce qui a été publié ça a quand même s'il y a pas une transparence sur qu'elle a été le processus qui a fabriqué les données et qu'est-ce qui a été le processus de validation de ces données vous pouvez
00:20:45
tomber sur tout et n'importe quoi et à ce moment là si les gens s'en emparent en les utilisant comme s'ils étaient la vérité de quoi que ce soit ça peut conduire à des études totalement fausses voilà je sais pas si j'ai rempli ma mission on se rend compte de la complexité du
00:21:01
problème Nicolas on va parler de du même sujet mais par rapport à donc à l'Institut géographique
00:21:12
national moi je voudrais que tu es la gentillesse de rebondir sur deux sujets la première c'est l'hygiène pour nous tous et les cartes en fait voilà alors que deviennent les cartes avec toutes
00:21:26
les données disponibles est-ce que si on a beaucoup plu ce qu'elles sont beaucoup plus détaillées est-ce que elle bouge etc etc donc ça c'est la première chose et la
00:21:39
deuxième question c'est que du coup évidemment des conséquences sur le fonctionnement d'institution et d'établissement public ça c'est clair et en fait est-ce que
00:21:54
est-ce que ça bouleverse complètement le paysage donc une géographe en plus de la géographie est-ce qu'on a accès à une autre géographie non pas du tout que
00:22:07
évidemment les montagnes et les frontières bougent elles vont peut-être bouger mais ça c'est avec d'autres phénomènes que les données ça c'est autre chose mais je veux dire finalement qu'est-ce que c'est la nouvelle
00:22:21
géographie par rapport aux données merci merci pour l'invitation et merci pour l'introduction aussi Emmanuel parce que je pense que tu as soulevé plusieurs points très important dont je vais aussi je vais rebondir là dessus
00:22:34
donc oui voilà je viens représentant l'hygiène effectivement pendant longtemps et c'est toujours le cas on est connu pour nos cartes de randonnée et qui sont finalement en fait même le
00:22:47
cœur même de de l'activité de l'hygiène il faut le reconnaître en fait même la base de données la plus célèbre de l'hygiène s'appelle la BD Topo et sa vocation sa structure union c'était effectivement pour produire cette cette
00:23:00
carte de rando qui est bien connue donc qui nécessite de cartographie des routes des chemins des bâtiments des frontières administratives administratives et ces données étaient vraiment produite dans cette vraiment avec cette avec cette
00:23:13
ligne directrice pendant des années il se trouve que l'hygiène a été confronté à plusieurs révolutions il y en a deux majeurs c'est évidemment celle de l'Open Data dont on a déjà largement parlé
00:23:25
qui vient notamment avec scarabée Bettina sur avec la loi pour une république numérique de le maire et qui du coup qui du coup met en situation tous les établissements publics d'ouvrir
00:23:38
leurs données et il se trouve que petit établissement public qui avait vécu le New public management on était devenu une véritable entreprise quasiment commerciale à l'hygiène qui vendait ces
00:23:51
données parfois plusieurs millions d'euros des acteurs comme Google et du coup là faut se poser la question de quel modèle économique pérenne pour produire et je pense que c'est ça un des enjeux produire des données qui sont de
00:24:04
qualité et qui peuvent avoir une certaine souveraineté en fait une pertinence pour décrire le territoire français et donc face à cette cette question se pose la question de comment on arrive
00:24:16
à trouver ce modèle économique et c'est aussi comment on arrive à bâtir une relation avec nos usagers ça c'est un second problème que qui était je pense assez inattendu dans la révolution de l'Open Data c'est aussi que dans une relation de clientèle comme on pouvait
00:24:28
l'avoir avec nos usagers on avait des retours on avait des personnes qui nous soumettaient des améliorations dans la mesure où elles ne voient ils étaient critiques de la qualité des produits qu'elles achetaient et avaient un
00:24:41
rapport de clients demandeurs alors qu'aujourd'hui on se retrouve dans une situation de fournisseur gratuit de données et qui nécessite de renouer un lien et c'est là qu'on va venir ça la notion de joint commun assez vite mais
00:24:53
il y a un deuxième révolution dont je vais vous parler avant c'est le fait que l'hygiène aussi c'est longtemps comporté comme étant un acteur assez comme une sorte de petite usine qui produisait ces données depuis vraiment la source de la
00:25:07
photo aérienne qui est prise tous les trois ans de l'ensemble du territoire français et qui va le convertir patiemment avec des agents qui vont saisir à la main l'ensemble des données on voit bien avec aujourd'hui des
00:25:19
collectivités territoriales qui sont capables de parfaitement cartographier leur territoire parfois en 3D parfois avec des jumeaux numériques que d'autres acteurs comme les gafams évidemment mais même des plus petites sociétés arrivent
00:25:31
à cartographier également le territoire et enfin je pense qu'il faut aussi mentionner un acteur majeur de ces 20 dernières années dans la géographie c'est des acteurs comme open StreetMap qui sont des collectifs qui ont
00:25:43
développé l'équivalent du Wikipédia de la carte qui permettent à n'importe qui de partager des données et pendant longtemps exactement comme Wikipédia on a pu considérer que à comme n'importe quel prof on pouvait
00:25:55
dire ah non ce sourcer sur Wikipédia c'est pas bien sérieux et en fait effectivement comme pour Wikipédia OpenStreetMap s'est révélé très progressivement aussi pertinent voire parfois plus pertinent sur certains thèmes que l'hygiène donc là nouveau
00:26:08
défi on est plus tout seul à faire de la donnée comment on arrive à trouver notre place en fait parce qu'on a pas forcément de meilleur donner en plus maintenant elles sont gratuites comment fonctionne et c'est là que viennent la notion vient de la notion de géo commun
00:26:20
c'est l'idée de se dire que notre rôle en tant qu'institut public c'est d'arriver à entretenir un commun numérique de l'information géographique c'est le plus forcément d'être voilà seul producteur de la donnée et diffuse
00:26:34
seul diffuseur de la donnée c'est d'arriver à construire collectivement avec les autres établissements publics avec les collectivités avec des collectifs comme OpenStreetMap parfois même des entreprises arriver à construire la carte de la France et la
00:26:46
carte de la France évidemment ça veut pas dire seulement tracer des routes et des bâtiments c'est aussi connaître nos forêts c'est aussi connaître nos parcelles agricoles les usages de produits phytosanitaires sur le
00:26:58
territoire donc c'est énormément de thématiques qui sont liées à la notion de géographie donc c'est les géocomains donc l'enjeu c'est d'arriver à se dire on va coproduire et ça ça résout plusieurs choses ça résout évidemment la
00:27:10
question de la qualité des données parce qu'on a plusieurs on est capable de fournir une donnée de meilleure plus fraîche de la réalité plus fiable mais aussi et je pense que c'est presque un des trucs pour moi qui est on réalise
00:27:22
récemment c'est les problématiques d'interopérabilité que si tu es manuel c'est que avec cette démarche d'Open d'attache chacun commence à publier son petit jeu de données sur les diagnostics de performance énergétique d'un côté des
00:27:35
données d'entreprises d'un autre mais qui sont difficiles parfois seulement avec une adresse parfois mal renseignée et donc un des enjeux de pour moi des communs numériques c'est le fait contribuer à
00:27:48
une même base de données tous ensemble et du coup dit d'utiliser le même vocabulaire d'utiliser la même sémantique et d'être après capable de fournir une donnée vraiment de haute qualité et et
00:28:01
foisonnante donc ça c'est vraiment je pense un tout un des enjeux moi j'avais anticipé de présenter de manière opérationnelle comment on faisait ça à l'hygiène mais c'était peut-être pas exactement ta question
00:28:13
Bettina donc je sais pas donc à l'hygiène du coup pour avancer sur cette question évidemment bon ça on le réalise mais en fait pour le faire c'était pas simple donc c'est pour ça qu'en 2021 on s'est doté de cette stratégie de cette vision mais aussi
00:28:28
d'un sorte de d'organisme au sein de l'hygiène que je suis responsable qui s'appelle la fabrique des géots communs qu'a pour but de d'enclencher ces dynamiques au sein de l'Institut donc au sein de la fabrique des jeux comment on
00:28:40
essaie de jouer deux rôles qui sont très spécifiques au commun numérique parce que du coup on s'est on s'est chargé de toute la donc je recommence évidemment une déclinaison de commande numérique en fait c'est c'est vraiment directement
00:28:53
issu des travaux des leaderstruments sur la façon dont on entretient des ressources exactement comme des collectifs de pêcheurs sont vigilants à la ne pas surexploiter les recherches les ressources piscicoles de d'un lac de
00:29:07
la même manière nous on essaie de d'organiser donc le fait de produire une carte la plus précise possible en collectivement et donc on essaie de jouer un rôle très spécifique parce que on peut distinguer je vais pas rentrer
00:29:20
trop dans la théorie mais on peut distinguer un peu cinq rôles dans les commandes numériques ce qui peut être simplement de membres d'une communauté qui va être capable d'exprimer d'utiliser la ressource c'est aussi d'être capable de faire remonter
00:29:31
au collectif ces attentes on a également des personnes qui contribuent directement à la ressource soit en alimentant en données parfois en logiciel la ressource mais après il y a trois rôles qui sont parfois moins ils ont d'identifier dans les dans les
00:29:44
communes numériques c'est le rôle de d'opérateur et ça c'est l'un des rôles qu'on essaie de jouer à la fabrique des jeux communs c'est un rôle d'animateur de collectif parce que évidemment bon une communauté c'est bien il y a des gens qui ont des intérêts
00:29:56
convergents à produire une donnée cartographique de qualité mais en fait il faut être capable de l'organiser cette ce collectif il faut lui donner des pistes de travail il faut la faire se rencontrer la faire vivre
00:30:09
donc ça c'est un rôle qu'on essaie de mener à travers différents projets à la fabrique des jeux communs par exemple ce qu'on fait sur un projet intéressant je assez évocateur qui s'appelle panoramax panorama bon c'est un petit nom un peu
00:30:21
rigolo de qui vient un peu de l'univers Astérix mais là où vous allez comprendre l'intérêt c'est qu'on essaie de développer un équivalent de Google Street View donc ça c'est un outil fort aujourd'hui de la donnée géographique c'est le fait d'arriver à avoir des
00:30:34
photos géolocalisé très précise du territoire et il se trouve qu'en fait il y a déjà plein de collectivités qui actuellement déjà aujourd'hui produisent des données de cette nature qui font tourner des voitures dans leur ville ils prennent des photos pour après
00:30:48
eux dans leur service après positionner des panneaux STOP un peu sur le thème parce qu'ils savent pas où sont leurs panneau stop et donc ça c'est très intéressant mais le problème c'est que c'est pas mis en commun et pourtant enedis quand ils vont faire une
00:31:00
opération sur le réseau il serait intéressé d'avoir une photo fraîche et qui dépendent pas de Google Street View pour pour voir l'accéder parce que Google Street View sait très bien quand on est à Paris mais dès qu'on sort un peu de la zone c'est beaucoup plus
00:31:11
compliqué c'est moins frais et pourtant parfois de la collectivité bénéficie déjà d'une donnée et donc nous on s'est dit mais il y a une opportunité de travailler ensemble nous on vient à l'hygiène pour un peu mettre en place la table où chacun peut
00:31:23
déposer des photos on invente le vocabulaire qui permet de partager ces photos les métadonnées on les définit on essaie de travailler avec tout le monde pour voir comment on va encoder la date de prise de photo est-ce que c'est
00:31:35
nécessaire de mettre le nom de l'appareil photo qui a permis de prendre la photo ah oui peut-être que c'est utile est-ce qu'on accepte de stocker des photos de très basse qualité on se met d'accord tous ensemble et donc nous notre travail à l'hygiène c'est donc
00:31:49
d'être opérateur c'est pas nous qui allons voilà ça c'est vraiment pour moi une révolution aussi de la manière d'approcher le sujet c'est historiquement l'hygiène ce serait ramené avec avec sa voiture on a d'ailleurs fait ça on l'a développé même
00:32:00
une voiture dans il y a 5 ans qui permet de prendre des photos hyper précises mais en fait ça coûte des fortunes pour faire tourner cette voiture et on est incapable en tant qu'institut public de le faire et aujourd'hui on a complètement inversé la
00:32:14
logique en se disant mais en fait c'est plutôt la multitude qui va être capable de prendre des photos de qualité potentiellement pas forcément parfaite au départ mais vu que les usages vont se développer progressivement on peut attendre que les gens voyant l'intérêt
00:32:27
d'avoir des photos de très haute qualité vont développer des photos de merguer donc voilà l'exemple de panoramax c'est qu'on accompagne une équipe on l'a pour développer cette table mais à la fin c'est pas nous qui allons
00:32:39
participer exactement ça exactement c'est un peu c'est un peu sur ce modèle la différence ce qui est intéressant c'est que n'importe qui peut y contribuer aussi bien à une petite un petit bénévole dans
00:32:52
sa rue qu'une collectivité comme Strasbourg qui a une voiture hyper bien équipée qui va faire des photos plus du leader avec des lasers pour arriver à faire des photos hyper précises et on va mettre dans ce même pot commun et
00:33:05
certaines sociétés se contenteront d'utiliser des photos très basses résolutions mais on arrive à voir les panneaux STOP d'autres sélectionneront seulement les photos extrêmement précises qui seront prises position tout est ouvert exactement donc
00:33:18
ça c'est vraiment un changement de stratégie et un deuxième truc que je voulais citer c'est qu'à travers la fabrique des jeux communs on a aussi cette logique de se décentrer et ne pas se dire que tout ce qui est développé sur la géographie doit venir de nous en
00:33:30
fait et donc c'est pour ça qu'on développe un deuxième rôle dans les communes numériques qui est important c'est le rôle de sponsor le sponsor c'est un acteur qui a une certaine autorité dans un dans un domaine et qui
00:33:42
va apporter de la légitimité à ce quelque chose qui est développé par un potentiellement un acteur plus petit donc on lui attire de la crédibilité mais on peut aussi lui attirer des financements et il existe des guichets évidemment
00:33:54
dans le numérique qui permet d'encourager des développements ambitieux et notre travail donc c'est d'identifier des pépites de mais de communes numériques donc des ressources qui sont fondamentalement ouvertes et accessibles à tous usagers et d'essayer
00:34:07
de les aider et donc pour ça on est on n'est pas tout seul à le faire et ça c'est aussi un des je pense que je peux terminer par là c'est de dire que dans la sphère publique il y a pas que l'hygiène qui s'intéresse à la question des commandes numériques aujourd'hui nous on travaille directement par
00:34:20
exemple avec l'ADEME et la NCT sur un appel à commun ou là l'objectif c'est un peu de renverser la logique d'appel à projet donc là à l'ADEME c'est l'agence de
00:34:35
historiquement de la maîtrise de l'énergie mais je crois que maintenant c'est pas et d'adaptation aux transition et donc c'est l'Agence Nationale des collectivités territoriales de cohésion
00:34:52
des territoires et donc ces deux ces deux autres acteurs publics ont aussi concis en conscience que les communs numériques sont des manières de développer leur service public et donc et donc on est directement associé avec eux dans des
00:35:05
dans ce type de dispositif vous passez des conventions alors il y a plusieurs choses effectivement un des aussi un des changements majeurs c'est de se dire nous notre grand bébé qu'elle
00:35:18
a BD Topo la base de données décrivant l'ensemble de la topographie du territoire un des enjeux comme je disais c'est plus de la faire tout seul et donc on développe mais le problème c'est qu'on peut pas non plus se lancer dans
00:35:30
un modèle totalement ouvert ou n'importe quel citoyen contribuerait on se dit que nous on a plutôt une ça c'est open Street Map à la rigueur qui peut le faire et c'est très bien que ça existe et nous on peut développer un modèle plus public où on développe des
00:35:43
partenariats c'est typiquement le cas avec le département du Gard avec lequel qui était le qui était pionnier dans la matière qui peut maintenant éditer directement notre base de données de référence qui va être disponible dès le
00:35:54
lendemain même le instantanément à tous c'était totalement impossible pendant longtemps où on considérait qu'il fallait passer par des processus qualité extrêmement long pour valider une donnée et surtout on pouvait faire confiance
00:36:07
qu'à nous-mêmes pour faire une information fiable aujourd'hui on a rompu avec ça et l'objectif c'est d'arriver à ouvrir le plus largement enfin développer des conventions adaptées s'assurer que tout le monde a bien compris évidemment ce qu'on entend
00:36:19
par tel type de notion s'assurer que on produise bien des données de qualité mais effectivement de s'ouvrir à d'autres alors merci beaucoup je vais tourner vers Magali qui est
00:36:32
aussi géographe mais peut-être qu'elle va plus nous parler du climat d'adaptation changement climatique étant donné que le GIEC se fonde sur alors j'ose pas prononcer de nombre
00:36:46
sur un nombre de données tout à fait considérables pour faire ces projections etc et que de plus en plus quand on t'entend intervenir ou quand on te dit on se rend bien compte à quel point pour
00:37:00
faire de la prévention tout simplement et puis l'adaptation ou d'adaptation de la prévention enfin bon couple et entrelacés si j'ose dire on a besoin en particulier en ce qui concerne les
00:37:11
inondations etc de donner fiable alors je voudrais que tu nous parles de ça et puis ensuite je reviendrai vers vous tous pour qu'on se recentre sur la question
00:37:23
où est exactement le bien commun la poursuite de déjà commun dans toutes vos spécialités première question et la deuxième question que je vous poserai
00:37:35
c'est comment peut-on emmener les données privées dans le bien commun alors j'ai peut-être parlé pas simplement avec ma casquette de géographe et de et au conseil mais aussi avec ma casquette Ministère de la
00:37:49
Recherche alors je m'exprime pas du tout ce soir au nom du Ministère de la Recherche on est bien d'accord mais à travers l'expérience que j'ai à la tête du secteur donc sciences humaines et sociale à la DGRI donc la direction générale de la recherche et de l'innovation ou donc bon je suis à la
00:38:02
tête dans secteur qui a la charge de préfiguré la stratégie nationale ou d'alimenter la stratégie nationale de la recherche en sciences humaines et sociale la première chose et je m'appuierais sur les interventions de
00:38:14
mes de mes deux camarades de ce soir la première chose c'est qu'il n'existe pas de sciences en données à titre de chercheuse et d'experts je ne comprends même pas le débat sur le
00:38:26
militantisme supposé des chercheurs ça n'a aucun sens une parole scientifique elle s'appuie sur des données point et les chercheurs travaillent sur des données et ces
00:38:39
données qui sont exprimées dans des papiers des revues scientifiques dans des articles qui sont normalement évalués par les pères qui sont disponibles et rien n'empêche tout en chacun d'aller reprendre les
00:38:51
papiers et de vérifier si oui ou non quelque chose n'aurait pas échappé donc en fait un chercheur qui parlerait dans le vide c'est pas un chercheur et j'en parle d'autant plus pour les SHS que j'entends systématiquement les SHS
00:39:04
administrent pas la charge de la preuve bah oui parce que moi quand je fais de la recherche le matin je me lève vous dites tiens alors j'ai décidé que peut-être a déjà travaillé sur les inondations et puis je vais vous donner mon avis mon avis on en a rien à faire
00:39:16
mon boulot en SHS en sociologie en histoire en philosophie en tout ce que tu veux c'est de travailler sur des données et ces données elles doivent être accessibles parce que nous sommes
00:39:29
évalués sur la reproductibilité de la manière dont nous traitons des données ça veut dire qu'on confond et ça a été un peu le nom dit de cette première partie la donnée c'est pas uniquement du
00:39:42
chiffre la donnée n'est pas que quantitative la donnée peut être aussi qualitative et c'est un vrai sujet épistémologique qu'est-ce qu'on fait d'une donnée qualitative comment on la traite comment
00:39:53
on la recueille et on voit qu'en fait dans les données on aborde jamais la multiplicité de la donnée y compris de son support je vous donne deux exemples qu'est-ce qu'on fait
00:40:05
par exemple des sons qu'est-ce qu'on fait des images ça fait aussi partie d'un matériau de recherche à partir duquel on va pouvoir extraire de la donner il y a aujourd'hui un projet d'infrastructure de recherche européenne
00:40:22
qui s'appelle Iris qui travaille sur les sciences du patrimoine l'idée c'est d'aller récolter dans toute l'Europe à chaque fois qu'on va faire des études sur par exemple un tableau sur une peinture on va avoir des tas de données sur ce tableau sur cette
00:40:34
peinture on va les mettre en commun et le fait d'avoir des tas de tableaux plein partout des tableaux partout qu'on a étiquet ça va donner une autre histoire de la peinture parce qu'on va pouvoir voir par exemple que tel pigment utilisé à telle époque à tel endroit est
00:40:47
à mettre en relation avec tel tableau alors qui est sûrement une oeuvre mineure parce que là aussi et on va pouvoir comme ça créer des réseaux à partir effectivement d'une approche pluridisciplinaire de la donnée où vous
00:40:58
allez avoir à partir de d'analyse spectrométriques de qui sont faites par des physiciens et des chimistes avec des conservateurs de patrimoine on va pouvoir donner une autre histoire en fait de la peinture par exemple mais je pourrais vous donner le même exemple sur
00:41:12
les données en littérature aujourd'hui avec les données massives vous savez un chercheur ça peut lire maximum 23000 4000 bouquins dans sa vie enfin ça va pas lire toute la littérature et donc l'histoire de la
00:41:25
littérature c'est une histoire qui est faite aujourd'hui sur les grandes œuvres mais si on arrivait à avoir sur par exemple 10 ans tout ce qui a été publié entre 1850 et 1860 dans le monde
00:41:38
et à pouvoir ensuite traiter cette donnée récoltée et bien on aurait sans doute une autre histoire de la littérature des jeux d'influence c'est ce qu'on appelle les humanités
00:41:50
aujourd'hui numérique est-ce que vous voyez déjà dans mon propos c'est que la donnée est à la fois un objectif pour le chercheur récupérer recueillir de la donnée aller la chercher là où elle se trouve
00:42:03
mais ça suffit pas c'est aussi une méthodologie on voit bien avec les développements de l'intelligence artificielle qu'on confond plus avec les données massives enfin voilà on confond les instruments la donnée comme
00:42:15
comme matériaux la donnée comme objectif la tout ça est mélangé et on aurait besoin d'une réflexion de nouvelles réflexions collective sur cette épistémologie des
00:42:29
données dans leur nature dans leur fonction dans leur usage en fonction des disciplines et j'en reviens mon qualitatif quantitatif et puis à quoi ça sert la donner
00:42:42
parce qu'on part du principe que c'est bien commun je réponds pas à ta question mais ça sert à quoi la donner vous allez me dire ça sert à faire progresser la connaissance c'est vrai ça sert à réduire l'incertitude qu'on appelle épistémique il y a des choses qu'on ne sait pas pas parce que elles sont
00:42:55
inconnues mais simplement parce qu'on a pas les éléments pour le savoir toi parce qu'on ne connaît pas encore les données dont on a besoin soit parce qu'on n'a pas assez suffisamment et donc on va avoir un progrès continu des
00:43:06
connaissances et de la capacité à récolter des données mais pas qu'à la récolter elle est traitée aller mettre ensemble à les croiser tout ce qui a été dit à les mettre sous forme de base utilisable interopéra etc et
00:43:20
c'est par exemple qu'on voit avec le GIEC sur 30 ans et bien dans les années 90 quand le GIEC a été créé le premier rapport des experts du GIEC il y a beaucoup il y a des incertitudes en gros
00:43:31
on a de beaux suspects bien identifiés mais on peut pas encore dire qu'on est sûr à 100% puis depuis 30 ans on a Copernicus on a envoyé des trucs sous l'eau on carotte au fort etc on a aussi des modèles qui
00:43:44
permettent de traiter la donnée différemment de les calibrer différemment et bien la donner elle se démultiplie et donc on est capable par cette convergence de réduire la certitude et pistémique ce qui veut dire dans sa pose une question sur le rôle de
00:43:57
la de la donnée dans la décision parce que la deuxième fonction de la donnée en a beaucoup parlé c'est d'aider a décidé dans un régime démocratique et dans un régime surtout moderne un État moderne on ne enfin en général on décide pas le
00:44:11
matin disant tiens je vais faire ça ou ça on essaie de s'appuyer sur des données qui permettent en gros on fait du calcul coup bénéfice alors c'est voilà mais c'est de la ratio c'est la base de la rationalité économique on regarde par rapport aux données que j'ai
00:44:23
est-ce que c'est rentable alors ça peut être politiquement socialement etc éthiquement mais en gros j'essaie de décider et c'est même ce qu'on appelle le pilotage de la part la donnée c'est à dire qu'aujourd'hui les politiques
00:44:36
publiques sont beaucoup évaluées à partir d'indicateurs qui sont eux-mêmes des données qu'on peut étudier mais sachant que pour remplir des indicateurs il faut produire des données alors ça donne des situations ubuesque avec des collègues qui passent leur temps à remplir des tableaux de chiffres pour
00:44:48
savoir combien ils ont d'étudié en combien ils ont de publication ça c'est le volet bête et méchant de la donnée il n'empêche que d'avoir sur des tons longs des indicateurs bien construits avec des données pour savoir par exemple combien d'étudiants aujourd'hui soutiennent une
00:45:01
thèse au bout de combien de temps quelles sont l'évolution c'est hyper intéressant parce que ça évite de parler dans le vide et de considérer que sa propre expérience est universelle mais de se dire que peut-être moi matin je
00:45:12
l'ai fait il y a 20 ans dans un certain contexte elle est donnée que j'ai si elles sont bien récoltées si elles sont bien traitées elles me disent pas exactement la même chose donc ça sert théoriquement à décider et c'est d'ailleurs ce que fait ce que font les
00:45:25
rapports du GIEC les rapports du GIEC c'est un état des connaissances une expertise sur l'état des connaissances qui est ensuite fournie au décideur public pour qu'il puisse se décider y
00:45:37
compris d'ailleurs on a l'Empa dans le sens que donne les données parce que dans une démocratie alors c'est pas exactement ça au niveau international mais on a aussi le droit de dire que pour des raisons X ou Y ben on choisit de pas aller dans cette voie mais plutôt dans ce cas
00:45:49
ce qui veut dire d'emblée que la donnée pose d'un problème de responsabilité politique je prends l'exemple de la crise covid dans le cas d'une incertitude où j'ai pas assez de données la première question c'est évidemment est-ce que
00:46:01
je j'ai fait ce qu'il fallait auparavant pour avoir les données mais on peut imaginer que par exemple sur le covid c'était d'incertitude d'inconnu je sais pas quoi par contre quand la crise arrive une des questions qui se pose c'est est-ce que la puissance publique
00:46:14
c'est donner les moyens de récolter les données pour cesser de piloter complètement à l'aveugle et ce sujet là en matière de catastrophe et de crise il est très important parce qu'on a vu notamment à partir de samedi Sandy donc
00:46:27
il s'est ouragan en 2012 qui frappe alors il fera malheureusement grande partie de l'Amérique latine de la Caraïbe il arrive jusqu'à New York mais il arrive à New York et c'est ce qu'on a appelé la première catastrophe 2.0 parce
00:46:40
que on a eu effectivement grâce à notamment Google Maps en fait de la donnée en temps réel qui était produite par les utilisateurs par les usagers avec cartographies d'ailleurs pour dire telle
00:46:52
station-service elle va enfin aller fermer tel point d'alimentation et donc on s'est rendu compte que les réseaux sociaux et l'internet arriver à fournir des données qu'on était même pas en capacité d'avoir avec la meilleure
00:47:03
volonté du monde et ça nous a aussi permis par le traitement notamment des réseaux sociaux d'avoir de nouvelles données qui sont arrivées en sciences humaines et sociales avec d'ailleurs on en a parlé des biais énormes parce que par exemple
00:47:16
Twitter c'est très sympathique mais c'est 1% des réseaux sociaux qui étaient utilisés les autres par d'autres réseaux donc tout ça pose des questions et on se dit à ce moment-là effectivement si la donnée sert à décider
00:47:29
et bien il faut aussi se demander à quoi elle peut servir dans ces dans ces fonctions sociales et on arrive à cette question de bien commun par exemple la donnée c'est de la veille la veille
00:47:41
épidémiologique la veille en termes de ressources en eau aujourd'hui sur la question des bassines il y a juste un sujet c'est qu'on n'a pas suffisamment de pièces omettre en France pour connaître le niveau des nappes donc en fait on raisonne sur les données
00:47:54
qu'on a et c'est la réalité c'est à dire que les parce qu'il y a énormément de titres ils sont pas appareillés vous avez des tas d'endroits où aujourd'hui on a un pied de sommet ou deux pieds de mètres voire
00:48:06
des zones blanches de pièces omelettes qui posent des questions sur l'état de certaines nappes on a pas la donner historique et ça ça a des conséquences très concrètes pour les assurances vous avez par exemple en France la loi de
00:48:18
1982 qui est la loi sur le régime catna dont on entend parler à chaque fois cette loi elle fond d'un régime de solidarité nationale qui est liée au fait qu'à l'époque on n'a pas suffisamment de données au niveau des assurances pour pouvoir assurer le
00:48:31
risque inondation notamment donc on peut pas effectuer les calculs coût bénéfices et donc on a le risque n'est pas assurable en même temps en même temps maintenant qu'on les a les assurances disent qu'elles peuvent plus assurer
00:48:43
exactement parce que derrière alors mais c'est là aussi qui est intéressant c'est que par exemple il est à un moment la question de l'inondation on s'est posé la question de se dire en fait il faut le sortir du régime cadenas parce qu'on a suffisamment de données pour que ça
00:48:56
devienne assurable et là on voit bien comment la décision politique revient aussi sur la donnée pour dire attention parce que le régime 4 date a aussi d'autres vertus d'autres avantages en termes de pilotage de l'exposition etc
00:49:08
et donc on voit bien que là il y a une sorte de fétichisme aussi de la donnée en France où il suffit pas comme disait l'autre de sauter comme un cabri en criant donné pour que tout d'un coup subitement magiquement sache exactement ce qu'il faut faire
00:49:21
et ça ça pose aussi un sujet qui est en termes de de formation à la donnée pour les chercheurs c'est qu'on voit que ça va très vite au niveau des technologies des méthodes et des objets et on a
00:49:34
besoin de cette formation continue à la donner avec une différence entre utiliser les outils par exemple les systèmes d'information géographiques on vous dit ça permet de faire des cartes alors on a des données
00:49:46
géolocalisées on les rentre et ça fait une carte c'est comme si je vous expliquais que parce que vous saviez utiliser Word j'ai derrière cité ou Open Office vous saviez vous étiez en romancier vous pouviez avoir le prix Goncourt donc on a aussi
00:50:00
dans ce débat sur les données des confusions permanentes entre les instruments de traitement les finalités et ça on a besoin derrière de poser des questions toutes bêtes que je retrouve beaucoup dans les débats au conseil pour
00:50:13
le climat puisque j'en reviens à mon point de départ la décision doit être ce qu'on appelle évidemment spaced donc elle doit être appuyée sur des données je pense que la sociologie depuis qu'elle existe la sociologie des
00:50:26
sciences la philosophie des sciences des pistes tout ça démontre que la question qui l'a donnée elle est forcément biaisée dans son mode de récolte quand vous faites un questionnaire quand
00:50:38
vous faites il y a toujours alors c'est pas mal il faut simplement en être conscient pour connaître les limites de la donnée et puis il faut aussi poser la question dans certains sujets des conditions de récolte il y a tout un
00:50:50
enjeu sur l'éthique des données dont on parle en sortie mais qu'on devrait avoir au début comment est-ce que je vais récolter la parole d'individus qui ont été frappés par des catastrophes notamment par l'ouragan Irma et José
00:51:03
était mon cas quand je vais aux Antilles ils viennent de sortir d'une catastrophe j'ai besoin de ces témoignages parce que ce sont aussi des données très importantes dans les récits qui vont me permettre au delà du vent de comprendre
00:51:16
par exemple pourquoi des gens qui ont vécu Cinq Cyclones se mettent en danger alors qu'ils savent parfaitement comment il faut se protéger du cyclone ou reste pourquoi est-ce qu'ils vont rester
00:51:27
il y a tout un protocole de la donnée ce qui pose aussi la question des sciences participatives avec cette espèce de fascination et c'est vrai que c'est fascinant alors le naturaliste amateur on connaît la personne qui a mais c'est
00:51:39
l'individu capteur c'est aussi l'individu capteur avec tout ce que ça peut comporter quand par exemple on va mettre des puces sur vos poubelles pour vérifier si oui ou non vous consommez X ou Y déchet si je peux
00:51:52
savoir combien pèse votre poubelle je sais exactement ce qui se passe chez vous et si je peux regarder le contenu de vos poubelles c'est encore mieux que Amazon parce que là je sais si vous avez des couches que vous avez un bébé je
00:52:05
sais ce que vous mangez je sais je sais tout vous pouvez plus cacher personne dans la cave ça se voit dans votre poubelle donc si vous voulez cette donnée là et je conclure quelqu'un dans la salle que je ne vais pas identifier qui se souvient il y a
00:52:19
quand même une bonne trentaine d'années que des journalistes avaient été au bas de l'habitation de Brice Lalonde et au bas de l'habitation d'Antoine Wechter
00:52:30
pour regarder les différentes produits qu'ils utilisaient et voilà ils en avaient tiré des habitudes écologiques des deux comment font les archéologues après tout c'est du poubellion je suis
00:52:43
désolé mais c'est ça et donc pour conclure l'idée c'est que derrière tout ça on a une question de formation on a aussi une réflexion à avoir sur la stratégie quelle est notre stratégie en matière de
00:52:56
données où on ne confond pas la fin et les moyens où on ne confond pas ce qui relève de la science de l'expertise et de la décision politique ce qui en plus à l'avantage de ne pas mettre les chercheurs dans une situation un peu compliquée y compris quand ils sont des
00:53:10
lanceurs d'alerte et alors aujourd'hui on a effectivement dans la stratégie nationale française de la recherche qu'on appelle des infrastructures de recherche françaises et européennes en SHS par exemple on a projet d'eau qui
00:53:23
est une infrastructure de recherche qui cherche à mettre à disposition des données avec ce mot ce rôle public de la de l'anonymisation et surtout de la sodomisation des données parce que nous
00:53:35
avons un gisement de données publiques absolument incroyable un seul exemple la géographie électorale on a tout ça avec les bureaux de vote c'est public alors évidemment ça pose plein de
00:53:47
questions on en revient à la géographie parce que par exemple aujourd'hui on parle d'interopérabilité des données mais on a des sujets très concrets comment est-ce que je mesure du carbone on a d'abord des problèmes de mailles territoriale est-ce que je le mesure à
00:53:59
l'échelle de l'iris à l'échelle du département de la commune voilà et puis là aussi ça dépend à ce qu'on demande à la donnée est-ce que je prends l'émission territoriale ce que on aimait au niveau de la France est-ce que je prends la prendre carbone ce qu'on
00:54:12
importe est-ce que je prends les émissions cumulées ce que je prends les émissions percapitales que je prends là aussi en fait la donnée on peut lui faire dire à peu près ce qu'on veut et la manière de le définir qui est déjà un
00:54:24
geste politique fait que derrière si vous prenez l'empreinte territoriale on l'a fait sur le Haut Conseil pour le climat vous prenez les régions en termes d'émission sachant qu'il y a des régions où il y a pas ces données quand même il y a une époque où il y avait pas tous les régions qui avaient ces données
00:54:37
maintenant les ont vous prenez l'empreinte car si vous prenez la mission territoriale les Hauts-de-France et la Normandie sont les plus émettrices forcément c'est les régions de l'agriculture et si vous prenez l'empreinte bizarrement
00:54:52
c'est plus du tout le même jeu et donc vous voyez bien que derrière cette question de l'accès aux données il est important parce que derrière on a un problème en s'achève majeur c'est justement la reprise des données
00:55:06
c'est à dire qu'en fait le paradoxe de cet Open Data c'est qu'aujourd'hui comme c'est public il y a des gens qui les prennent et c'est un peu comme vous avez avec des cartes vous publiez des cartes alors d'abord vous publiez pas les
00:55:18
cartes vous avez des données que vous rentrez dans un logiciel ensuite il faut faire l'édition de la carte parce que si vous avez la sortie brute ça vous donne rien vous avez des cartes il suffit de changer quelques quelques trucs sur la carte elle est à vous
00:55:31
vous citer open stripmap ou machin c'est terminé et vous la vendez imaginez maintenant sur des données de santé des données économiques ce qu'on pourrait en faire pour les mutuelles pour les assureurs
00:55:44
qui à l'inverse si tu permets Magali si je peux interrompre une minute on va faire illustrer les données de santé par voilà et on reviendra vers vous sur le sujet vraiment de bien commun à
00:55:58
la fin mais peut-être comme tu as prononcé le mot magique de santé j'ai senti voilà j'ai senti mon ami frémir voilà ma droite et est-ce que tu peux illustrer ce point de vue parce que je
00:56:09
crois que sur justement le côté donné ouverte et REP privatisation d'une part et puis je veux dire danger transparence et tout on a comment dire
00:56:23
un très gros sujet en France il y a tellement de choses à dire là je sais plus me recommencer je voudrais rebondir c'est tellement de choses qui ont été dites juste sur le dernier point quand même il faut faire attention santé on manipule on change de données de santé on les
00:56:37
revend il faut faire attention en Europe on n'a pas le droit vous savez qui est propriétaire de vous donner une santé non c'est pas la sécurité sociale c'est pas nous c'est pas vous vous êtes propriétaire de donner de santé non il y
00:56:52
a pas de propriété des données de santé voilà ça c'est important en Europe il n'y a pas de propriété de santé c'est un attribut de votre personne donc personne ne peut les vendre vos données de santé contrairement aux États-Unis ou vous pouvez les vendre tu peux vendre ton
00:57:03
accès à tes données de santé mais tu peux pas vendre tes données donc ça c'est important quand même ça c'est une règle facile c'est quelque chose qui nous différencie énormément des États-Unis et deuxième chose il y a quand même une régulation européenne qui
00:57:16
interdit les assureurs d'avoir accès à des données de santé ou vous avez refusé de donner l'axe par défaut a priori ils ont accès à aucune donnée de santé sauf les données de santé auxquelles vous avez vous donner accès de façon claire donc ça c'est on est quand même très très
00:57:29
encadré et si quand il y a des CHU qui sont effectivement piratés et que toute leur toutes les données sont il y en a 40 par an qui sont à peu près piratés un des CHU avec toutes les données qui sont vidées
00:57:41
tout le système d'information qui s'arrête donc ça veut dire des morts et les données en fait c'est quoi le pirate qu'est-ce qu'il cherche il prend ces données là essentiellement il va sur le Darknet il vend mais c'est pas les assureurs français ou européens qui vont
00:57:53
acheter les données sur le Darknet ça vous pouvez être sûr que c'est pas de ça dont on parle maintenant ça veut pas dire que c'est moins grave ou quoi que ce soit mais enfin il faut pas il y a une chose qui est très importante je pense je suis désolé je dis les choses
00:58:05
un peu dans tout différentes je saute un peu du coca là c'est de la même façon que vous avez dit il y a c'est pas la donnée etc il y a je pense c'est très compliqué de s'y
00:58:18
retrouver dans toutes c'est dans toutes ces notions là et c'est extrêmement important que les gens s'y retrouvent parce que sinon c'est la porte ouverte à tous les fantasmes voilà et ça c'est pour moi ça c'est la pire des choses en
00:58:30
fait aujourd'hui ce qui se passe en IA ce qui se passe sur les données c'est que il y a tellement de prophètes de Lia qui vont vous racontent ce qu'on va être capable de faire plus tard et on vous quelque chose qu'on fait aujourd'hui et
00:58:42
on voit chat GPT que en fait dans la tête de tout le monde et c'est normal on mélange tout et du coup tout devient possible tout est vrai tout est actuel tout est déjà voilà et ça c'est la pire des choses je pense que c'est très
00:58:55
important de comprendre en IA par exemple ce qu'on est capable de faire aujourd'hui avec les données qu'on n'est pas capable de faire si on prend vos données de santé qu'est-ce qu'on est capable de faire avec quelqu'un de mal intentionné qu'est-ce qui pourrait faire avec qu'est-ce qu'on
00:59:07
ne peut pas faire avec c'est des choses il faut parler de ça il faut parler de ces risques là et aller jusqu'au bout du risque ça c'est très important pour vraiment et ensuite et pas faire une éducation du citoyen orientée c'est à
00:59:20
dire qu'on explique simplement et ensuite il y aura des citoyens qui auront peur en disant non moi attention je veux pas partager ou moi si je veux partager ces histoires de partage par rapport au citoyen c'est évidemment essentiel pour les données de santé parce que c'est vous qui donnez qui
00:59:31
acceptez de partager ou pas et je pense qu'il faut surtout pas pousser les citoyens à partager enfin je veux dire c'est voilà c'est c'est chacun est libre mais c'est la pire chose la pire des situations pour moi aujourd'hui c'est
00:59:44
que les choix sont tous sauf éclairés donc je pense alors si j'étais provocateur je dirais c'est peut-être la pire des choses c'est de mettre les données de santé aux mains des citoyens en fait de ses propres parce qu'en fait quand vous il y a des gens qui les ouvrent pour les mauvaises raisons il y en a plein qui les ouvrent pour les
00:59:56
enfants il y en a plein qui les ferment pour des mauvaises raisons et ça c'est pour ça que je pense que l'éducation mais pas éducation technique qu'est-ce que c'est qu'il y a etc mais voilà juste de comprendre l'écosystème de comprendre
01:00:07
les enjeux économiques voilà ça c'est des choses qui sont absolument fondamentales alors sur la santé plus particulièrement il y a un bien commun dont on peut parler qui est le snds quand même que le système national des
01:00:19
années de santé donc c'est cette grosse base nationale qui est assez unique au monde alors je parle peut-être pas de la Chine ou de ça va payer asiatique mais en tout cas il y a pas d'équivalent américain c'est quoi c'est la base donc de la
01:00:33
carte vitale et puis il y a aussi une base de parcours hospitalier et puis des causes médicales de décès alors en France je pense que ça vous a pas plein de gens contre qui ont qui ont
01:01:30
brandir des anciennes catastrophes on va centraliser des données mon dieu c'est terrible pour le pour la cyberattaque on va les enfin c'est voilà et dans la tête des gens ça peut aller très loin moi je fais vous êtes pas sans savon pour poser
01:01:43
des questions là-dessus il y a des problèmes de souveraineté je pense que vous n'êtes pas sans savoir que le abat des histoires avec Microsoft on pourra en parler en large tant que vous voulez posez-moi toutes les questions à la fin je me fais même plaisir d'y répondre parce que je pense qu'il faut il faut
01:01:55
savoir ce qui se passe mais dans mes conférences souvent je m'amuse au jeu en disant ok vous avez peur donc Microsoft qu'est-ce que quel est le scénario catastrophe c'est très important d'aller jusqu'au bout pour comprendre quel est
01:02:06
le risque réel et là je vous la fais un petit peu courte mais donc on discute avec les gens en temps réel c'est une catastrophe il y a une guerre États-Unis France ils prennent toutes les données du snds parce qu'elles sont web sur Microsoft et qu'on n'a pas le temps de débrancher la machine ils prennent et à
01:02:20
la fin du fin je dis ok qu'est-ce qu'on risque moi j'ai des risques dans tatie amère il y en a des risques je dis pas qu'il y en a pas du tout mais ça m'intéressait d'avoir ce qu'il y avait que les gens avaient j'étais dans un hôpital avec des poires de l'hôpital il y a un paysage qu'il avait un qui me dit
01:02:32
le risque c'est que les Américains prennent les données du snds et fabriquent des armes bactériologiques qui ciblent les Français on est dans du pur délire des données de remboursement ça il faut déconstruire c'est
01:02:46
extrêmement important alors oui ensuite il y a des fois où alors vous aviez dit Magali est-ce que la puissance politique c'est donner les moyens de récupérer de se donne les moyens de récupérer les données c'est important expérience covid il y a eu
01:02:59
deux choses qui se sont passées il y a eu je sais pas si vous avez entendu parler de 6 lettres il y a tous en tes couilles tous anti-couilles vous en avez tous entendu parler ça a été un énorme fiasco en France ça ils ont le gouvernement a préparé ça je peux vous
01:03:11
dire moi j'étais assisté aux discussions c'était attention on va diffuser des informations il y a un plan de communication extrêmement sophistiqué qui a totalement échoué ça a été une catastrophe on était en retard par rapport à tout le monde en plus parce qu'on a été les seuls ou presque les
01:03:24
seuls à ne pas vouloir utiliser les API donc les les petites briques logicielles de Google ou de Apple ce qui nous a fait prendre énormément de retard parce qu'on voulait être indépendante totalement bon ça c'est encore une autre histoire donc
01:03:37
ça ça a été un gros raté il y a eu un il y a eu un succès sidap c'est les tests les tests PCR ou tout quoi que vous en vouliez ou quoi que ce soit vous alliez pas le choix mais tous les si vous faisiez tester ou
01:03:50
si vous faites tester covid ça remonte automatiquement à la CNAM et vous allez quelqu'un de la CNAM qui va vous appeler en disant alors à l'époque c'était confinement enfin vous donner et puis qui vous disait est-ce que vous êtes d'accord pour nous partager les noms des
01:04:03
gens avec qui les numéros de téléphone des gens que vous avez côtoyé en aucune façon vous aviez automatiquement tous vos contacts qui remontaient ça ça c'est complètement faux et ça aussi on voit
01:04:15
des scientifiques des paysph extrêmement savants qui connaissent tout qui racontent des histoires fausses par rapport à ça c'est terrible la parole scientifique elle est en crise en ce moment on n'arrête pas de le dire mais ça c'est terrible en fait les réseaux sociaux font énormément de mal ou les
01:04:28
scientifiques extrêmement sérieux là je parle pas des farfelus de qu'on connaît tous je parle de gens sérieux qui écrivent des articles hyper sérieux scientifiques qui vérifie tout ce qu'ils font dans les articles parfaitement mais alors quand c'est sur les réseaux
01:04:40
sociaux c'est freestyle complètement c'est à dire qu'on vérifie plus rien on relaie et puis quand on dit mais tu sais que tu t'es trompé là ah ouais bon ok c'est pas grave bon donc là c'est alors c'était particulier ce site Web
01:04:52
qui était effectivement pris on peut être contre on peut penser que c'est pas c'est pas raisonnable le snds on peut dire que en échange du remboursement c'est voilà on est tous on a tous la sécu peut-être que ça peut aussi
01:05:03
bénéficier au bien au bien c'est un bien commun du coup cette base qui peut être utilisé on a parlé des biais de sélection quand on récolte les données donc vous avez alors aux États-Unis vous avez on a
01:05:17
parlé un petit peu de ouragans qui passent on recueil des des informations ou alors les gens qui vont pousser des informations faut faire attention ça vous l'avez dit mais je le répète c'est extrêmement biaisé il y a
01:05:30
un grand sujet aujourd'hui au niveau européen sur la santé qui est alors il y a un espace européen de santé qui est en train de se créer avec des régulations sur les données santé qui
01:05:42
vont enfin en tout cas homogénéiser les accès la gouvernance des données de santé en Europe parce que malgré rgpd c'est totalement hétérogène les accès en Finlande en France en Norvège sont
01:05:55
totalement différents c'est pas du tout ça marche pas du tout de même façon là ça va homogénéiser il y a une question essentielle c'est ce qu'on va faire les mots techniques c'est ce qu'on va faire du Optim ou est-ce qu'on va faire du
01:06:07
Hope ça veut dire est-ce que par défaut vos données de santé vont être incluses dans les dans les dans les bases et vous aurez le droit de dire je veux pas où est-ce que par défaut elles ne seront
01:06:19
pas inclus et vous aurez le droit de dire je veux être inclus donc ça c'est le hop in et l'autre c'est le hoptout si on est dans du Hopkins la recherche médicale c'est mort ça s'arrête c'est à dire que on sait
01:06:33
très bien que les démarches citoyennes actives de dire je veux que mes données soient utilisées c'est excessivement biaisé on va avoir une population absolument pas représentative donc ça il
01:06:44
y a une bataille à l'échelle européenne forte de pas mal d'acteurs de dire surtout il faut pas aller sur du hopting il faut prendre du hoptout c'est vraiment très important et dans le Uptown je pourrais continuer des heures
01:06:56
c'est des questions précises mais je dis un peu des choses un peu en vrac mais c'est intéressant aussi de voir que dans l'optout malgré toutes les peurs etc les out c'est assez rare en fait
01:07:11
ouais bien sûr donc par exemple sur le snds vous avez le droit vous pouvez écrire au Web au dépôt du hub et vous pouvez dire je ne veux pas que mes données pardon excusez-moi je suis désolé c'est une
01:07:25
assez si vous voulez de vous retirez d'une base par mais il n'y a pas de terme français je suis désolé je fassis quelqu'un connaît le terme français avec plaisir pour l'écrire mais on parlera souveraineté aussi c'est
01:07:40
important et ce genre de choses retrait volontaire ou option positive ou négative ou option d'entre une option d'entrée ou une option de sortie voilà option d'entrée
01:07:53
option de sortie dans la base est-ce que ça dit tu voulais tu voulais intervenir parce que tu es beaucoup plus compétent que moi surtout ces sujets donc merci Bettina c'était pour essayer de recentrer un peu le débat sur les
01:08:07
communs puisque l'information un caractère intéressant c'est un bien non rival c'est à dire qu'il est pas détruit par l'usage donc je vous donne une information vous la prenez mais je peux toujours l'utiliser quelqu'un d'autre aussi donc on peut se dire c'est
01:08:20
merveilleux parce que il y a pas de tragédie des communs la tragédie des communs c'est justement que l'usage détruit le l'objet l'objet commun alors ce qui est arrivé c'est que
01:08:32
ça ça fait longtemps que l'information est comme ça mais comme vous le savez la révolution numérique a fait que on peut maintenant traiter l'information avec des machines et que du coup on peut les traiter à grande échelle et ce qui s'est
01:08:46
passé c'est que comme là évidemment on a des bonnes technologies puis que c'est un bien au rival c'est un coût marginal de production nulle c'est-à-dire que on peut maintenant produire de l'information en très grande quantité la diffuser et en fait ça coûte rien au
01:09:00
niveau marginal enfin ce qui coûte c'est de la récupérer puis de faire un traitement intelligent la diffusion coûte pas cher et donc la révolution numérique est arrivée en même temps qu'un processus de managérialisation que
01:09:12
vous connaissez bien qui produit aussi beaucoup de données et puis de marchandisation parce que avec la saturation des marchés les gens ont commencé à vouloir marchandiser et tout y compris l'information qui était abondante et donc il s'est créé un
01:09:24
énorme business de traitement des données ce qui fait que j'ai l'impression qu'on a complètement perdu de vue la question qui a posé Magalie ça à quoi ça sert les données et ce qui est
01:09:36
important c'est que on se focalise sur l'information comme si c'était une matière mais c'est pas une matière d'information l'information c'est quelque chose d'indexical et c'est quelque chose qui parle d'objet du monde réel et donc ce
01:09:50
qui compte c'est pas l'information c'est ce à quoi ça fait référence et je pense que c'est de ça qu'il faut qu'on commence à parler à travers les business models moi j'étais fasciné en écoutant en particulier
01:10:03
voilà parce qu'il nous a dit bon ben moi j'ai un commun et je suis en train de chercher un business model c'est à dire que on est en train d'essayer de faire de la transformation du système mais il faut quand même que ça existe encore dans le système actuel donc il faut un
01:10:16
business model ce qui aberrant on est bien d'accord mais mais donc il essaye de se débrouiller pour créer un mode de fonctionnement qui est à la fois compatible avec ce que ce qu'on fait dans le système d'économie de marché au
01:10:30
courant et puisque ça devrait être permis par l'information par la prétraitement de l'information qui est un truc épatant on a un bien non rival on peut faire de du crowd sourcing c'est comme on fait ce truc là et donc tu nous
01:10:43
as dit je suis opérateur ça c'est nouveau donc je suis un animateur de collectif et je suis aussi un sponsor je pense que tu es aussi un contrôle de qualité que il y a tout un tas de nouvelles choses qui sont liées à des
01:10:56
modèles différents qui sont en train d'émerger là dans le domaine de l'information mais on est bien en train de traiter autre chose que l'information on est en train de traiter de manière dont les gens utilisent des lieux par exemple dans le cas des Systèmes
01:11:08
d'Informations Géographiques et même plus que ça et donc ça pose la question de c'est quoi les modèles de gestion maintenant qu'on a de la numérisation c'est quoi les modèles de gestion pas de l'information c'est quoi les modèles de gestion des choses qui comptent
01:11:21
c'est-à-dire ce à quoi l'information fait référence alors je suis fasciné de voir que ce que tu es en train de fabriquer c'est un système dans lequel tu fais finalement un système distribué
01:11:32
de production et d'utilisation qui a un système non hiérarchique en fait c'est de la gestion de subsidiarité qui a dans ce commun là donc on a des modèles de gestion d'une certaine manière démocratique je sais pas si c'est
01:11:45
démocratique moi ce que j'aimerais entendre c'est vous vous travaillez sur des nouveaux modèles comme ça qui sont des modèles dans lesquels à travers l'information vous traitez d'autres choses vous traitez de la santé vous
01:11:56
traitez de l'usage des lieux vous traitez de la manière dont on transforme un système alors quels sont les modèles d'organisation pour ces nouvelles formes de production
01:12:09
et de gestion de ce qui nous sert à vivre voilà moi j'aimerais vous entendre là dessus on va faire on va faire on va te donner la parole pardon
01:12:20
Nicolas Emmanuel et puis on laissera pour cette première honte Magali un peu au nom du médecin de la recherche conclure merci beaucoup je rebondis tout de suite du coup sur ce terme de business model
01:12:34
que j'utilisais c'est celui de l'Institut public qui avait pour vocation produire ce référentiel cartographique française et il se trouve que je pense qu'un des grands mâles qui a pu faire l'Open Data et sa démarche
01:12:46
on a on comprend bien énormément de vertus dans la distribution et le fait que typiquement l'information comme ça a été rappelé est un bien original et qu'il a plus de valeur à être partagé en revanche tout le problème et je pense
01:12:58
que dans la recherche vous le savez bien produire une information de qualité ça en revanche ça coûte et produire l'information suppose une forme en tout cas de travail qui généralement associé
01:13:11
à une rémunération quelle qu'elle soit donc que ça soit que cette rémunération faites aux agents publics chargés de la production de l'information ou à d'autres acteurs qui seraient en charge
01:13:23
de la production des données il faut pas partir d'un d'une vision naïve qui est surtout en plus dangereuse je pense d'automne notamment en plus de notre stratégie typiquement actuel où on essaie de renverser la logique de se dire comme vous comme je vous l'ai
01:13:35
expliqué de d'être les seuls producteurs de l'information et d'autres acteurs sont pertinents pour la faire néanmoins et je pense que il faut vraiment qu'on travaille là-dessus c'est d'arriver aussi à justifier vis-à-vis des
01:13:47
décideurs qui ne qui pense le comprennent moins maintenant que cette la production de cette information coûtait très cher et continue de coûter très cher et aujourd'hui nous on est typiquement à l'hygiène on a aujourd'hui
01:14:00
cette cette boussole qui nous guide qui guide la production de nos données aujourd'hui c'est la cartographie de l'anthropocène c'est cartographier le changement du territoire et donc dans ce travail là on se donne de nouveaux outils notamment de technologie laser
01:14:13
qui permettent de capter par mètre carré 10 points en trois dimensions permettant de savoir notamment aujourd'hui qu'est-ce qu'il y a dans nos forêts de savoir de mieux comprendre les réserves de biodiversité
01:14:25
mais normalement de choses aujourd'hui cette mission là elle suppose du financement et du coup une action d'acteurs publics en vue de l'entretien de ce commun ça je pense que c'est un point important je vais pas faire plus
01:14:37
long parce que je pense que il y aura peut-être d'autres questions Emmanuel le business model en santé en France le modèle d'affaires en santé en France absolument alors je vais pas répondre en disant
01:14:58
c'est ça c'est évident qu'on n'y est pas par contre c'est la France est assez particulier puisque comme je disais il y a l'assurance maladie ça veut dire qu'en fait tous nos soins une grosse partie des soins de toute la plupart des gens qui habitent en France sont remboursés
01:15:11
par le par le par l'ensemble de nos charges sociales nous imposons qu'on paye tous donc la contribution de tout un chacun donc ça veut dire qu'en fait il y a un coût qui est déjà enfin il y a quand même un coup de la collecte qui est déjà pris en
01:15:24
charge par le par l'État par la bien par le la population l'ensemble et amorti oui absolument donc ça c'est quand même une particularité donc il y a une partie du coup en tout cas qui est pris en
01:15:38
charge et c'est notamment en ce nom là que le snds a été partagé juste une petite parenthèse que j'ai oublié de dire tout à l'heure par rapport aux usages puisque vous parliez justement de c'est important de parler
01:15:51
des usages et pas de la donner j'aurais dû quand même du poème j'ai parlé du snbs parler de quelques usages du snds dont vous avez tous entendu parler le Médiator c'est sur le Médiator qu'on voit sans aucun c'est sur le SNS qu'on
01:16:04
voit sur aucun doute que le Médiator augmente les risques de décès s'il y a juste pas de doute c'est en regardant le snds c'est malheureusement en regardant le CDS un peu trop tard parce qu'on sait c'est une machine à mettre en route pour
01:16:16
faire remonter les données un niveau national mais cinq sept mois après c'est en regardant le snds qu'on balaye l'hydroxycle requin pour qu'un quelconque est fait sur le coup sur le covid ça c'est juste vous le balayez tout de suite il y a aucun doute il y a
01:16:29
aucun scientifique qui remettra en question après une étude faite sur le SDS et c'est aussi sur la snds qui a été faite la plus grosse étude en donnée de vie réelle donc évidemment spaced sur l'efficacité du vaccin covid en
01:16:41
montrant que c'est 9 fois ça diminue le risque par 9 d'un covid grave sur 25 millions de personnes de plus de 50 ans c'est la plus grosse étude en France sur des navires donc dans Ça c'est sur les les utilisations j'avais oublié quand
01:16:55
même d'en parler mais pour vous donner un petit peu les enjeux qui sont extrêmement extrêmement important la plaque du covid ce serait passé totalement différemment si on avait réussi à récupérer des données il y a l'échelle mondiale de façon un petit peu
01:17:06
plus rapide pour continuer donc donc ce business model en France c'est assez particulier parce qu'on a cette particularité là et donc il y a en tout cas une idée qui serait de dire oui mais il y a un surcoût quand
01:17:20
même ensuite de fabriquer ok on récolte les données pour les soins mais ensuite pour l'utilisation pour la recherche d'intérêt public ou pour l'intérêt général il va falloir quand même faire encore un travail de mise en qualité des
01:17:32
données donc à minima ce qu'on voudrait c'est que le business model couvre ce travail là c'est ce que tu sembles dire un petit peu c'est ce que vous cherchez à faire à l'hygiène de façon donc ce travail de mise en qualité mais ça
01:17:45
devrait pas étant donné qu'à la plupart des données de santé sont produits essentiellement en France par les institutions publiques ça on devrait pas faire de marge par rapport à ça ça commence ça c'est discuter c'est des
01:17:56
choses qui sont qui sont discutées au niveau de la France au niveau européen c'est des discussions qui ont lieu actuellement je vous dis il y a je vous incite à aller voir le texte de
01:18:08
régulation le draft le brouillon de régulation qui est sorti en mai dernier sur la nouvelle législation qui va être votée normalement d'ici la fin de l'année sur les données de santé à l'échelle européenne donc ça va uniformiser totalement tous les pays
01:18:21
d'Europe et évidemment se pose la question de ce fameux business model et évidemment ils l'ont pas résolu dans le brouillon parce que c'est un sujet majeur c'est un fusée
01:18:33
extrêmement compliqué la valorisation financière de ces bases est un sujet extrêmement complexe à adresser mais est inscrit des grands principes dans ce brouillon alors est-ce que ça va rester ou pas parce que c'est en discussion
01:18:46
dans les grands principes c'est justement le coût qui est demandé par le producteur de données ne devrait pas dépasser le coût qui est de plats production des données il devrait pas y avoir de d'acteurs qui font de la de
01:18:58
l'argent là dessus qui fabrique de l'argent là dessus donc ça c'est vraiment quelque chose qui est extrêmement important mais aujourd'hui sur les données de santé donc c'est c'est pas que c'est extrêmement
01:19:09
important c'est que c'est au-delà d'important parce que c'est rare c'est rare alors non mais pour vous donner aussi des peut-être des expériences vécues moi j'étais mandaté
01:19:21
par Edouard Philippe pendant la première vague pour faire une tasse force d'Atta contre contre le covid donc les données donc je sais pas moi qui opérer quoi que ce soit mais je cherchais à faciliter l'accès aux données de santé pour les projets de recherche qui était important
01:19:34
tout de suite et puis éventuellement inciter des chercheurs à travailler sur des choses où j'avais l'impression qu'il y avait des trous dans la raquette je suis désolé de le dire aussi clairement mais je suis le dit droit
01:19:45
dans les bottes les bases de données de santé françaises ne se sont jamais autant fermés que pendant le coït elles n'ont jamais été aussi peu partagées que pendant le covid
01:19:58
les boîtes privées beaucoup d'institutions publiques beaucoup de producteurs de données ont juste fermé le partage radicalement pourquoi pour des problèmes de valorisation
01:20:11
donc valorisation financière parce qu'on a envie de mes valorisations scientifiques on veut être les premiers à publier et valorisation scientifique en France alors je vais me faire une de faire une petite un petit pic à
01:20:26
ministère de la recherche mais enfin non ou c'est oui je sais plus qui c'est qui fait les points cigares c'est qui qui est en charge de ça donc en fait en France malheureusement la valorisation scientifique est très liée à la valorisation financière vous avez un système qui s'appelle les points
01:20:44
sigables qui est que quand vous publiez un article et que vous êtes bien article dans une revue de rang A donc particulièrement au niveau et que vous êtes le dernier auteur qui est la place de choix dans la revue votre institution
01:20:57
va recevoir des financements en fonction de ce nombre de publications nombre de places où est-ce que vous êtes en fonction des rangs ce qui fait une courte à la publication ce qui il y a des biais mais alors monumentaux la PHP
01:21:10
sera organisée en groupe hospitalier pour pouvoir parce que quand vous êtes dans le même institution ça marche pas vous pouvez pas cumuler plusieurs points cigares s'il y a plusieurs personnes donc il faut diviser les institutions maximum pour maximiser le nombre et les hôpitaux sont très très bons là dessus
01:21:24
puis vous avez les techniques qui sont poussées par des gens qui ont fait la une des journaux pendant le covid qui est de je publie plein de papiers dans des rues dans des revues de rang très
01:21:35
très bas dont je suis éditeur comme ça ça passe et je récolte plein de frics donc ça c'est des techniques aussi très développées et très classique donc c'est valorisations là ont bloqué un nombre de projets en
01:21:47
France alors pas qu'en France il y a des sujets mondial il faut pas croire que on a quelque chose de vraiment spécifique français mais je vous parle de l'expérience française c'est été dingue mais vraiment dingue les institutions
01:22:00
arrivaient à faire des choses elles-mêmes mais dès qu'il s'agissait de faire les choses nationales ou cross institution c'était niet mais vraiment je vous dis les mêmes des chercheurs il
01:22:13
y a des chercheurs qui ont fermé les données qui produisent en disant non je sais qu'on sait bien qu'on est que trois ou quatre donc on va pas produire autant que si on était 30 sur des données qui sont hyper importantes mais d'abord on
01:22:25
fait notre publication et ensuite on verra si vous êtes sûr oui vous êtes sûr et au moment de partir mais il y a par contre Emmanuel si tu connais des Big Pharma qui veulent qu'on fasse de la prestation pour eux tu hésites pas à nous les envoyer donc
01:22:37
c'est des sujets qui sont au cœur de tout ça et qui sont très loin d'être résolus et très loin elle est bien commun avec ce qu'a dit ça dit on était là on
01:22:59
était retourné dans le chaudron bien commun avec ce que dit manuel on vient dans les trajecté alors essaie de nous réconcilier alors d'abord un SHS non on nous paye pas pour
01:23:11
mais c'est très intéressant ce qui a été dit alors quand je parlais des données de santé en fait je suis désolé je parlais et c'est intéressant dans les dans les idiots parce que je parlais en tant que SHS c'est-à-dire je ne parlais pas des données de santé santé mais je
01:23:24
peux aller justement de ces données dans lesquelles les données de santé sont encastrées c'est-à-dire les données sociales et ça c'est extrêmement important vous avez par exemple aujourd'hui au niveau européen une grande enquête qui s'appelle cher
01:23:35
c'est une enquête qui porte sur ce sont des des enquêtes des questions qu'on va poser aux Européens comme les font les enfin vous avez le baromètre ipso ou je sais pas quoi bah là c'est pareil et ça
01:23:48
permet d'avoir des informations au niveau de l'Europe pays par pays qui vont permettre de savoir les conditions de vie des gens et ça effectivement c'est très important parce que par exemple vous allez comprendre que et bien les je sais pas
01:24:01
le donne un exemple qui est fictif le diabète est corrélé on va pouvoir établir des corrélations donc on a les indications sur le diabète et puis on va se dire ah mais oui mais par exemple les femmes qui vivent dans telles conditions
01:24:14
dans tel type de logement avec tant d'enfants etc bah tiens ça on l'avait pas vu donc ça va permettre en fait de comprendre non pas forcément la cause mais des facteurs de causalité et c'est très
01:24:27
important derrière on en revient intercroiser ces données et j'en arrive à mes histoires de bien commun et de modèles économiques parce que là aussi ben ça se paye ces enquêtes et ce qui est magnifique c'est que pour faire ces
01:24:39
enquêtes là vous imaginez bien que c'est pas les chercheurs qui les font on les délègue à des instituts de sondage et donc nous payons chaque pays va contribuer pour qu'on ait ces données là c'est totalement abus quand parce que
01:24:52
mais parce qu'évidemment ce sont des quantités il faut aller dans tous les pays européens récoltés remonter traitées et alors ça c'est important derrière parce que jusqu'à présent ces données d'enquêtes d'un projet dont notamment
01:25:04
dans ces infrastructures elles sont mises à disposition des chercheurs encore faut-il que les chercheurs et connaissances de l'existence de ces enquêtes ce qui est pas forcément évident parce que là aussi ça bouge ça évolue mais ces données vous l'avez très
01:25:15
bien dit ça coûte cher c'est à dire qu'aujourd'hui quand vous êtes en chercheur que vous allez faire un programme de recherche vous allez poser par exemple un dossier à l'Agence nationale de la recherche pour racheter des données pour pouvoir travailler vous avez besoin
01:25:28
de données sur lesquelles il faut acheter voire vous avez des données qui ne sont pas accessibles je vous donne deux exemples la base des notaires pour un géographe la base des notaires c'est exceptionnel parce que vous avez les
01:25:39
véritables données foncières en le foncier quand vous faites de l'aménagement ou de l'adaptation c'est le nerf de la guerre vous pouvez raconter ce que vous voulez tant que le foncier en France n'est pas propriété de l'État vous pouvez implanter un clan
01:25:52
sans devoir racheter enfin donc dans ces données foncières elles sont fondamentales il faut des années de négociation quand je dis des années c'est vraiment pour avoir accès à la base de données des Notaires c'est la même chose sur les assureurs les données
01:26:04
de sinistralité alors même que c'est la Caisse Centrale de Réassurance en France qui s'occupe du régime cadenas qui est un institut pas c'est très compliqué de les avoir or ça c'est ultra important parce que derrière avec
01:26:17
les véritables données de sinistralité vous avez une vision très précise non pas des risques mais de la réalité de l'exposition et de la vulnérabilité à intentée et par exemple
01:26:29
vous pouvez avoir des évolutions sur l'habitabilité du territoire fondamentale donc en fait les chercheurs doivent payer pour faire de la recherche la réalité c'est ça tel que vos impôts financent à travers l'Agence nationale de la recherche et les budgets que
01:26:42
chaque année on donne à l'agence et qu'on redistribue à des chercheurs pour payer leur vous imaginez quand vous êtes un jeune chercheur quand vous êtes en doctorat par exemple certaines données sont extrêmement compliquées à avoir et puis le deuxième point c'est que
01:26:54
au-delà de ça c'est en fait quand je parlais de stratégie c'est il faut avoir aussi une anticipation au niveau national pour savoir de quels sont les données dont on va avoir besoin je vous
01:27:06
donne un exemple à aussi concret l'ADEME l'ADEME à un baromètre extraordinaire sur les représentations des Français vis-à-vis du changement climatique de l'environnement etc ces données elles sont nationales on aurait besoin de les avoir à des mailles
01:27:19
régionales voire locale voire urbaines ces données là on pourrait se dire mais aujourd'hui par exemple moi je veux faire une politique publique sur l'adaptation je suis incapable à l'heure actuelle de vous dire quels sont les représentations européennes sur des
01:27:32
coords de plusieurs années sur ces questions d'adaptation quelle est par exemple votre appétence au changement n’entend par toutes les Français sont pas présents pas envie toutes les études ponctuelles qu'on fait et dans les pays qui se sont dotés de ces instruments là
01:27:45
et bien ces pays sont capables de vous dire qu'en fait les gens dans leur très grande majorité ont envie de changer à condition de ils sont prêts au changement à condition que ce changement soit équitable bien partagé qui est des alternatives etc ce qui est une boussole
01:27:58
incroyable pour la politique publique mais ça veut dire qu'on a mont on doit réfléchir à 1 de quelle donnée on va avoir besoin pour cette politique publique à 10-15 ans par rapport aux mesures qu'on va
01:28:10
voir il faut des coortes longues de comment on va les récolter qui va le faire ou et là on en arrive à la question du français c'est que quand vous arrivez sur des données de perception de représentation les mots sont extrêmement importants je vous
01:28:23
donne un seul exemple sobriété pour le rapport du GIEC sobriété c'est suffisent ça ne veut pas dire en anglais la même chose qu'en français et parfois quand je vais avec mes
01:28:35
collègues de l'ENF qui parle latin je leur dis la tempérance des Grecs tout de suite ils comprennent la tempérance des Grecs quand vous allez faire des enquêtes chez quoi les gens ils
01:28:47
comprennent pas non plus quoi vous voyez derrière que la manière dont vous allez nommer les choses elle est déjà un bi et quand vous allez faire des enquêtes il faut aussi être capable quand vous êtes sur plusieurs pays européens entre le Danois et le
01:29:00
Finlandais extrêmement important d'avoir des chercheurs de plein de pays mais sauf que quand vous êtes en SHS mais c'est pas facile parce que les shhs pour des raisons là aussi structurelles et parce qu'il y a pas forcément les
01:29:12
mêmes structurations qu'on a sur les secteurs de la santé sur le secteur de l'énergie sont pas forcément incapacité de faire sur 27 pays c'est grandes ces grandes organisations alors ça pose
01:29:25
la question effectivement du bien commun qu'est-ce que c'est un bien commun sur lequel même ceux qui sont supposés le fabriquer peuvent pas faire il y a une question qu'on n'a pas abordé c'est qu'on a beaucoup parlé de numérique et le numérique c'est aussi une vulnérabilité de la donnée
01:29:38
comment est-ce qu'on conservera pour les générations futures la donnée sur des serveurs numériques si demain il y a une panne si demain qu'est-ce qui se passe c'est génial
01:29:49
Wikipédia mais Wikipédia moi j'ai vu avec mes enfants ils savent pas utiliser l'encyclopédie d'ailleurs il y a plus d'encyclopédie demain Internet est coupé qu'est-ce que vous faites est-ce que vous savez chercher dans une bibliothèque
01:30:03
non oui nos enfants passent déjà un dictionnaire c'est un truc un peu exotique aujourd'hui parce que on a tout sur place et donc ça pose la question de la patrimonialisation de la donnée et de la
01:30:16
conservation qui sont aujourd'hui des questions qui sont vraiment très très investis dans notamment les bibliothèques dans les archives dans les dans les formations d'archivistes mais ça veut dire aussi derrière qu'on a des
01:30:29
sujets par exemple sur les témoignages oraux qu'on a des sujets sur c'est bien beau d'avoir des témoignages heureux sur toute l'Europe ce qu'on a aujourd'hui on est capable de recueillir la parole des Européens c'est une base exceptionnelle
01:30:40
vous imaginez dans 20 30 ans nos enfants pourront avoir les témoignages de gens si vous n'avez pas les métadonnées nécessaires cette question de la métadonnée ce qui permet de référencer
01:30:53
de chercher qu'on a fait historiquement dans les bibliothèques on a fait dans les archivages dans les comment est-ce que vous faites et on le voit par exemple en mathématiques ou en mathématiques les notations varient vous pouvez avoir la
01:31:05
même équation elle est pas écrite de la même façon selon les pays parce que dans un cas vous allez mettre des lettres Grecs dans l'autre cas vous voyez tous ces problèmes là que ça pose ça veut dire qu'en fait on a aussi besoin d'aujourd'hui d'une recherche sur la donnée pour qu'elle soit vraiment bien
01:31:17
commun parce que le principe dans bien commun c'est qu'il se transmet et donc la donnée comme patrimoine c'est un sujet sur lequel on devrait collectivement réfléchir pour savoir ce qu'on garde et ce qu'on jette et ça m'amène à un mot que tu as dit je crois
01:31:29
là-dessus qui est l'intérêt général l'intérêt général est un terme qui n'existe pas dans certaines langues c'est une notion bien française et l'intérêt général et pas le bien commun parce que dans le bien il y a l'idée de
01:31:41
bien et le bien il peut être marchant il peut être une valeur il peut ça fait aussi partie du bien quelle est la différence entre intérêt général et bien commun dans le cadre des données dans le cadre d'un cadre de
01:31:54
pensée d'un schéma de pensée français qui n'est certes pas le seul mais qui fait que cette compréhension du bien commun est aussi tentée par le positif et le négatif de l'intérêt général qui n'est pas la somme des intérêts
01:32:07
particuliers il y a une réponse dans la Déclaration des droits de l'homme et du citoyen qui contrairement à ce qu'on croit n'a jamais employé le mot intérêt général mais employer le mot beaucoup plus parlant d'utilité commune
01:32:21
merci à vous trois je on va passer aux questions si j'ai bien compris pour que les données soient vraiment
01:32:34
digne d'une utopie de bien commun il faut qu'il y ait des métadonnées voilà c'est ça un peu bon ça j'avais pas quoi jusqu'à vous j'y avais pas pensé mais c'est formidable parce que c'est justement
01:32:47
fait pour que ça allait c'est pour ça l'école voilà merci beaucoup je suis sûr qu'il y a beaucoup de questions personnellement je ne suis pas choqué parler à terminologie anglaise surtout
01:33:20
dans le domaine de l'informatique et je pense que les Anglais par exemple ne sont pas choqués par le mot frenchiesing qui vient de la langue française par contre le fait que qui opère le fait que l'outil qui opère avec les données
01:33:32
françaises françaises dans la santé en France s'appelle hard dayhab ce sont un peu plus étonnant mais bon ma question c'est justement sur le sujet
01:33:45
que vous avez déjà mentionné monsieur Bacri le fait d'avoir confié ces données sensibles à la société de Redmond est-ce que c'est quelque chose déjà qui a été basé sur les critères de performance ou
01:33:59
de je ne sais pas être dans quel dans quel champ de connaissance ça a été ça a été pris comme décision et deuxième question on a parlé des outils Open Source et
01:34:11
d'autant que je sache les outils Microsoft sont quand même dans l'écosystème fermé et donc son prénom très propriétaire est-ce que vous en tant que chercheur vous êtes
01:34:24
gêné par cet aspect là merci alors je vous remercie de m'avoir posé la question j'avais fait des appels du pied pour qu'on me pose et ça bon ce n'était pas de toute façon il y a pas besoin de beaucoup d'appel de pire en général pour avoir la question mais quand même je
01:34:36
voulais m'assurer de la voir bon sur la plateforme donnée de santé à l'étape je veux pas bon moi ça me dérangerait pas qu'on s'appelle le plateforme de données de santé c'est un choix parce que on a une mission d'animation de l'écosystème à l'international donc c'est vrai qu'on a
01:34:48
une plus grande aujourd'hui on travaille on est leader en Europe c'est nous qui dirigeons le consortium qui met en place l'espace européen de notre santé pour la recherche d'intérêt public c'est le F2 qui qui du consortium avec l'Agence
01:35:00
européenne du médicament huit pays huit plateformes nationales etc on travaille avec le Japon avec le Québec avec Israël voilà donc bon on doit avoir une visibilité à l'extérieur peut-être que ça aurait été plus compliqué avec un plateforme de la santé bon enfin bon c'est anecdotique pour moi un petit peu
01:35:14
sur Microsoft c'est moins anecdotique bien sûr déjà pour les conséquences que ça a eu de pour nous dans notre dans notre dans notre difficulté à opérer alors pourquoi est-ce que Microsoft a
01:35:25
été choisi il y a deux spéciales deux choses dont on a besoin à nous il y a une chose où on n'a même pas le choix c'est l'État qui nous a imposé des consignes de sécurité
01:35:38
ultra élevées on est on n'est pas pour ceux qui connaissent on n'est pas juste hébergeur de donner de santé ça c'est un premier critère de sécurité on est ce qu'on appelle référentiel de sécurité snds donc c'est largement au dessus d'un
01:35:52
point de vue sécurité donc dans des on a des exigences de sécurité qui sont extrêmement élevés et aujourd'hui vous avez aucun clouder souverain ou français qui soit snds référentiel de sécurité snds et il y a
01:36:05
il y a en fait azur Microsoft a fait les démarches pour Paulette enfin je vais reparler d'exactement de qu'est-ce qui s'est passé avec Microsoft là déjà sur le choix c'est qu'en tout cas il y a trois ans il y en avait pas aujourd'hui il y en a toujours pas bon de clouder
01:36:18
français ensuite il y a une chose dont on a besoin ça c'est pas une c'est pas quelque chose qu'on nous impose mais c'est pour pouvoir fonctionner c'est qu'aujourd'hui on accompagne à peu près une centaine de projets il doit y en avoir 70 qui vont arriver ou qui sont
01:36:31
sur notre plateforme c'est des projets en y a beaucoup donc ça veut dire je sais pas moi 20 000 images IRM avec des calculateurs qu'il faut déployer dès que c'est demandé et
01:36:46
donc ça ça s'appelle avoir des services Cloud c'est ça qu'on appelle la Brasserie des services manager c'est pas juste le mot cloud c'est des services manager cloud ça veut dire que quand le la personne qui porte projet a besoin
01:36:59
de plus de temps de calcul c'est immédiat quasiment et on lui vend du calcul sur des machines virtuelles stérilisaient pas sur combien de machines il est forcément il sait pas très bien mais simplement il dit je veux acheter trois heures de temps de calcul
01:37:10
de tel type de machine et puis de tel type de machine et en lui vend ça quand vous avez pas de Service Manager cloud ça veut dire qu'en fait ce que vous achetez c'est directement la machine vous louez une machine et ça c'est catastrophique parce que les coûts les
01:37:24
personnes ne travaillent comme ça sur le Cloud c'est pas ça qu'on appelle un Cloud bon donc on a besoin et on a besoin de pouvoir déployer des grosses puissances de calcul rapidement donc ça c'est notre deux exigences si j'ai déjà je reviens trois ans en
01:37:35
arrière on a trois ans et demi trois ans et demi il y a eu un audit KTV c'est pas le hub qui a choisi d'aller sur Microsoft mais il y a un autre qui a été fait il y avait absolument mais absolument aucune solution souveraine il y en a toujours pas aujourd'hui qu'on
01:37:47
soit très clair il y a aucune solution aujourd'hui en France qui satisfait ces deux exigences là maintenant oui pardon très rapide ok je fais beaucoup plus rapide pardon hop juste pour comprendre par rapport ce qu'on a
01:38:02
construit avec Microsoft du coup tous les services de sécurité sont en dehors de Microsoft Microsoft c'est les machines on utilise aucun logiciel azur ou quand le chercheur vient sur son univers sur la machine azur il ne
01:38:15
retrouve aucun pas de framework azur les tout tout est tout est soit Open Source d'accord soit essentiellement développer par à l'extérieur par des startups françaises ou des entreprises
01:38:29
français qui ont développé la seule chose que c'est que Microsoft a fait en étant record 9 mois c'est qu'ils ont mis en place des services qui discutent avec nos services de sécurité toutes les données sont en cryptées c'est nous qui
01:38:40
avons les clés de cryptage voilà ça les machines sont en France ça c'est pour l'histoire de clarinate mais on va pas rentrer là-dedans voilà aujourd'hui vous avez une certification qui s'appelle c'est je terminerai là-dessus vous avez une certification qui a été lancée il y
01:38:54
a un an je crois un peu plus qui s'appelle sec new cloud il y a des clouders il y a trois clouders aujourd'hui français qui sont secs in cloud donc dans cette nimklad vous avez sec vous avez cloud il faut juste savoir faut appeler un chat un chat je suis
01:39:05
vraiment désolé mais il faut savoir que les salles à la classification sec nucloud en terme de sécurité c'est 30% de ce dont nous avons besoin de ce qu'on nous impose comme sécurité je vous rappelle qu'il y a quand même 40 CHU qui
01:39:18
sont à peu près piraté par an et l'AP-HP il y a eu des fuites de données monstrueuses je veux dire on parle de ça quand même et dans cette même classe il y a le mot cloud dans la certification sec d'une cloud il y a aucun Service
01:39:30
Manager cloud rien voilà donc nous on œuvre on est prêt à changer on n'est pas on n'est pas pied Mali avec Microsoft on peut arrêter le contrat dès demain donc dès qu'il y a un acteur français
01:39:44
souverain on l'appellera comme on veut qui est capable de dire nous on peut faire on migre ça prendra un an deux ans mais on commence à puis désolé je suis désolé c'est important de comprendre ça voilà ensuite
01:39:57
vous pensez ce que vous voulez évoquer un domaine qui est certainement très secondaire par rapport à tout ce que vous avez évoqué mais finalement qui amène à poser à raisonner complètement à l'inverse de tout ça quoi c'est à dire
01:40:19
vous avez évoqué la littérature en passant moi je me dis alors admettons qu'on mette en base de données toutes les romans d'une année par exemple et ça va donner quoi comme
01:40:31
connaissance de la littérature puisque 90% de ces romans seront oubliés dans 5 ans ou dans 10 ans et du coup un historien de la littérature ne peut absolument pas utiliser une big data ça va complètement
01:40:43
par contre un historien sociologue etc là ce sera pour lui ce sera très intéressant et pas complètement alors vous avez tout à fait raison sur le premier point vous pouvez mettre autant de données dans une machine que vous voulez il en sort rien il n'y a pas de
01:40:57
magie c'est pas je mets par contre on se rend les travaux qui commencent à être mené sur la génétique des textes montre en fait qu'on a des influences alors c'est pas sur une année qu'il faut le faire et qu'on va avoir des alors c'est
01:41:11
pas non plus le moins influence on est d'accord c'est ça qui est enfin là aussi mais qu'on a en gros des des une histoire qui qui bouge un peu dans les transferts les transmissions les intersexualités et qui justement ensuite
01:41:24
avec la collaboration d'historien de sociologue va de l'époque vont montrer par exemple que des oeuvres qui étaient majeures ou mineures ont pu avoir tel ou tel impact donc c'est exactement ce que vous dites c'est à dire qu'en soit
01:41:37
l'outil c'est simplement une façon de faire évoluer les méthodologies c'est un peu comme la révolution de l'IA quand on parle de révolution de liens en mathématiques ou quoi les chercheurs
01:41:48
bondissent en disant parce qu'en fait ça simplement forcé à travailler différemment en amenant de nouvelles hypothèses qui ensuite vont être infirmées ou confirmées donc en soi le
01:42:00
Big Data c'est une technique comme la base de données ça peut être juste une ça nous donne rien en revanche ça fait poser des questions différemment et surtout ça demande de travailler en interdisciplinaire et ça fait émerger de
01:42:14
nouvelles hypothèses qui ensuite donnent de nouveaux programmes c'est simplement pour faire regarder autrement la science et quand on parle de tournant numérique quand on parle de enfin tous les fameux tournants le tournant global il y a des on tourne enfin en sciences humaines et
01:42:26
sociale on passe notre temps à tourner dans tous les sens pour dans spatial tout ce que vous voulez c'est en fait simplement des manières de réinterroger de poser autrement des hypothèses des fois on redécouvre on enfonce des portes et puis des fois on se rend compte
01:42:39
effectivement que dans de la littérature dit mineur dans des romans de gars où j'en sais rien qu'on va pas regarder on va pouvoir faire émerger des phrasés des des adjectifs de la langue des images
01:42:51
etc qu'on voyait pas forcément pas que pas que justement parce que là aussi puis ça dépend des époques ça dépend ça va dépendre aussi de la des données qu'on a parce qu'on peut pas tout
01:43:08
donc tout ça et ce qui est intéressant derrière c'est d'aller regarder justement les hypothèses au départ la manière qu'on sait construire et de confronter ces bases et par rapport à la documentation qui a c'est vraiment un champ qui est en train de décoller dans
01:43:22
les humanités dans tout ce qui est aujourd'hui littérature génétique des textes mais aussi musicologie histoire oui mais alors ça veut plus rien dire si tu veux parce qu'on va avoir des linguistes on va avoir des
01:43:35
disciplines en fait l'histoire du texte ou de la histoire des armes et au sens très large parce que derrière on a de la linguistique on a plein de choses oui donc merci pour vos interventions on a vu que que les données c'était une
01:43:52
fenêtre ouverte sur la complexité du monde et que pour moi il y a peut-être un problème ou un biais puisqu'on parlait de biais à plaquer données connaissance bien commun je pense qu'il
01:44:05
y a beaucoup plus de données que de censé être bien commun et que effectivement les données pour moi l'importance des données aujourd'hui c'est un support de coopération et ce support de coopération peut servir à un tas de choses
01:44:18
peut faire peut effectivement à aborder des communs ouverts et des communs fermés parce que je pense qu'il faut faire sa différence entre comme un ouvert et comme un fermier sinon on met tout à plat et on avance pas c'est pas
01:44:31
assez vite avec les problèmes posés de business model qui sont complètement pertinents parce que si on produit les données c'est soit on paye le public paye des gens pour le faire s'appelle des chercheurs et c'est bien
01:44:43
soit il y a d'autres d'autres gens qui qui travaillent donc moi je me dis que est-ce qu'il faudrait pas travailler pour venir bien commun à cette approche de coopération comme un ouvert comme infirmé qui peuvent contribuer à la
01:44:56
définition progressive de ce qui est le bien commun je me permets de prendre la réponse mince en disant ça je perds mais si comment ouvrir comment fermer moi ce que
01:45:08
je retiens c'est la question qui a traversé un peu nos échanges c'est la question des usages des données et en fait leur réalité après sur le territoire et enfin tu leur réalité sur ce qu'on va faire ce qu'on va en faire
01:45:20
moi je pense que ce qui est important c'est de de considérer l'approche commun mise en bien commun de ces données comme étant un nouvel nouvel élément dans notre boîte à outils pour résoudre des
01:45:33
problèmes et pas en faire un objectif en soi et à vrai dire c'est un problème que moi j'ai très vite rencontré dans la mission qu'on me confiait c'était de me dire bon on va faire des géos communs des communs numériques à l'hy parce que
01:45:44
c'est parce que c'est un peu cool et parce qu'on a envie de valoriser cette manière de faire je pense que effectivement il y a une intuition qui est bonne qu'on ne l'avait peu conscientisé évidemment c'est un sujet qui est essentiel sur la question des données
01:45:57
étant donné que leur utilisation ne fait pas perdre de valeur à la connaît à la connaissance et à l'information donc c'est évident en revanche le faire comme étant une règle obligatoire je pense que c'est un énorme problème et du coup
01:46:10
c'est pour ça que à la fabrique des jeux communs on a vraiment mis ce préfixe de fabrique leur enjeu c'est d'arriver à répondre des problèmes de nous en l'occurrence en tant qu'institut public à des problèmes de politique publique donc là typiquement moi dans les
01:46:22
nouveaux sujets que je vais accompagner dans les prochaines semaines c'est tout de suite des problématiques d'irrigation cartographies des onirrigués pour être aider les préfets à prendre des décisions éclairées sur où est-ce qu'on arrête quand il y a de la sécheresse et
01:46:34
donc voilà pour moi la fin il faut replacer l'église obligé du bruitage et à la fin c'est l'utilisation des données qui est qui est principale je crois que vraiment la conclusion a été
01:46:51
donnée je remercie chaleureusement Francis jutan d'avoir souligné à quel point le titre de notre séance était inadéquate puisque il parlait à la fois de
01:47:03
connaissance de donner et de bien commun et il vous a dit que vraiment c'était pas du tout ce qu'il fallait faire et ça je le reconnais bien là mais en tout cas trêve de plaisanterie merci vraiment
01:47:16
beaucoup à toutes trois je vous rappelle que notre dernière séance conclusive qui comprend donc quatre invités et sûrement d'ailleurs un autre
01:47:29
se passe très vite maintenant puisque on avait regroupé un petit peu ses séances c'est-à-dire en fait le 28 c'est-à-dire mercredi prochain
01:47:41
c'est bien ça c'est mercredi 28 je vous rappelle aussi que contrairement aux autres elle commence à 16 heures parce que nous avons plus de personnes
01:47:54
et nous ferons une conclusion générale de de ceci quand vous expliquant un petit peu ce qu'on va en faire avant d'ouvrir le cycle suivant voilà merci beaucoup et bonne soirée
01:48:08
[Applaudissements]
End of transcript