Archives de catégorie : Big Data

Quand le faux se mêle au vrai pour traiter les données

J’ai publié ce matin dans le quotidien Les Échos une enquête sur les outils développés pour permettre aux chercheurs d’accéder plus facilement aux données des administrations. Pour l’instant, les feuilles de soin de la Sécurité sociale, les déclarations de revenus, les résultats scolaires, les choix d’orientations, qui contiennent des informations personnelles et sensibles, ne sont accessibles – heureusement – qu’après avoir montré patte blanche. Une des pistes explorées est de réaliser, à partir des fichiers originaux et grâce à l’intelligence artificielle, de vrais-faux jeux de données ne contenant plus d’informations confidentielles.

https://bit.ly/fauxvrai

Demain, un cloud souverain européen ?

Plusieurs initiatives, françaises ou européennes, poussent à la création d’un cloud souverain européen capable de protéger les données industrielles sensibles.

J’ai publié mardi dans le quotidien Les Échos une enquête sur la volonté d’un nombre croissant d’acteurs économiques et politiques européens de disposer d’une offre de clouds souverains, conférant aux entreprises et administrations du Vieux Contient 1) autonomie face aux volontés hégémoniques des hébergeurs américains ou chinois et 2) protection contre les réquisitions juridiques des États-Unis : http://bit.ly/cloudsouv 

Nos données peuvent-elles servir l’intérêt général ?

J’ai publié hier dans le quotidien Les Échos, une enquête sur  les « données au service du bien commun ».

L’intérêt de la communauté scientifique et du monde des affaires pour la conduite de politiques publiques (santé, transports…) à partir de données collectées par des entreprises privées ne cesse de grandir. Ces derniers mois, les tribunes signées par des chercheurs et vantant les mérites potentiels des « Data for Public Good » ou des « données au service du bien commun » se sont multipliées en France et à l’étranger.

Ces spécialistes pensent que les données collectées par le secteur privé permettront de prédire les épidémies de grippe (malgré l’échec de Google Flu Trends), les pandémies alimentées par les moustiques, les taux d’occupation des lits dans les hôpitaux, les besoins en eau des bergers et de leurs troupeaux, les crises financières (à partir des fluctuations des dépôts bancaires), les perspectives économiques (grâce à la consommation d’électricité), etc.

Pour lire la suite de cet article :

Lesechos.fr >  Idées > Sciences & Prospectives

Saviez-vous que vos remboursements de Sécurité Sociale pouvaient aider la recherche médicale ?

J’ai publié ce matin dans le quotidien Les Échos une enquête sur les données de santé et les recherches médicales menées avec des algorithmes d’Intelligence Artificielle …

Vous connaissez le Sniiram ? Sans doute pas, mais lui vous connaît ! Le Système national d’information inter-régimes de l’Assurance-maladie est en effet une gigantesque base de données qui collecte tous les remboursements de la Sécurité sociale. Il couvre 99 % de la population française et comprend 20 milliards de lignes de prestations ! Rassurez-vous, votre nom n’y figure pas ; il a été remplacé par un pseudonyme……

Vous pouvez lire la suite de cet article ( « Les données de santé, la mère des batailles  »,  « Cryptage et tatouage pour protéger les données de santé », « La France dispose d’un fichier de données de santé unique au monde ») ainsi que le reste du dossier spécial consacré par Les Échos à l’intelligence artificielle et à la santé sur https://www.lesechos.fr/intelligence-artificielle/dossiers/IA-sante-hopital-medecine-infirmier-radiologie-CHU-informatique-AI/

L’Intelligence Artificielle, qu’est-ce que c’est ?

Voici le petit mot introductif que j’ai fait vendredi dernier, 20 janvier 2017, à Agoranov, un incubateur parisien, où avait lieu, en présence d’Axelle Lemaire, secrétaire d’État chargée du Numérique et de l’Innovation, et de Thierry Mandon, secrétaire d’État chargé de l’Enseignement supérieur et de la Recherche, le lancement de #FranceIA, la stratégie nationale en intelligence artificielle.

Cette vidéo est extraite de : http://www.economie.gouv.fr/strategie-intelligence-artificielle-France-IA :

Comment le Big Data va bousculer le crédit

CaptureLesEchos2016-03-18J’ai publié ce matin dans le quotidien Les Echos un article sur une nouvelle tendance qui arrive des Etats-Unis et d’Asie : utiliser les données publiques, les réseaux sociaux et les algorithmes prédictifs pour évaluer, en quelques minutes, les capacités de remboursement des individus ou des petites entreprises.

Pour évaluer le risque que représente un emprunteur, des start-up, (Affirm, Biz2credit, Zest Finance aux Etats-Unis…) et en Asie (Lenddo aux Philippines…).scannent des centaines de « signaux faibles » : temps passé à taper son adresse e-mail (pour détecter les copier-coller, souvent symptomatiques d’une adresse créée pour la circonstance…), horaire de la demande (les formulaires remplis la nuit suscitent la méfiance…), identité sur les réseaux sociaux, descriptif du travail sur Linkedin, nombre d’amis sur Facebook, heures et fréquence d’envoi des courriels…

Pour en savoir plus :

Comment le Big Data va bousculer le crédit

Uber en sait-il plus sur nous que Facebook ? Ou une autre raison d’apprendre à nos enfants à respecter la vie privée.

L’entreprise spécialisée dans les véhicules avec chauffeur se vante de savoir qui a eu une aventure d’un soir.

Les anglo-saxons appellent cela le « walk of shame », « la marche de la honte », le trajet qui sépare son appartement de celui de son partenaire d’une nuit : quelqu’un rentre chez lui/elle, mal rasé ou sans maquillage, tôt le matin après avoir passé une partie de la nuit chez un/une partenaire rencontré(e) dans un bar, une soirée… Bradley Voytek préfère, lui,  parler de « ride of glory » (trajet de la gloire).
Portrait de Bradley Voytek sur son site http://darb.ketyov.com/

Le plus troublant, c’est que Bradley Voytek est data evangelist (il promeut l’analyse des données) pour Uber, l’application qui permet de commander une voiture avec chauffeur. Et que Bradley Voytek se vante de pouvoir utiliser les données collectées par les ordinateurs de cette entreprise pour savoir qui a eu une aventure d’un soir… Sur le blog qu’il tient pour Uber, Bradley Voytek s’est livré à une longue analyse des « rides of glory » dans six villes américaines, démontrant leur augmentation en fin de semaine (le samedi matin et le dimanche matin) et, dans l’année, par exemple au moment du Tax Day (date limite, vers le 15 avril, aux Etats-Unis pour remplir sa déclaration de revenus ; certains Américains reçoivent alors un remboursement de la part du Fisc…). En revanche, le nombre de « rides of glory » s’effondre à l’approche de la Saint Valentin…
Evolution du nombre de « Rides of Glory » au cours d’une année (source : http://blog.uber.com/ridesofglory)

 

Dans un message précédent, Bradley Voytek avait même établi une corrélation, toujours grâce aux données collectées par Uber, entre le versement des chèques d’allocation et de la Sécurité sociale (les deuxième, troisième et quatrième mercredis du mois, aux Etats-Unis) et la fréquentation des prostituées.

Bien sûr, pour ses calculs, Bradley Voytek n’utilise que des données anonymisées. Mais avant d’être anonymisées, ces données correspondent à des cas réels dont elles révèlent toute la vie. Lors des réunions que les dirigeants d’Uber organisent avant l’ouverture de leur service dans une nouvelle ville, ces responsables auraient même utilisé un logiciel maison, baptisé « God view » (« Ce que voit Dieu », tout un programme…) pour montrer à leur assistance qu’ils pouvaient suivre en direct les déplacements de leurs clients… Ce qui constitue, bien sûr, une violation de la vie privée (sauf dans de très rare cas où cela serait justifié par des nécessités de service ou de sécurité).
Utilisation de God View lors du lancement de Uber à Boston (source : http://www.forbes.com/sites/kashmirhill/2014/10/03/god-view-uber-allegedly-stalked-users-for-party-goers-viewing-pleasure/)


Toutes ces informations sont remontées la surface à la suite d’une récente polémique opposant une journaliste de San Fransisco et un cadre d’Uber, qui se disait prêt à espionner la vie privée de cette dernière (dont il ne supporte pas les articles qu’elle consacre à son entreprise).

Au-delà de cette polémique, le plus choquant est, bien sûr, l’extrême indiscrétion des données collectées (par exemple, qui a fait un « walk of shame » et donc une rencontre d’une nuit, selon Uber) par une simple application sur un smartphone. Un sénateur américain vient d’ailleurs d’écrire aux dirigeants d’Uber pour leur demander des éclaircissements sur l’utilisation des données qu’ils collectent.

Si nous n’apprenons pas aujourd’hui à nos enfants à maîtriser leurs données, à faire respecter leur vie privée, demain ce sont les données des autres, qu’ils seront sans doute conduits à manipuler dans le cadre de leur travail, qu’ils ne respecteront pas. Et les outils formidables que constituent les nouvelles technologies pourraient bien donner naissance à une dictature numérique mondiale.