Skip to content

Fair Statistical Learning Algorithms for Ethical Artificial Intelligence

License

Notifications You must be signed in to change notification settings

bzg/Fair-ML-4-Ethical-AI

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

28 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

INSA insa Wikistat

Apprentissage Statistique Loyal pour IA Ethique

Ressources pédagogiques

Fair Machine Learning for Ethical AI: educational resources

(1) Université de Toulouse -- INSA

(2) Université de Toulouse -- Paul Sabatier

1 Introduction

1.1 IA au quotidien et apprentissage statistique

Associant données massives (big data) et algorithmes d’apprentissage automatique (machine learning), la puissance des outils de décision automatique suscite autant d’espoir que de craintes. Ces algorithmes, acteurs de l'Intelligence Artificielle (IA) au quotidien, construisent des décisions issues de prévisions obtenues après estimation ou entraînement sur une base de données personnelles: attribution d'un crédit et prévision du risque de mauvais paiement; profilage et publicité en ligne; prime d'assurance auto et conduite accidentogène; imagerie médicale et risque de malignité d'une tumeur; passé comportemental, environnement social et risque de récidive.

Laissons de côté les effets médiatiques rabâchés : véhicule autonome devant choisir entre un landau et un fauteuil roulant, robot humanoïde affectueux, lois d'Azimov de la robotique, transhumanisme, singularité technologie... bref les débats de science fiction ou encore ceux sociétaux anxiogènes: destruction des emplois même qualifiés, robots armés, big data big brother...

1.2 IA, loi et usage éthique

Laissons à la CNIL les problèmes bien identifiés de confidentialité des données et à l'Autorité de la Concurrence ceux d’entrave à la concurrence. Nous nous focalisons sur les algorithmes d’apprentissage statistique, pour aborder les Enjeux Ethiques de l’Algorithme et de l’Intelligence artificielle (CNIL 2017) également très présents dans le rapport Villani (2018, partie 5).

De nombreux textes législatifs européens (RGPD avril 2018) et français récemment promulgués (juin 2018) tentent d’encadrer les usages de ces outils. La mise en perspective détaillée de ces textes (Besse et al. 2018-b), face à la complexité et l’opacité des algorithmes d’apprentissage, révèle d’importantes disruptions technologiques. Ainsi, des vides juridiques soulèvent des problèmes ou risques sérieux lorsques des décisions, susceptibles d'impacter des personnes physiques ou même simplement de les profiler, sont le résultat de procédures algorithmiques exécutées sur des données personnelles. Seules des pratiques éthiques sont alors susceptibles de combler les lacunes pour pallier des problèmes aux conséquences qui peuvent s'avérer assez considérables. Comme le rappellent de façon récurrente les aventures de Facebook ou Google, des pratiques déloyales peuvent conduire à des rejets massifs de la part des utilisateurs voire à des condamnations.

C'est l'acceptabilité des algorithmes d'Intelligence Artificielle qui est en jeu.

1.3 Objectif

Le principal objectif du présent dépôt est de mettre à disposition des ressources pédagogiques (tutoriels) afin de promouvoir des pratiques loyales et éthiques indispensables au développement de la confiance des citoyens, justiciables, consommateurs, patients, contribuables, envers l'IA pour en faire accepter l'usage au quotidien.

Sur des cas d'usage bien identifiés, des tutoriels (jupyter notebook) permettent de poser concrètement les questions de loyauté des algorithmes et d'en évaluer les solutions récemment proposées et régulièrement mises à jour sur ce dépôt.

Plius précisément il s'agit de détailler le fonctionnement d'outils et critères, généralement statistiques, de détection de pratiques déloyales, éventuellement de corrections et également d'aide à l'explication de décisions algorithmiques.

Ces outils sont ceux suceptibles d'être intégrés à une procédure d'audit des algorithmes d'apprentissage.

1.4 Environnement technique

Les outils sont déployés sous la forme de tutoriels: calepins ou jupyter notenooks. Des compléments d'informations sur les outils et algorithmes sont à rechercher dans les autres tutoriels du dépôt github/wikistat.

Le choix a été fait de développer les calepins avec le langage R plus simple et plus intuitif que Python. Les différentes librairies de R offrent de plus des aides à l'interprétation, notamment graphiques, statistiques, plus complètes et plus explicites que celles des librairies écrites en Python. Les mêmes outils sont en cours de développement en python en vue de développements pllus opérationnels.

WikistatLe Chat par Philippe Geluck

2 Principes éthiques abordés ou non par la loi

Trois aspects majeurs sont à considérer et détaillés par Besse et al. 2018-b

2.1 Qualité des décisions algorithmiques

Les algorithmes d'apprentissage ne sont pas prouvables, certifiables de façon déterministe comme des algorithmes procéduraux. Néanmoins, l'évaluation de la qualité d'une décision algorithmique est une question essentielle lorsqu'il s'agit, par exemple, de discuter de l'opportunité d'une opération chirurgicale ou encore de la libération conditionnelle d'un détenu. Malheureusement la loi est désespérément muette sur ce sujet et n'oblige en rien à la communication des estimations des qualités des prévisions conduisant aux décisions, comme c'est le cas pour un sondage d'opinion. Une loyauté élémentaire consiste donc à associer chaque décision à une estimation statistique de la qualité de prévision; qualité estimée sur un échantillon test indépendant (capacité de généralisation).

Il n'est pas possible de faire comme si 3% d'erreur en reconnaissance d'images c'est pareil que 30% à 40% en prévision de la récidive. Avec la loi actuelle un humain doit assumer la décision et, d'un point de vue éthique, il n'y a pas d'obligation de résultat mais une obligation de moyens et aussi de transparence sur la qualité de la décision. La quantification ou l'estimation statistique d'un taux d'erreur doit se substituer à un déterminisme binaire : vrai / faux irréaliste.

2.2 Biais algorithmique et Discrimination

La loi française comme le règlement européen interdit toute forme de discrimination envers une personne ou un groupe mais, arriver à caractériser qu'une décision algorithmique est biaisée donc discriminatoire reste difficile. Il est apparemment facile d’opérer individuellement du testing d’algorithme en modifiant la modalité de la variable sensible (femme en homme, noir en blanc, vieux en jeune...) d’une personne pour provoquer une éventuelle bascule de la décision. Cela est suceptibles déliminer individuellement un risque juridique de dicrimination. Malheureusement, de nombreux exemples montrent que, même protégée et absente des modèles, une information sensible est facilement déduite des autres informations ou variables disponibles. Comme le montre des exemples sur des cas d'usage, la correction par testing n'est pas probante vis à vis de la discriminaiton de groupe.

Comme le signale le rapport Villani (2018), il est important de définir une notion de discrimination envers un groupe: le discrimination impact assessment ou DIA. C'est ce qui est pratiqué de longue date (1971) aux USA et reconnu dans certains cas par les tribuanux avec une approche statistique de la mesure de la discrimination à l'embauche. Plusieurs indicateurs sont utilisables mais le plus employé et discuté considère la notion de d'effet disproportionné (disparate impact). La variable sensible et protégée doit être connue (c'est le cas aux USA pour l'origine ethnique) pour estimer l'effet disproportionné mais celle-ci peut l'être sous une une forme chiffrée ou en protégeant l'anonymat des personnes.

Des biais, discriminations ou injustices ayant été identifiées, dans la base d'apprentissage et / ou dans la prévision, des outils statistiques et algorithmiques existent (fair learning) pour en corriger ou au mois en atténuer les effets. Si la base d'apprentissage est biaisée, ce qui est très généralement la source principale de discrimination, corriger le biais induit une forme de discrimination positive qui relève d'une décision politique et humaine, pas algorithmique.

2.3 Droit à l'explication

Les algorithmes d'apprentissage statistique largement utilisés, quand ils sont les plus efficaces, sont généralement profondément opaques de même que les décisions qui en découlent sauf dans les cas de modèles statistiques ou arbres de décision élémentaires. Néanmoins, la recherche progresse pour apporter des aides à l'interprétation, pour aider à comprendre, au moins localement pour une personne impactée au sens de la loi, les raisons ou causes d'une décision algorithmique. Il s'agit par exemple d'identifier les variables ou facteurs qui influencent le plus et dans quel sens une décision pour qu'un humain, respectueux de la législation, en déduise des explications intelligibles adressées à la personne qui en fait la demande.

Finalement, la résolution des questions de discrimination ou opacité d'un algorithme est le résultat d'un compromis, si possible le meilleur, afin de réduire le biais ou améliorer l'explicabilité d'une décision tout en évitant de trop en dégrader la qualité. Ces points seront abordés en pratique dans les sections suivantes.

3 Pratiques loyales

3.1 Mesurer la qualité d'une décision

Les stratégies d'apprentissage statistique sont rôdées et bien connues. L'objectif est d'optimiser le choix d'un algorithme afin, obligation de moyens, d'aboutir à la prévision minimisant un risque et ainsi à la meilleure décision. L'estimation de l'erreur est donc intégrée à la démarche, il suffit de la faire connaître par souci de transparence.

Les différentes étapes de l'apprentissage supervisé sont détaillées et illustrées par ailleurs sur de nombreux cas d'usage.

Les méthodes de prévisions sont entraînées sur les données d’apprentissage dont la qualité est déterminante. Les phases d'extraction, vérification, nettoyage, préparation des données sont critiques et doivent être conduites avec un soin particulier: garbage in, garbage out. Le volume des données peut être un facteur utile de qualité mais secondaire, seulement si celles-ci sont bien représentatives de l’objectif et pas biaisées. Dans le cas contraire des téraoctets de données n’améliorent en rien la qualité.

3.2 Détecter un biais, une discrimination

La première difficulté réside dans la façon de définir une discrimination, notamment d'un point de vue légal, puis de traduire cette définition en une quantité mesurable afin de construire des outils de détection. Ces différents points sont illustrés par deux exemples ou cas d'usage:

  • Adult census Analyse loyale d'un jeu de données. Exploration et détection d'une discrimination individuelle par testing ou de groupe par estimation d'un impact disproportionné: disparate impact (DI) estimatIon par intervalle de confiance (Besse et al. 2018-a). Biais de la base d'apprentissage et biais des prévisions.
  • Propublica Analyse du score de récidive (COMPAS) commercialisé par la société equivant. Trois critères de discrimination sont considérés entre détenus d'origine ethnique caucasienne vs. non-caucasienne: impact disproportionné, erreurs de prévision, assymétrie de la matrice de confusion. Ils sont successivement analysés sur les données brutes, l'estimation COMPAS du risque de récidive, une estimation élémentaire par régression logistique.

3.3 Correction d'une discrimination (en chantier)

Une fois des biais détectés, il s’agit de les corriger avec l’objectif a minima d’éviter d’amplifier ou exacerber les sources de discrimination au détriment d’une minorité, ou d’un groupe protégé par la loi, lors de décisions qui impactent des personnes : accès au crédit, à l’emploi, l’assurance, la justice… Le sujet est abordé dans la littérature depuis une dizaine d’année et exposé au sein de conférences dédiées (https://fatconference.org/). L’objectif présent n’est pas une analyse exhaustive des méthodes proposées mais simplement d’illustrer sur un ou des exemples quelques méthodes de débiaisage d’un algorithme d’apprentissage automatique afin d’appréhender, expliquer, la démarche, ses capacités. Ce peut être par correction, individu par individu (testing), de l’effet de la variable sensible (genre, origine ethnique...) ou par adaptation du seuil de décision en fonction de cette variable ou encore par une approche plus théorique (del Barrio et al. 2018) par transport optimal.

3.4 Droit à l'explication (en chantier)

Une des principales sources de problèmes soulevés par l’IA réside dans l’opacité des algorithmes récents d’apprentissage statistique dont la complexité les rend impropres à une interprétation élémentaire comme c’est le cas d’un algorithme basé sur un modèle statistique linéaire ou un arbre de décision binaire. Le RGPD et plus précisément la loi française évoquent un « droit à l’explication » des décisions algorithmiques. Quelles aides peuvent être apportées en ce sens ? La recherche est très active sur le sujet. L’objectif d’en illustrer quelques pistes, notamment à l’aide de la librairie LIME sur des exemples. L’aide peut concerner une compréhension globale de l’algorithme (importance ou impact des variables, Bachoc et al. 2018) ou l’explication à un individu donné (counterfactual explanation, Watcher et al. 2018) : quelles modifications de quelles variables concduirait à une décision favorable concernant l’accès à un crédit, un emploi...

Références

  • Bachoc F., Gamboa F., Loubes J.-M., and Risser L. (2019). Entropic Variable Boosting for Explainability & Interpretability in Machine Learnings, arXiv preprint
  • Besse P. ,del Barrio E., Gordaliza P., Loubes J.-M. (2018-a). Confidence Intervals for testing Disparate Impact in Fair Learning, arXiv preprint.
  • Besse P., Castets-Renard C., Garivier A., Loubes J.-M. (2018-b). L'IA du Quotidien peut elle être Éthique? Loyauté des Algorithmes d'Apprentissage Automatique, Statistique et Société, à paraître.
  • del Barrio E., Gamboa F., Gordaliza P., Loubes J.-M. (2018). Obtaining fairness using optimal transport theory, soumis, arXiv preprint.
  • Wachter S., Mittelstadt B., Russell C. (2018). Counterfactual Explanations without Opening the Black Box: Automated Decisions and the GDPR, Harvard Journal of Law & Technology, arXiv.

About

Fair Statistical Learning Algorithms for Ethical Artificial Intelligence

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 96.4%
  • R 3.6%