6 juillet 2020
Data Mining : l’atout contre la fraude fiscale
Le chiffre est tombé début juillet – dans un tweet de Gérald Darmanin, Ministre de l’Action et des Comptes Publics – 12 milliards d’euros, c’est la somme record récupérée par l’Etat français en 2019 dans la lutte contre la fraude fiscale ! Un montant impressionnant, qui dépasse le précédent record de 2015, et qui résulte du travail engagé depuis quelques années par l’Etat pour traquer les fraudeurs, et cela par tous les moyens. Parmi ces moyens, le Data-Mining est un outil qui se révèle très efficace.
Qu’est ce que le Data Mining ?
Le Data Mining – ou exploration des données en français – est une famille d’outils automatiques ou semi-automatiques qui permettent l’analyse d’un très grand nombre de données. L’objectif du Data Mining (et du Data Miner) est de faire apparaître des corrélations entre des phénomènes ou informations en apparence distincts. A l’ère du Big Data, le Data Mining peut servir dans tous les domaines d’action révélant des motifs récurrents, des informations importantes en recoupant des données précises. Il est notamment très utilisé dans le domaine du marketing afin d’anticiper les tendances ou de suivre la courbe d’un produit, mais aussi dans le domaine des assurances pour obtenir un profil de client précis (les clients à risques par exemple). Dans le cas de la lutte contre les fraudes fiscales, un tel outil peut se révéler indispensable !
Réseaux sociaux et données administratives passés à la loupe
Le saviez-vous ? Tous les sites où un contribuable est susceptible d’être identifié et de poster du contenu de façon publique permet à l’Etat Français d’y avoir accès. L’Etat peut donc collecter ces données et les analyser. Ainsi, les réseaux sociaux – Facebook et Instagram particulièrement – sont donc les premiers endroits où l’Administration Fiscale peut glaner de précieuses informations. Les sites de mises en relation de services sont aussi un autre terrain de chasse pour la détection de pratiques frauduleuses (Airbnb, leBoncoin par exemple).
Les logiciels de Data Mining ont la faculté de recouper tous types d’informations, et peuvent faire remonter des historiques de déplacements, des anomalies ou encore des répétitions douteuses !
Appliqué au cas de la fraude fiscale, le Data Mining a son terrain de jeu favori : les documents fiscaux et autres données administratives. L’outil a accès à tous les documents type déclarations sociales des employeurs : CAF, Urssaf, Pôle Emploi, etc… Une manne d’informations précieuses que l’outil peut explorer dans les moindres recoins ! En 2019, cette Intelligence Artificielle a permis à l’État de repérer pas moins de 7 000 comptes à l’étranger qui n’avaient pas été déclarés par des Français.
Dans tous les cas, l’intervention humaine est toujours indispensable et permet de prendre la main sur chaque dossier. Le système de Data Mining, lui, permet de lancer des alertes et pointer les corrélations que l’homme doit, par la suite, interpréter.
Et l’atteinte à la vie privée dans tout ça ?
La CNIL (Commission Nationale de l’Informatique et des Libertés) avait émis des doutes lors de l’annonce de la mise en place de ce dispositif, notamment sur l’utilisation des informations postées sur les réseaux sociaux. Mais des gardes-fous clairs et distincts ont été mis en place afin que les robots du Fisc n’accèdent pas à toutes les données des contribuables :
- Ils n’ont accès qu’à des documents mis en ligne sur le web, publics et accessibles à tous.
- Ils n’utilisent pas la reconnaissance faciale pour détecter des photos cachées ou postées par d’autres personnes que l’internaute.
- Les données non utilisées doivent être détruites au bout de 30 jours.
Le Data Mining et l’Intelligence Artificielle vous intéressent ? Rejoignez l’IA School et bénéficiez d’une formation professionnalisante en Big Data et Management de l’IA !