Data mining : de quoi parle-t-on ?

Le data mining est le processus d’extraction d’informations utiles 脿 partir d’une accumulation de donn茅es, souvent 脿 partir d’un data warehouse (entrep么t de donn茅es) ou d’une collection d’ensembles de donn茅es li茅s. Les outils de data mining incluent de puissantes fonctionnalit茅s statistiques, math茅matiques et analytiques dont l’objectif principal est de passer au crible de vastes ensembles de donn茅es pour identifier les tendances, les mod猫les et les relations, pour des prises de d茅cisions et une planification 茅clair茅es.

Souvent associ茅 aux demandes du service marketing, le data mining est consid茅r茅 par de nombreux dirigeants comme un moyen de mieux comprendre la demande et de voir l’impact des modifications apport茅es aux produits, des prix ou des promotions sur les ventes. Mais le data mining pr茅sente 茅galement des avantages consid茅rables pour d’autres domaines d’activit茅. Les ing茅nieurs et les concepteurs peuvent analyser l’efficacit茅 des modifications de produit et rechercher les causes possibles de la r茅ussite ou de l’茅chec d’un produit en fonction de la mani猫re, du moment et du lieu d’utilisation des produits.聽Le MRO (entretien, r茅paration et fonctionnement) est en mesure de mieux planifier le stock de pi猫ces et l’affectation du personnel. Les entreprises de services professionnels peuvent utiliser le data mining pour identifier les nouvelles opportunit茅s li茅es 脿 l’茅volution des tendances 茅conomiques et aux changements d茅mographiques.

Le data mining s’av猫re davantage utile et pr茅cieux maintenant que l’on se retrouve avec des ensembles de donn茅es plus volumineux et une exp茅rience utilisateur accrue. Logiquement, plus il y a de donn茅es, plus elles cachent d’informations et de renseignements. Par ailleurs, plus les utilisateurs se familiarisent avec les outils et comprennent la base de donn茅es, plus ils deviennent cr茅atifs vis-脿-vis des explorations et des analyses.

Pourquoi utiliser le data mining聽?

Le principal avantage du data mining est sa capacit茅脿 rep茅rer des mod猫les et des relations dans de grands volumes de donn茅es provenant de plusieurs sources. Avec de plus en plus de donn茅es disponibles, provenant de sources aussi vari茅es que les r茅seaux sociaux, les capteurs 脿 distance et les rapports de plus en plus d茅taill茅s sur les mouvements de produits et l’activit茅 du march茅, le data mining offre les outils n茅cessaires pour exploiter pleinement le Big Data et le transformer en renseignements exploitables. De plus, il peut aider 脿芦聽sortir des sentiers battus聽禄.

Le processus de data mining peut d茅tecter des relations et des mod猫les surprenants et intrigants dans des fragments d’informations apparemment non li茅es. Comme les informations tendent 脿锚tre compartiment茅es, il a toujours 茅t茅 difficile, voire impossible, de les analyser dans leur ensemble. Toutefois, il peut exister une relation entre les facteurs externes (d茅mographiques ou 茅conomiques, par exemple) et la performance des produits d’une entreprise. Les dirigeants, qui examinent r茅guli猫rement les chiffres des ventes par territoire, ligne de produits, canal de distribution et r茅gion, manquent souvent de contexte externe pour ces informations. Leur analyse souligne 芦聽ce qui s’est pass茅聽禄, mais ne d茅taille pas vraiment 芦聽pourquoi cela s’est pass茅 de cette mani猫re聽禄. Le data mining peut apporter une solution.

Le data mining peut rechercher des corr茅lations avec des facteurs externes. Si la corr茅lation n’indique pas toujours la causalit茅, ces tendances peuvent 锚tre des indicateurs pr茅cieux pour guider les d茅cisions relatives aux produits, aux canaux et 脿 la production. La m锚me analyse peut 锚tre b茅n茅fique pour d’autres domaines de l’activit茅, de la conception de produit 脿 l’efficacit茅 op茅rationnelle, en passant par la prestation de services.

Historique du data mining

Nous collectons et analysons des donn茅es depuis des milliers d’ann茅es et, 脿 bien des 茅gards, le processus est rest茅 le m锚me聽: identifier les informations n茅cessaires, trouver des sources de donn茅es de qualit茅, collecter et combiner les donn茅es, utiliser les outils les plus efficaces pour analyser les donn茅es, et tirer parti des enseignements appris. 脌 mesure que l’informatique et les syst猫mes bas茅s sur les donn茅es se sont d茅velopp茅s, il en a 茅t茅 de m锚me pour les outils de gestion et d’analyse des donn茅es. Le v茅ritable point d’inflexion est venu dans les ann茅es 1960 avec le d茅veloppement de la technologie de base de donn茅es relationnelle et des outils de requ锚te en langage naturel orient茅 utilisateur, tels que Structured Query Language (SQL). Les donn茅es n’茅taient plus disponibles uniquement via des programmes cod茅s personnalis茅s. Gr芒ce 脿 cette avanc茅e, les utilisateurs pouvaient explorer leurs donn茅es de mani猫re interactive et en extraire les 芦聽joyaux cach茅s聽禄.

Le data mining est traditionnellement un ensemble de comp茅tences sp茅cialis茅es dans la science des donn茅es. Cependant, chaque nouvelle g茅n茅ration d’outils analytiques n茅cessite dans un premier temps des comp茅tences techniques avanc茅es, mais 茅volue rapidement pour devenir accessible aux utilisateurs. L’interactivit茅, c’est-脿-dire la possibilit茅 de laisser les donn茅es vous parler, est la principale avanc茅e. Posez une question et visualisez la r茅ponse. En fonction de ce que vous apprenez, posez une autre question. Ce type d’itin茅rance non structur茅e 脿 travers les donn茅es permet 脿 l’utilisateur d’aller au-del脿 des limites de la conception de bases de donn茅es sp茅cifiques 脿 une application et permet de d茅couvrir des relations qui d茅passent les limites fonctionnelles et organisationnelles.

Le data mining est une composante cl茅 de la Business Intelligence. Les outils d’exploration de donn茅es sont cr茅茅s dans les tableaux de bord d茅cisionnels, en extrayant des informations du Big Data, y compris les donn茅es des r茅seaux sociaux, des flux de capteurs IoT, des appareils de localisation, du texte non structur茅, des vid茅os, etc. Le data mining moderne s’appuie sur le Cloud, l’informatique virtuel et les pour g茅rer les donn茅es de diverses sources de mani猫re rentable et s’adapter 脿 la demande.

Comment cela fonctionne ?

Il y a environ autant d’approches du data mining qu’il y a d’explorateurs de donn茅es. L’approche d茅pend du type de questions pos茅es, du contenu et de l’organisation de la base de donn茅es ou des ensembles de donn茅es fournissant la mati猫re premi猫re pour la recherche et l’analyse. Cela dit, certaines 茅tapes organisationnelles et pr茅paratoires doivent 锚tre accomplies pour pr茅parer les donn茅es, les outils et les utilisateurs聽:

Comprendre le probl猫me, ou du moins le domaine d’enqu锚te.Le d茅cideur, qui doit prendre les commandes de cette grande aventure de data mining, a besoin d’une compr茅hension g茅n茅rale du domaine dans lequel il travaillera, 脿 savoir les types de donn茅es internes et externes qui doivent faire partie de cette exploration. On suppose qu’il a une connaissance approfondie de l’entreprise et des domaines fonctionnels impliqu茅s.
Collecte de donn茅es.聽Commencez par vos syst猫mes et bases de donn茅es internes. Liez-les 脿 l’aide de leurs mod猫les de donn茅es et de divers outils relationnels, ou rassemblez les donn茅es dans un entrep么t de donn茅es (data warehouse). Cela inclut toutes les donn茅es provenant de sources externes qui font partie de vos op茅rations, telles que les donn茅es de force de vente et/ou de service, les donn茅es IoT ou des r茅seaux sociaux. Recherchez et acqu茅rez aupr猫s des associations professionnelles et des gouvernements les droits sur les donn茅es externes, notamment les donn茅es d茅mographiques, 茅conomiques et relatives au march茅, telles que les tendances du secteur et les indices financiers. Int茅grez-les dans le p茅rim猫tre du kit d’outils (int茅grez-les dans votre data warehouse ou reliez-les 脿 l’environnement de data mining).
Pr茅paration et compr茅hension des donn茅es.Faites appel aux experts en la mati猫re pour d茅finir, cat茅goriser et organiser les donn茅es. Cette partie du processus est parfois appel茅e 芦聽remaniement des donn茅es聽禄. Certaines donn茅es peuvent n茅cessiter un nettoyage pour supprimer les doublons, les incoh茅rences, les enregistrements incomplets ou les formats obsol猫tes. La pr茅paration et le nettoyage des donn茅es peuvent se poursuivre 脿 mesure que de nouveaux projets ou des donn茅es provenant de nouveaux champs d’enqu锚te deviennent int茅ressants.
Formation des utilisateurs.Vous ne donneriez pas 脿 votre adolescent les cl茅s de la Ferrari sans qu’il n’ait appris 脿 conduire ou qu’il n’ait pratiqu茅 la conduite sur route avec un moniteur. Par cons茅quent, veillez 脿 dispenser une formation formelle 脿 vos futurs explorateurs de donn茅es et 脿 les familiariser avec ces outils puissants. La formation continue est 茅galement bienvenue une fois qu’ils ma卯trisent les bases et qu’ils peuvent passer 脿 des techniques plus avanc茅es.

Techniques de data mining

Gardez 脿 l’esprit que l’exploration de donn茅es est bas茅e sur un kit d’outils plut么t que sur une routine ou un processus fixe. Les techniques sp茅cifiques de data mining cit茅es ici ne sont que des exemples d’utilisation des outils par les organisations afin d’explorer leurs donn茅es et rechercher des tendances, des corr茅lations et des renseignements.

D’une mani猫re g茅n茅rale, les approches de data mining peuvent 锚tre cat茅goris茅es comme 茅tant orient茅es (vers un r茅sultat sp茅cifique souhait茅) ou non orient茅es, comme un simple processus de d茅couverte. D’autres explorations peuvent 锚tre destin茅es au tri ou 脿 la classification des donn茅es, telles que le regroupement des clients potentiels en fonction d’attributs commerciaux comme le secteur, les produits, la taille et le lieu g茅ographique. De m锚me, la d茅tection de cas particuliers ou d’anomalies est une m茅thode automatis茅e de reconnaissance des anomalies r茅elles (plut么t que simple variabilit茅) dans un ensemble de donn茅es qui affiche des mod猫les identifiables.

Association

Un autre objectif int茅ressant est l’association, qui relie deux 茅v茅nements ou activit茅s apparemment non li茅s. Il existe un r茅cit bien connu des d茅buts de l’analyse et du data mining, peut-锚tre fictif, selon lequel une cha卯ne de magasins d茅couvrait une corr茅lation entre les ventes de bi猫re et de couches. Il avait 茅t茅 suppos茅 que les nouveaux papas stress茅s qui sortaient tard le soir pour acheter des couches pouvaient aussi prendre un pack de 6 bi猫res dans la foul茅e. Les magasins ont alors plac茅 la bi猫re et les couches 脿 proximit茅, ce qui a augment茅 les ventes de bi猫re.

Clustering

Cette approche vise 脿 regrouper les donn茅es par similitudes plut么t que par hypoth猫ses pr茅d茅finies. Par exemple, lorsque vous explorez vos informations commerciales clients combin茅es 脿 des donn茅es externes d茅mographiques et de cr茅dit 脿 la consommation, vous pourriez d茅couvrir que vos clients les plus rentables vivent dans des villes de taille moyenne.

La majorit茅 du temps, le data mining est ex茅cut茅 en soutien 脿 la pr茅vision. Plus vous comprenez les mod猫les et les comportements, mieux vous pouvez pr茅voir les actions futures li茅es aux causes ou aux corr茅lations.

搁茅驳谤别蝉蝉颈辞苍

L’une des techniques math茅matiques propos茅es dans les kits d’outils de data mining est l’analyse de r茅gression, qui pr茅dit un nombre en fonction de mod猫les historiques projet茅s dans le futur. Divers autres algorithmes de d茅tection et de suivi des mod猫les fournissent des outils flexibles pour aider les utilisateurs 脿 mieux comprendre les donn茅es et le comportement qu’elles repr茅sentent.

Ce ne sont l脿 que quelques-uns des outils et des techniques disponibles dans les kits d’outils de data mining. Le choix de l’outil ou de la technique est en quelque sorte automatis茅 en ce sens que les techniques seront appliqu茅es en fonction de la mani猫re dont la question est pos茅e. Auparavant, l’exploration de donn茅es revenait 脿芦聽d茅couper en tranches聽禄 la base de donn茅es, mais la pratique est aujourd’hui plus sophistiqu茅e et les termes comme association, clustering et r茅gression sont monnaie courante.

Exemples de cas d’utilisation

Le data mining est essentiel 脿 l’analyse des sentiments, 脿 l’optimisation des prix, au marketing de bases de donn茅es, 脿 la gestion des risques de cr茅dit, 脿 la formation et 脿 l’assistance, 脿 la d茅tection des fraudes, aux diagnostics m茅dicaux, 脿 l’茅valuation des risques, aux syst猫mes de recommandation (脿 savoir, 芦 les clients qui ont achet茅 ceci ont 茅galement aim茅… 禄), et bien plus encore. Elle peut 锚tre un outil efficace dans pratiquement n’importe quel secteur, y compris la distribution de d茅tail, la distribution de gros, les services, la fabrication, les t茅l茅communications, les communications, les assurances, l’茅ducation, la sant茅, la banque, la science, l’ing茅nierie et le marketing en ligne ou les r茅seaux sociaux.

D茅veloppement de produit	Les entreprises qui con莽oivent, fabriquent ou distribuent des produits physiques peuvent identifier des opportunit茅s pour mieux cibler leurs produits en analysant les habitudes d’achat conjugu茅es aux donn茅es 茅conomiques et d茅mographiques. Leurs concepteurs et ing茅nieurs peuvent 茅galement recouper les commentaires des clients et des utilisateurs, les donn茅es de r茅paration et d’autres donn茅es pour identifier les opportunit茅s d’am茅lioration des produits.
Production	Les fabricants peuvent suivre les tendances de qualit茅, les donn茅es de r茅paration, les taux de production et les donn茅es de performance des produits sur le terrain pour identifier les probl猫mes de production. Ils peuvent 茅galement d茅tecter les am茅liorations pouvant 锚tre apport茅es aux processus afin d’accro卯tre la qualit茅, gagner du temps, r茅duire les co没ts, am茅liorer la performance des produits et/ou rep茅rer tout besoin de renouvellement d’茅quipements.
Industries des services	Dans le secteur des services, les utilisateurs peuvent trouver des opportunit茅s similaires d’am茅lioration des produits en comparant les commentaires des clients (directs ou publi茅s sur les r茅seaux sociaux ou d’autres sources) et les donn茅es relatives aux services, canaux, performance des pairs, r茅gions, tarifs, ou encore les donn茅es d茅mographiques ou 茅conomiques.

Enfin, toutes ces d茅couvertes doivent 锚tre transpos茅es dans les pr茅visions et la planification afin que l’ensemble de l’entreprise soit en phase avec les changements de la demande anticip茅s gr芒ce 脿 une connaissance plus approfondie du client, et soit ainsi mieux positionn茅e pour exploiter les opportunit茅s venant d’锚tre identifi茅es.

D茅fis li茅s au data mining

Big Data :聽la g茅n茅ration de donn茅es est de plus en plus rapide, ce qui offre de plus en plus d’opportunit茅s pour le data mining. Cependant, des outils d’exploration de donn茅es modernes sont n茅cessaires pour extraire une signification du Big Data, compte tenu du volume 茅lev茅, de la grande rapidit茅 et de la grande vari茅t茅 des structures de donn茅es, ainsi que du volume croissant de donn茅es non structur茅es. De nombreux syst猫mes existants ont du mal 脿 g茅rer, 脿 stocker et 脿 utiliser ce grand flux d’intrants.
Comp茅tence de l’utilisateur :聽les outils d’exploration et d’analyses des donn茅es sont con莽us pour aider les utilisateurs et les d茅cideurs 脿 comprendre et 脿 obtenir des informations 脿 partir de grands volumes de donn茅es. Bien que hautement techniques, ces outils puissants offrent d茅sormais une excellente exp茅rience utilisateur, de sorte que pratiquement tous les utilisateurs sont en mesure d’utiliser ces outils avec un minimum de formation. Toutefois, pour tirer pleinement profit des avantages, l’utilisateur doit comprendre les donn茅es disponibles et le contexte commercial des informations qu’il recherche. Il doit 茅galement savoir, au moins de mani猫re g茅n茅rale, comment fonctionnent les outils et ce qu’ils peuvent faire. Ces outils ne sont pas hors de port茅e du responsable ou dirigeant moyen, mais n茅cessitent un apprentissage, raison pour laquelle les utilisateurs doivent consacrer du temps au d茅veloppement de cette nouvelle comp茅tence.
Qualit茅 et disponibilit茅 des donn茅es :聽avec ces 茅normes quantit茅s de nouvelles donn茅es, il existe 茅galement des masses de donn茅es incompl猫tes, incorrectes, trompeuses, frauduleuses, endommag茅es ou simplement inutiles. Les outils peuvent contribuer 脿 r茅soudre ce probl猫me, mais les utilisateurs doivent constamment tenir compte de la source des donn茅es et de sa cr茅dibilit茅 et fiabilit茅.聽Les pr茅occupations en mati猫re de confidentialit茅 sont 茅galement importantes, tant en ce qui concerne l’acquisition des donn茅es que la prise en charge et la gestion une fois qu’elles sont en votre possession.

Renforcez votre expertise en mati猫re de gestion des donn茅es

Comprenez le processus de gestion des donn茅es et les avantages qu’il peut apporter 脿 votre organisation.

FAQ sur le data mining

Quelle est la diff茅rence entre le machine learning et le data mining聽?

Le data mining consiste 脿 utiliser des outils analytiques avanc茅s pour extraire des informations utiles d’une accumulation de donn茅es.聽聽est un type 聽(IA) qui permet aux syst猫mes d’apprendre par l’exp茅rience. L’exploration de donn茅es peut utiliser le machine learning lorsque les programmes analytiques ont la possibilit茅 d’adapter leurs fonctionnalit茅s en fonction de l’analyse de donn茅es qu’ils effectuent.

Existe-t-il une diff茅rence entre le data mining et l’analyse de donn茅es聽?

L’analyse des donn茅es est un terme g茅n茅ral pour le large 茅ventail de pratiques visant 脿 identifier les informations utiles, 脿 les 茅valuer et 脿 fournir des r茅ponses sp茅cifiques. Le data mining est un type d’analyse des donn茅es qui se concentre sur l’exploration de grands ensembles de donn茅es combin茅s pour d茅couvrir des mod猫les, des tendances et des relations susceptibles de g茅n茅rer des informations et des pr茅visions.

Le data mining est-il identique 脿 la science des donn茅es聽?

La science des donn茅es est un terme qui inclut de nombreuses technologies de l’information, y compris les statistiques, les math茅matiques et les techniques de calcul sophistiqu茅es appliqu茅es aux donn茅es. Le data mining est un cas d’utilisation de la science des donn茅es centr茅 sur l’analyse de grands ensembles de donn茅es provenant d’un large 茅ventail de sources.

Le data mining est-il identique au data warehouse聽?

鲍苍听data warehouse聽est un ensemble de donn茅es, g茅n茅ralement provenant de sources multiples (,听, par exemple) qu’une entreprise rassemblera dans l’entrep么t 脿 des fins d’archivage et d’analyse 脿 grande 茅chelle, comme le data mining.

51风流

Qu’est-ce que le data mining ?