vendredi 9 mai 2014

La Naive Data Discovery et l'allégorie de la mine

L'allégorie de la mine



 La BI va consister à échanger avec les experts métiers et à programmer leur intelligence métier dans une multitude de robots : quoi chercher, comment reconnaître une pépite, quels sont les faux-positifs à éviter. Puis à lancer ces robots dans les galeries de la mine, qu’ils vont arpenter dans tous les sens, systématiquement, pour en extraire tout ce qui matche avec les règles données. Au fur et à mesure des faux-positifs et des découvertes, on améliore les règles données aux robots pour les rendre plus rapides et efficaces. Au final on pourra réutiliser ces robots dans d’autres mines.
 Le Data Mining va consister à carotter les collines puis à introduire les carottes dans de grosses machines : tamis intelligents, centrifugeuses, etc. Le contenu va être trié, catégorisé par taille, poids, densité, couleur, etc. Puis un expert métier va se pencher sur les résultats et les analyser, par exemple détecter qu’une mince bande dans la centrifugeuse est composée de poussière d’or. A partir de là, en compilant la provenance du contenu on va pouvoir estimer si ça vaut le coup d’exploiter la mine ou pas. 
La Naive Discovery va consister à aller faire un repérage d’1 journée dans les galeries. Cheminant au travers des galeries, sans systématisme mais avec méthode, armé d’un piolet et d’une lampe de poche, l’analyste va faire une première collecte de surface, creuser un peu quand il trouve une singularité. Lors de ce repérage on peut imaginer qu’il trouve, par exemple, un caillou étrange marron et plutôt mou. Une fois le repérage terminé,  on s’aperçoit qu’il s’agit d’une truffe. Et là une expertise supplémentaire nous démontre que les collines des mines sont couvertes de chênes truffiers et que le propriétaire gagnera plus en les exploitant plutôt qu’en creusant les mines. Voilà le genre de découvertes, de grande valeur et totalement inattendues, très éloignées de la vision métier initiale (les mines) qui peuvent être faites avec cette méthode. A noter qu’elle peut aussi être faite avec le Data Mining, mais la mise en place d’un data Mining suffisamment efficace à un prix.

Je ne connais peut être pas votre métier, mais je connais les données

 


Une démarche pragmatique et opérationnelle pour des résultats rapides et opérationnels

 
Merci à Nicolas S pour sa participation.
@yannsese