Data mining (INFO05_CEEAYA)

Objectifs

Appréhender les techniques de data mining. Comprendre les spécificités d’un projet de data mining. Utilisation et interprétation des résultats dans des cas « marketing » (cas pratiques)

Pré-requis

Statistiques de base (notions, tests), statistique inférentielle, ANOVA, tests paramétriques

 

Plan du cours

  •       Introduction aux méthodes et panorama du data mining
  •       Construction d’une étude, élaboration d’un projet
  •       Echantillonnage (pour les méthodes d’apprentissage supervisé) et base d’analyse
  •        Analyse factorielle
  •        Arbres de décision (CHAID, CART)
  •        Analyse discriminante, régression logistique
  •        Classification / typologie (CAH, clustering, k-means)
  •        Données manquantes
  •        Recherche d’association
  •       TD : champs d’application des différentes méthodes (modèle de churn, appétence, clustering), scoring, et approche marketing. Utilisation du logiciel SAS.

Volume horaire

  • CM : 14.0
  • TD : 14.0

Bibliographie

« Probabilités, analyse de données et statistiques » Gilbert Saporta (Technip)

« Data mining et statistique décisionnelle, l’intelligence des données » Stéphane Tufféry (Technip)

« Analyse discriminante » Bardos (Dunod)

« The Elements of Statistical Learning » Hastie, Tibshirani, Friedman (Springer-Verlag)

« Credit scoring and its applications » Thomas, Edelman,Crook

Diplômes intégrant ce cours

En bref

Crédits ECTS : 3

Langue d'enseignement
Français

Contact(s)

UFR, Écoles, Instituts

Lieu(x)

  • Annecy-le-Vieux (74)