# 📚 Documentation Utilisateur Bienvenue dans la documentation complète de l'application d'analyse de données statistiques. --- ## 📖 Guides Disponibles ### 🚀 [Guide Utilisateur Principal](USER_GUIDE.md) **Point de départ recommandé** - Démarrage rapide - Vue d'ensemble des fonctionnalités - Workflow d'analyse complet - Cas d'usage pratiques - FAQ et glossaire **À lire si vous découvrez l'application** --- ### 🔗 [Guide de la Corrélation](CORRELATION_GUIDE.md) **Analyser les relations entre variables** - Qu'est-ce que la corrélation ? - Les 3 méthodes (Pearson, Spearman, Kendall) - Interpréter la matrice de corrélation - Comprendre la multicolinéarité - P-values et significativité - Bonnes pratiques et exemples **À lire pour :** Choisir les bons prédicteurs, éviter la multicolinéarité --- ### 📈 [Guide de la Régression](REGRESSION_GUIDE.md) **Modéliser et prédire des phénomènes** - Concepts fondamentaux - 4 types de modèles (linéaire, logistique, polynomial, exponentielle) - Configuration du modèle - Interprétation des coefficients - Métriques de qualité (R², AIC, BIC) - Équations exportables (Python, Excel, LaTeX) - Diagnostics graphiques - Exemples détaillés **À lire pour :** Construire des modèles prédictifs robustes --- ### 🔍 [Guide des Outliers](OUTLIER_GUIDE.md) **Gérer les valeurs aberrantes** - Définition et types d'outliers - Méthodes de détection (IQR, Isolation Forest) - Indicateurs visuels (🔴 rouge, 🟣 violet) - Processus de gestion - Impact sur les analyses - Bonnes pratiques - Cas concrets **À lire pour :** Garantir la qualité de vos analyses --- ## 🎯 Parcours Recommandé ### Débutant ``` 1. USER_GUIDE.md (Comprendre l'application) 2. CORRELATION_GUIDE.md (Explorer les relations) 3. REGRESSION_GUIDE.md (Premiers modèles) ``` ### Intermédiaire ``` 1. CORRELATION_GUIDE.md (Multicolinéarité) 2. REGRESSION_GUIDE.md (Modèles avancés) 3. OUTLIER_GUIDE.md (Nettoyage des données) ``` ### Expert ``` 1. OUTLIER_GUIDE.md (Gestion avancée) 2. REGRESSION_GUIDE.md (Interprétation détaillée) 3. CORRELATION_GUIDE.md (Choix des méthodes) ``` --- ## 📊 Résumé des Fonctionnalités ### Corrélation 📊 - Matrice de corrélation avec heatmap - 3 méthodes (Pearson, Spearman, Kendall) - Détection de multicolinéarité (≥0.7) - P-values et significativité - Export CSV ### Régression 📈 - 4 types de modèles (linéaire, logistique, polynomial, exponentielle) - Sélection automatique des variables (importance) - Interactions et termes polynomiaux - Équations exportables (Python, Excel, LaTeX) - Graphiques diagnostiques (fit, partial regression, parity plot) - Métriques complètes (R², coefficients, p-values) ### Outliers 🔍 - Détection univariée (IQR) - Détection multivariée (Isolation Forest) - Indicateurs visuels (🔴 rouge, 🟣 violet) - Processus d'exclusion - Raisons détaillées --- ## 🔍 Recherche Rapide ### Je veux... **Comprendre mes données** → [Guide Corrélation](CORRELATION_GUIDE.md) **Prédire une variable** → [Guide Régression](REGRESSION_GUIDE.md) **Nettoyer mes données** → [Guide Outliers](OUTLIER_GUIDE.md) **Choisir les bons prédicteurs** → [Guide Corrélation - Multicolinéarité](CORRELATION_GUIDE.md#multicolinéarité) **Interpréter les coefficients** → [Guide Régression - Interprétation](REGRESSION_GUIDE.md#interprétation-des-résultats) **Comprendre le R²** → [Guide Régression - Métriques](REGRESSION_GUIDE.md#métriques-de-qualité-du-modèle) **Exporter l'équation** → [Guide Régression - Équations](REGRESSION_GUIDE.md#équations-du-modèle) **Gérer les valeurs extrêmes** → [Guide Outliers](OUTLIER_GUIDE.md) --- ## 📝 Glossaire ### Termes Clés - **Corrélation** : Force et direction d'une relation entre deux variables - **Multicolinéarité** : Forte corrélation entre prédicteurs (problématique) - **Outlier** : Valeur aberrante qui s'écarte du reste des données - **R²** : Proportion de variance expliquée par le modèle (0 à 1) - **P-value** : Probabilité que le résultat soit dû au hasard (< 0.05 = significatif) - **Coefficient** : Impact moyen d'une variable sur la cible - **IQR** : Interquartile Range (Q3 - Q1), utilisé pour détecter les outliers - **Isolation Forest** : Algorithme de détection d'anomalies multivariées - **Régression** : Méthode pour modéliser la relation entre variables --- ## 🚦 Codes Couleurs ### Dans la documentation - 📊 **Information** : Définitions et concepts - ✅ **Bon** : Bonne pratique - ❌ **Mauvais** : Erreur à éviter - ⚠️ **Attention** : Point important ou risqué - 🔍 **Investigation** : Analyse nécessaire - 🎯 **Objectif** : But à atteindre ### Dans l'application - 🔴 **Rouge** : Outlier univarié ou corrélation négative forte - 🟣 **Violet** : Outlier multivarié - 🟢 **Vert** : Significatif ou fiable - 🔵 **Bleu** : Corrélation positive forte --- ## 📞 Support et Ressources ### Documentation Technique - Code source : `/backend/app/core/engine/` - API endpoints : `/backend/app/api/v1/` - Frontend : `/frontend/src/features/` ### Standards Statistiques - [Pearson Correlation](https://en.wikipedia.org/wiki/Pearson_correlation_coefficient) - [Spearman's Rank](https://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient) - [Linear Regression](https://en.wikipedia.org/wiki/Linear_regression) - [Isolation Forest](https://en.wikipedia.org/wiki/Isolation_forest) --- ## 📅 Mises à Jour **Version actuelle** : 1.0 **Dernière mise à jour** : Janvier 2026 ### Changements récents - ✅ Documentation complète créée - ✅ Guides utilisateurs détaillés - ✅ Exemples concrets - ✅ Glossaire et parcours recommandés --- ## 🎓 Bonnes Analyses ! Cette documentation est conçue pour vous accompagner à chaque étape de vos analyses statistiques. **Rappelez-vous** : - 📊 **Vérifiez toujours** la corrélation avant de régresser - 🔍 **Investiguez** les outliers avant de les exclure - 📈 **Interprétez** les coefficients (pas juste le R²) - ✅ **Documentez** vos décisions Bonne découverte de l'application ! --- **Version** : 1.0 **Projet** : Application Web d'Analyse de Données **Plateforme** : Backend Python + Frontend Next.js