227 lines
6.2 KiB
Markdown
227 lines
6.2 KiB
Markdown
# 📚 Documentation Utilisateur
|
|
|
|
Bienvenue dans la documentation complète de l'application d'analyse de données statistiques.
|
|
|
|
---
|
|
|
|
## 📖 Guides Disponibles
|
|
|
|
### 🚀 [Guide Utilisateur Principal](USER_GUIDE.md)
|
|
**Point de départ recommandé**
|
|
|
|
- Démarrage rapide
|
|
- Vue d'ensemble des fonctionnalités
|
|
- Workflow d'analyse complet
|
|
- Cas d'usage pratiques
|
|
- FAQ et glossaire
|
|
|
|
**À lire si vous découvrez l'application**
|
|
|
|
---
|
|
|
|
### 🔗 [Guide de la Corrélation](CORRELATION_GUIDE.md)
|
|
**Analyser les relations entre variables**
|
|
|
|
- Qu'est-ce que la corrélation ?
|
|
- Les 3 méthodes (Pearson, Spearman, Kendall)
|
|
- Interpréter la matrice de corrélation
|
|
- Comprendre la multicolinéarité
|
|
- P-values et significativité
|
|
- Bonnes pratiques et exemples
|
|
|
|
**À lire pour :** Choisir les bons prédicteurs, éviter la multicolinéarité
|
|
|
|
---
|
|
|
|
### 📈 [Guide de la Régression](REGRESSION_GUIDE.md)
|
|
**Modéliser et prédire des phénomènes**
|
|
|
|
- Concepts fondamentaux
|
|
- 4 types de modèles (linéaire, logistique, polynomial, exponentielle)
|
|
- Configuration du modèle
|
|
- Interprétation des coefficients
|
|
- Métriques de qualité (R², AIC, BIC)
|
|
- Équations exportables (Python, Excel, LaTeX)
|
|
- Diagnostics graphiques
|
|
- Exemples détaillés
|
|
|
|
**À lire pour :** Construire des modèles prédictifs robustes
|
|
|
|
---
|
|
|
|
### 🔍 [Guide des Outliers](OUTLIER_GUIDE.md)
|
|
**Gérer les valeurs aberrantes**
|
|
|
|
- Définition et types d'outliers
|
|
- Méthodes de détection (IQR, Isolation Forest)
|
|
- Indicateurs visuels (🔴 rouge, 🟣 violet)
|
|
- Processus de gestion
|
|
- Impact sur les analyses
|
|
- Bonnes pratiques
|
|
- Cas concrets
|
|
|
|
**À lire pour :** Garantir la qualité de vos analyses
|
|
|
|
---
|
|
|
|
## 🎯 Parcours Recommandé
|
|
|
|
### Débutant
|
|
```
|
|
1. USER_GUIDE.md (Comprendre l'application)
|
|
2. CORRELATION_GUIDE.md (Explorer les relations)
|
|
3. REGRESSION_GUIDE.md (Premiers modèles)
|
|
```
|
|
|
|
### Intermédiaire
|
|
```
|
|
1. CORRELATION_GUIDE.md (Multicolinéarité)
|
|
2. REGRESSION_GUIDE.md (Modèles avancés)
|
|
3. OUTLIER_GUIDE.md (Nettoyage des données)
|
|
```
|
|
|
|
### Expert
|
|
```
|
|
1. OUTLIER_GUIDE.md (Gestion avancée)
|
|
2. REGRESSION_GUIDE.md (Interprétation détaillée)
|
|
3. CORRELATION_GUIDE.md (Choix des méthodes)
|
|
```
|
|
|
|
---
|
|
|
|
## 📊 Résumé des Fonctionnalités
|
|
|
|
### Corrélation 📊
|
|
- Matrice de corrélation avec heatmap
|
|
- 3 méthodes (Pearson, Spearman, Kendall)
|
|
- Détection de multicolinéarité (≥0.7)
|
|
- P-values et significativité
|
|
- Export CSV
|
|
|
|
### Régression 📈
|
|
- 4 types de modèles (linéaire, logistique, polynomial, exponentielle)
|
|
- Sélection automatique des variables (importance)
|
|
- Interactions et termes polynomiaux
|
|
- Équations exportables (Python, Excel, LaTeX)
|
|
- Graphiques diagnostiques (fit, partial regression, parity plot)
|
|
- Métriques complètes (R², coefficients, p-values)
|
|
|
|
### Outliers 🔍
|
|
- Détection univariée (IQR)
|
|
- Détection multivariée (Isolation Forest)
|
|
- Indicateurs visuels (🔴 rouge, 🟣 violet)
|
|
- Processus d'exclusion
|
|
- Raisons détaillées
|
|
|
|
---
|
|
|
|
## 🔍 Recherche Rapide
|
|
|
|
### Je veux...
|
|
|
|
**Comprendre mes données**
|
|
→ [Guide Corrélation](CORRELATION_GUIDE.md)
|
|
|
|
**Prédire une variable**
|
|
→ [Guide Régression](REGRESSION_GUIDE.md)
|
|
|
|
**Nettoyer mes données**
|
|
→ [Guide Outliers](OUTLIER_GUIDE.md)
|
|
|
|
**Choisir les bons prédicteurs**
|
|
→ [Guide Corrélation - Multicolinéarité](CORRELATION_GUIDE.md#multicolinéarité)
|
|
|
|
**Interpréter les coefficients**
|
|
→ [Guide Régression - Interprétation](REGRESSION_GUIDE.md#interprétation-des-résultats)
|
|
|
|
**Comprendre le R²**
|
|
→ [Guide Régression - Métriques](REGRESSION_GUIDE.md#métriques-de-qualité-du-modèle)
|
|
|
|
**Exporter l'équation**
|
|
→ [Guide Régression - Équations](REGRESSION_GUIDE.md#équations-du-modèle)
|
|
|
|
**Gérer les valeurs extrêmes**
|
|
→ [Guide Outliers](OUTLIER_GUIDE.md)
|
|
|
|
---
|
|
|
|
## 📝 Glossaire
|
|
|
|
### Termes Clés
|
|
|
|
- **Corrélation** : Force et direction d'une relation entre deux variables
|
|
- **Multicolinéarité** : Forte corrélation entre prédicteurs (problématique)
|
|
- **Outlier** : Valeur aberrante qui s'écarte du reste des données
|
|
- **R²** : Proportion de variance expliquée par le modèle (0 à 1)
|
|
- **P-value** : Probabilité que le résultat soit dû au hasard (< 0.05 = significatif)
|
|
- **Coefficient** : Impact moyen d'une variable sur la cible
|
|
- **IQR** : Interquartile Range (Q3 - Q1), utilisé pour détecter les outliers
|
|
- **Isolation Forest** : Algorithme de détection d'anomalies multivariées
|
|
- **Régression** : Méthode pour modéliser la relation entre variables
|
|
|
|
---
|
|
|
|
## 🚦 Codes Couleurs
|
|
|
|
### Dans la documentation
|
|
- 📊 **Information** : Définitions et concepts
|
|
- ✅ **Bon** : Bonne pratique
|
|
- ❌ **Mauvais** : Erreur à éviter
|
|
- ⚠️ **Attention** : Point important ou risqué
|
|
- 🔍 **Investigation** : Analyse nécessaire
|
|
- 🎯 **Objectif** : But à atteindre
|
|
|
|
### Dans l'application
|
|
- 🔴 **Rouge** : Outlier univarié ou corrélation négative forte
|
|
- 🟣 **Violet** : Outlier multivarié
|
|
- 🟢 **Vert** : Significatif ou fiable
|
|
- 🔵 **Bleu** : Corrélation positive forte
|
|
|
|
---
|
|
|
|
## 📞 Support et Ressources
|
|
|
|
### Documentation Technique
|
|
- Code source : `/backend/app/core/engine/`
|
|
- API endpoints : `/backend/app/api/v1/`
|
|
- Frontend : `/frontend/src/features/`
|
|
|
|
### Standards Statistiques
|
|
- [Pearson Correlation](https://en.wikipedia.org/wiki/Pearson_correlation_coefficient)
|
|
- [Spearman's Rank](https://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient)
|
|
- [Linear Regression](https://en.wikipedia.org/wiki/Linear_regression)
|
|
- [Isolation Forest](https://en.wikipedia.org/wiki/Isolation_forest)
|
|
|
|
---
|
|
|
|
## 📅 Mises à Jour
|
|
|
|
**Version actuelle** : 1.0
|
|
**Dernière mise à jour** : Janvier 2026
|
|
|
|
### Changements récents
|
|
- ✅ Documentation complète créée
|
|
- ✅ Guides utilisateurs détaillés
|
|
- ✅ Exemples concrets
|
|
- ✅ Glossaire et parcours recommandés
|
|
|
|
---
|
|
|
|
## 🎓 Bonnes Analyses !
|
|
|
|
Cette documentation est conçue pour vous accompagner à chaque étape de vos analyses statistiques.
|
|
|
|
**Rappelez-vous** :
|
|
- 📊 **Vérifiez toujours** la corrélation avant de régresser
|
|
- 🔍 **Investiguez** les outliers avant de les exclure
|
|
- 📈 **Interprétez** les coefficients (pas juste le R²)
|
|
- ✅ **Documentez** vos décisions
|
|
|
|
Bonne découverte de l'application !
|
|
|
|
---
|
|
|
|
**Version** : 1.0
|
|
**Projet** : Application Web d'Analyse de Données
|
|
**Plateforme** : Backend Python + Frontend Next.js
|