227 lines
6.2 KiB
Markdown
227 lines
6.2 KiB
Markdown
# 📚 Documentation Utilisateur
|
||
|
||
Bienvenue dans la documentation complète de l'application d'analyse de données statistiques.
|
||
|
||
---
|
||
|
||
## 📖 Guides Disponibles
|
||
|
||
### 🚀 [Guide Utilisateur Principal](USER_GUIDE.md)
|
||
**Point de départ recommandé**
|
||
|
||
- Démarrage rapide
|
||
- Vue d'ensemble des fonctionnalités
|
||
- Workflow d'analyse complet
|
||
- Cas d'usage pratiques
|
||
- FAQ et glossaire
|
||
|
||
**À lire si vous découvrez l'application**
|
||
|
||
---
|
||
|
||
### 🔗 [Guide de la Corrélation](CORRELATION_GUIDE.md)
|
||
**Analyser les relations entre variables**
|
||
|
||
- Qu'est-ce que la corrélation ?
|
||
- Les 3 méthodes (Pearson, Spearman, Kendall)
|
||
- Interpréter la matrice de corrélation
|
||
- Comprendre la multicolinéarité
|
||
- P-values et significativité
|
||
- Bonnes pratiques et exemples
|
||
|
||
**À lire pour :** Choisir les bons prédicteurs, éviter la multicolinéarité
|
||
|
||
---
|
||
|
||
### 📈 [Guide de la Régression](REGRESSION_GUIDE.md)
|
||
**Modéliser et prédire des phénomènes**
|
||
|
||
- Concepts fondamentaux
|
||
- 4 types de modèles (linéaire, logistique, polynomial, exponentielle)
|
||
- Configuration du modèle
|
||
- Interprétation des coefficients
|
||
- Métriques de qualité (R², AIC, BIC)
|
||
- Équations exportables (Python, Excel, LaTeX)
|
||
- Diagnostics graphiques
|
||
- Exemples détaillés
|
||
|
||
**À lire pour :** Construire des modèles prédictifs robustes
|
||
|
||
---
|
||
|
||
### 🔍 [Guide des Outliers](OUTLIER_GUIDE.md)
|
||
**Gérer les valeurs aberrantes**
|
||
|
||
- Définition et types d'outliers
|
||
- Méthodes de détection (IQR, Isolation Forest)
|
||
- Indicateurs visuels (🔴 rouge, 🟣 violet)
|
||
- Processus de gestion
|
||
- Impact sur les analyses
|
||
- Bonnes pratiques
|
||
- Cas concrets
|
||
|
||
**À lire pour :** Garantir la qualité de vos analyses
|
||
|
||
---
|
||
|
||
## 🎯 Parcours Recommandé
|
||
|
||
### Débutant
|
||
```
|
||
1. USER_GUIDE.md (Comprendre l'application)
|
||
2. CORRELATION_GUIDE.md (Explorer les relations)
|
||
3. REGRESSION_GUIDE.md (Premiers modèles)
|
||
```
|
||
|
||
### Intermédiaire
|
||
```
|
||
1. CORRELATION_GUIDE.md (Multicolinéarité)
|
||
2. REGRESSION_GUIDE.md (Modèles avancés)
|
||
3. OUTLIER_GUIDE.md (Nettoyage des données)
|
||
```
|
||
|
||
### Expert
|
||
```
|
||
1. OUTLIER_GUIDE.md (Gestion avancée)
|
||
2. REGRESSION_GUIDE.md (Interprétation détaillée)
|
||
3. CORRELATION_GUIDE.md (Choix des méthodes)
|
||
```
|
||
|
||
---
|
||
|
||
## 📊 Résumé des Fonctionnalités
|
||
|
||
### Corrélation 📊
|
||
- Matrice de corrélation avec heatmap
|
||
- 3 méthodes (Pearson, Spearman, Kendall)
|
||
- Détection de multicolinéarité (≥0.7)
|
||
- P-values et significativité
|
||
- Export CSV
|
||
|
||
### Régression 📈
|
||
- 4 types de modèles (linéaire, logistique, polynomial, exponentielle)
|
||
- Sélection automatique des variables (importance)
|
||
- Interactions et termes polynomiaux
|
||
- Équations exportables (Python, Excel, LaTeX)
|
||
- Graphiques diagnostiques (fit, partial regression, parity plot)
|
||
- Métriques complètes (R², coefficients, p-values)
|
||
|
||
### Outliers 🔍
|
||
- Détection univariée (IQR)
|
||
- Détection multivariée (Isolation Forest)
|
||
- Indicateurs visuels (🔴 rouge, 🟣 violet)
|
||
- Processus d'exclusion
|
||
- Raisons détaillées
|
||
|
||
---
|
||
|
||
## 🔍 Recherche Rapide
|
||
|
||
### Je veux...
|
||
|
||
**Comprendre mes données**
|
||
→ [Guide Corrélation](CORRELATION_GUIDE.md)
|
||
|
||
**Prédire une variable**
|
||
→ [Guide Régression](REGRESSION_GUIDE.md)
|
||
|
||
**Nettoyer mes données**
|
||
→ [Guide Outliers](OUTLIER_GUIDE.md)
|
||
|
||
**Choisir les bons prédicteurs**
|
||
→ [Guide Corrélation - Multicolinéarité](CORRELATION_GUIDE.md#multicolinéarité)
|
||
|
||
**Interpréter les coefficients**
|
||
→ [Guide Régression - Interprétation](REGRESSION_GUIDE.md#interprétation-des-résultats)
|
||
|
||
**Comprendre le R²**
|
||
→ [Guide Régression - Métriques](REGRESSION_GUIDE.md#métriques-de-qualité-du-modèle)
|
||
|
||
**Exporter l'équation**
|
||
→ [Guide Régression - Équations](REGRESSION_GUIDE.md#équations-du-modèle)
|
||
|
||
**Gérer les valeurs extrêmes**
|
||
→ [Guide Outliers](OUTLIER_GUIDE.md)
|
||
|
||
---
|
||
|
||
## 📝 Glossaire
|
||
|
||
### Termes Clés
|
||
|
||
- **Corrélation** : Force et direction d'une relation entre deux variables
|
||
- **Multicolinéarité** : Forte corrélation entre prédicteurs (problématique)
|
||
- **Outlier** : Valeur aberrante qui s'écarte du reste des données
|
||
- **R²** : Proportion de variance expliquée par le modèle (0 à 1)
|
||
- **P-value** : Probabilité que le résultat soit dû au hasard (< 0.05 = significatif)
|
||
- **Coefficient** : Impact moyen d'une variable sur la cible
|
||
- **IQR** : Interquartile Range (Q3 - Q1), utilisé pour détecter les outliers
|
||
- **Isolation Forest** : Algorithme de détection d'anomalies multivariées
|
||
- **Régression** : Méthode pour modéliser la relation entre variables
|
||
|
||
---
|
||
|
||
## 🚦 Codes Couleurs
|
||
|
||
### Dans la documentation
|
||
- 📊 **Information** : Définitions et concepts
|
||
- ✅ **Bon** : Bonne pratique
|
||
- ❌ **Mauvais** : Erreur à éviter
|
||
- ⚠️ **Attention** : Point important ou risqué
|
||
- 🔍 **Investigation** : Analyse nécessaire
|
||
- 🎯 **Objectif** : But à atteindre
|
||
|
||
### Dans l'application
|
||
- 🔴 **Rouge** : Outlier univarié ou corrélation négative forte
|
||
- 🟣 **Violet** : Outlier multivarié
|
||
- 🟢 **Vert** : Significatif ou fiable
|
||
- 🔵 **Bleu** : Corrélation positive forte
|
||
|
||
---
|
||
|
||
## 📞 Support et Ressources
|
||
|
||
### Documentation Technique
|
||
- Code source : `/backend/app/core/engine/`
|
||
- API endpoints : `/backend/app/api/v1/`
|
||
- Frontend : `/frontend/src/features/`
|
||
|
||
### Standards Statistiques
|
||
- [Pearson Correlation](https://en.wikipedia.org/wiki/Pearson_correlation_coefficient)
|
||
- [Spearman's Rank](https://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient)
|
||
- [Linear Regression](https://en.wikipedia.org/wiki/Linear_regression)
|
||
- [Isolation Forest](https://en.wikipedia.org/wiki/Isolation_forest)
|
||
|
||
---
|
||
|
||
## 📅 Mises à Jour
|
||
|
||
**Version actuelle** : 1.0
|
||
**Dernière mise à jour** : Janvier 2026
|
||
|
||
### Changements récents
|
||
- ✅ Documentation complète créée
|
||
- ✅ Guides utilisateurs détaillés
|
||
- ✅ Exemples concrets
|
||
- ✅ Glossaire et parcours recommandés
|
||
|
||
---
|
||
|
||
## 🎓 Bonnes Analyses !
|
||
|
||
Cette documentation est conçue pour vous accompagner à chaque étape de vos analyses statistiques.
|
||
|
||
**Rappelez-vous** :
|
||
- 📊 **Vérifiez toujours** la corrélation avant de régresser
|
||
- 🔍 **Investiguez** les outliers avant de les exclure
|
||
- 📈 **Interprétez** les coefficients (pas juste le R²)
|
||
- ✅ **Documentez** vos décisions
|
||
|
||
Bonne découverte de l'application !
|
||
|
||
---
|
||
|
||
**Version** : 1.0
|
||
**Projet** : Application Web d'Analyse de Données
|
||
**Plateforme** : Backend Python + Frontend Next.js
|