Files

227 lines
6.2 KiB
Markdown

# 📚 Documentation Utilisateur
Bienvenue dans la documentation complète de l'application d'analyse de données statistiques.
---
## 📖 Guides Disponibles
### 🚀 [Guide Utilisateur Principal](USER_GUIDE.md)
**Point de départ recommandé**
- Démarrage rapide
- Vue d'ensemble des fonctionnalités
- Workflow d'analyse complet
- Cas d'usage pratiques
- FAQ et glossaire
**À lire si vous découvrez l'application**
---
### 🔗 [Guide de la Corrélation](CORRELATION_GUIDE.md)
**Analyser les relations entre variables**
- Qu'est-ce que la corrélation ?
- Les 3 méthodes (Pearson, Spearman, Kendall)
- Interpréter la matrice de corrélation
- Comprendre la multicolinéarité
- P-values et significativité
- Bonnes pratiques et exemples
**À lire pour :** Choisir les bons prédicteurs, éviter la multicolinéarité
---
### 📈 [Guide de la Régression](REGRESSION_GUIDE.md)
**Modéliser et prédire des phénomènes**
- Concepts fondamentaux
- 4 types de modèles (linéaire, logistique, polynomial, exponentielle)
- Configuration du modèle
- Interprétation des coefficients
- Métriques de qualité (R², AIC, BIC)
- Équations exportables (Python, Excel, LaTeX)
- Diagnostics graphiques
- Exemples détaillés
**À lire pour :** Construire des modèles prédictifs robustes
---
### 🔍 [Guide des Outliers](OUTLIER_GUIDE.md)
**Gérer les valeurs aberrantes**
- Définition et types d'outliers
- Méthodes de détection (IQR, Isolation Forest)
- Indicateurs visuels (🔴 rouge, 🟣 violet)
- Processus de gestion
- Impact sur les analyses
- Bonnes pratiques
- Cas concrets
**À lire pour :** Garantir la qualité de vos analyses
---
## 🎯 Parcours Recommandé
### Débutant
```
1. USER_GUIDE.md (Comprendre l'application)
2. CORRELATION_GUIDE.md (Explorer les relations)
3. REGRESSION_GUIDE.md (Premiers modèles)
```
### Intermédiaire
```
1. CORRELATION_GUIDE.md (Multicolinéarité)
2. REGRESSION_GUIDE.md (Modèles avancés)
3. OUTLIER_GUIDE.md (Nettoyage des données)
```
### Expert
```
1. OUTLIER_GUIDE.md (Gestion avancée)
2. REGRESSION_GUIDE.md (Interprétation détaillée)
3. CORRELATION_GUIDE.md (Choix des méthodes)
```
---
## 📊 Résumé des Fonctionnalités
### Corrélation 📊
- Matrice de corrélation avec heatmap
- 3 méthodes (Pearson, Spearman, Kendall)
- Détection de multicolinéarité (≥0.7)
- P-values et significativité
- Export CSV
### Régression 📈
- 4 types de modèles (linéaire, logistique, polynomial, exponentielle)
- Sélection automatique des variables (importance)
- Interactions et termes polynomiaux
- Équations exportables (Python, Excel, LaTeX)
- Graphiques diagnostiques (fit, partial regression, parity plot)
- Métriques complètes (R², coefficients, p-values)
### Outliers 🔍
- Détection univariée (IQR)
- Détection multivariée (Isolation Forest)
- Indicateurs visuels (🔴 rouge, 🟣 violet)
- Processus d'exclusion
- Raisons détaillées
---
## 🔍 Recherche Rapide
### Je veux...
**Comprendre mes données**
→ [Guide Corrélation](CORRELATION_GUIDE.md)
**Prédire une variable**
→ [Guide Régression](REGRESSION_GUIDE.md)
**Nettoyer mes données**
→ [Guide Outliers](OUTLIER_GUIDE.md)
**Choisir les bons prédicteurs**
→ [Guide Corrélation - Multicolinéarité](CORRELATION_GUIDE.md#multicolinéarité)
**Interpréter les coefficients**
→ [Guide Régression - Interprétation](REGRESSION_GUIDE.md#interprétation-des-résultats)
**Comprendre le R²**
→ [Guide Régression - Métriques](REGRESSION_GUIDE.md#métriques-de-qualité-du-modèle)
**Exporter l'équation**
→ [Guide Régression - Équations](REGRESSION_GUIDE.md#équations-du-modèle)
**Gérer les valeurs extrêmes**
→ [Guide Outliers](OUTLIER_GUIDE.md)
---
## 📝 Glossaire
### Termes Clés
- **Corrélation** : Force et direction d'une relation entre deux variables
- **Multicolinéarité** : Forte corrélation entre prédicteurs (problématique)
- **Outlier** : Valeur aberrante qui s'écarte du reste des données
- **R²** : Proportion de variance expliquée par le modèle (0 à 1)
- **P-value** : Probabilité que le résultat soit dû au hasard (< 0.05 = significatif)
- **Coefficient** : Impact moyen d'une variable sur la cible
- **IQR** : Interquartile Range (Q3 - Q1), utilisé pour détecter les outliers
- **Isolation Forest** : Algorithme de détection d'anomalies multivariées
- **Régression** : Méthode pour modéliser la relation entre variables
---
## 🚦 Codes Couleurs
### Dans la documentation
- 📊 **Information** : Définitions et concepts
-**Bon** : Bonne pratique
-**Mauvais** : Erreur à éviter
- ⚠️ **Attention** : Point important ou risqué
- 🔍 **Investigation** : Analyse nécessaire
- 🎯 **Objectif** : But à atteindre
### Dans l'application
- 🔴 **Rouge** : Outlier univarié ou corrélation négative forte
- 🟣 **Violet** : Outlier multivarié
- 🟢 **Vert** : Significatif ou fiable
- 🔵 **Bleu** : Corrélation positive forte
---
## 📞 Support et Ressources
### Documentation Technique
- Code source : `/backend/app/core/engine/`
- API endpoints : `/backend/app/api/v1/`
- Frontend : `/frontend/src/features/`
### Standards Statistiques
- [Pearson Correlation](https://en.wikipedia.org/wiki/Pearson_correlation_coefficient)
- [Spearman's Rank](https://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient)
- [Linear Regression](https://en.wikipedia.org/wiki/Linear_regression)
- [Isolation Forest](https://en.wikipedia.org/wiki/Isolation_forest)
---
## 📅 Mises à Jour
**Version actuelle** : 1.0
**Dernière mise à jour** : Janvier 2026
### Changements récents
- ✅ Documentation complète créée
- ✅ Guides utilisateurs détaillés
- ✅ Exemples concrets
- ✅ Glossaire et parcours recommandés
---
## 🎓 Bonnes Analyses !
Cette documentation est conçue pour vous accompagner à chaque étape de vos analyses statistiques.
**Rappelez-vous** :
- 📊 **Vérifiez toujours** la corrélation avant de régresser
- 🔍 **Investiguez** les outliers avant de les exclure
- 📈 **Interprétez** les coefficients (pas juste le R²)
-**Documentez** vos décisions
Bonne découverte de l'application !
---
**Version** : 1.0
**Projet** : Application Web d'Analyse de Données
**Plateforme** : Backend Python + Frontend Next.js