Analysis/docs/README.md
2026-01-11 22:56:02 +01:00

227 lines
6.2 KiB
Markdown
Raw Permalink Blame History

This file contains invisible Unicode characters

This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 📚 Documentation Utilisateur
Bienvenue dans la documentation complète de l'application d'analyse de données statistiques.
---
## 📖 Guides Disponibles
### 🚀 [Guide Utilisateur Principal](USER_GUIDE.md)
**Point de départ recommandé**
- Démarrage rapide
- Vue d'ensemble des fonctionnalités
- Workflow d'analyse complet
- Cas d'usage pratiques
- FAQ et glossaire
**À lire si vous découvrez l'application**
---
### 🔗 [Guide de la Corrélation](CORRELATION_GUIDE.md)
**Analyser les relations entre variables**
- Qu'est-ce que la corrélation ?
- Les 3 méthodes (Pearson, Spearman, Kendall)
- Interpréter la matrice de corrélation
- Comprendre la multicolinéarité
- P-values et significativité
- Bonnes pratiques et exemples
**À lire pour :** Choisir les bons prédicteurs, éviter la multicolinéarité
---
### 📈 [Guide de la Régression](REGRESSION_GUIDE.md)
**Modéliser et prédire des phénomènes**
- Concepts fondamentaux
- 4 types de modèles (linéaire, logistique, polynomial, exponentielle)
- Configuration du modèle
- Interprétation des coefficients
- Métriques de qualité (R², AIC, BIC)
- Équations exportables (Python, Excel, LaTeX)
- Diagnostics graphiques
- Exemples détaillés
**À lire pour :** Construire des modèles prédictifs robustes
---
### 🔍 [Guide des Outliers](OUTLIER_GUIDE.md)
**Gérer les valeurs aberrantes**
- Définition et types d'outliers
- Méthodes de détection (IQR, Isolation Forest)
- Indicateurs visuels (🔴 rouge, 🟣 violet)
- Processus de gestion
- Impact sur les analyses
- Bonnes pratiques
- Cas concrets
**À lire pour :** Garantir la qualité de vos analyses
---
## 🎯 Parcours Recommandé
### Débutant
```
1. USER_GUIDE.md (Comprendre l'application)
2. CORRELATION_GUIDE.md (Explorer les relations)
3. REGRESSION_GUIDE.md (Premiers modèles)
```
### Intermédiaire
```
1. CORRELATION_GUIDE.md (Multicolinéarité)
2. REGRESSION_GUIDE.md (Modèles avancés)
3. OUTLIER_GUIDE.md (Nettoyage des données)
```
### Expert
```
1. OUTLIER_GUIDE.md (Gestion avancée)
2. REGRESSION_GUIDE.md (Interprétation détaillée)
3. CORRELATION_GUIDE.md (Choix des méthodes)
```
---
## 📊 Résumé des Fonctionnalités
### Corrélation 📊
- Matrice de corrélation avec heatmap
- 3 méthodes (Pearson, Spearman, Kendall)
- Détection de multicolinéarité (≥0.7)
- P-values et significativité
- Export CSV
### Régression 📈
- 4 types de modèles (linéaire, logistique, polynomial, exponentielle)
- Sélection automatique des variables (importance)
- Interactions et termes polynomiaux
- Équations exportables (Python, Excel, LaTeX)
- Graphiques diagnostiques (fit, partial regression, parity plot)
- Métriques complètes (R², coefficients, p-values)
### Outliers 🔍
- Détection univariée (IQR)
- Détection multivariée (Isolation Forest)
- Indicateurs visuels (🔴 rouge, 🟣 violet)
- Processus d'exclusion
- Raisons détaillées
---
## 🔍 Recherche Rapide
### Je veux...
**Comprendre mes données**
→ [Guide Corrélation](CORRELATION_GUIDE.md)
**Prédire une variable**
→ [Guide Régression](REGRESSION_GUIDE.md)
**Nettoyer mes données**
→ [Guide Outliers](OUTLIER_GUIDE.md)
**Choisir les bons prédicteurs**
→ [Guide Corrélation - Multicolinéarité](CORRELATION_GUIDE.md#multicolinéarité)
**Interpréter les coefficients**
→ [Guide Régression - Interprétation](REGRESSION_GUIDE.md#interprétation-des-résultats)
**Comprendre le R²**
→ [Guide Régression - Métriques](REGRESSION_GUIDE.md#métriques-de-qualité-du-modèle)
**Exporter l'équation**
→ [Guide Régression - Équations](REGRESSION_GUIDE.md#équations-du-modèle)
**Gérer les valeurs extrêmes**
→ [Guide Outliers](OUTLIER_GUIDE.md)
---
## 📝 Glossaire
### Termes Clés
- **Corrélation** : Force et direction d'une relation entre deux variables
- **Multicolinéarité** : Forte corrélation entre prédicteurs (problématique)
- **Outlier** : Valeur aberrante qui s'écarte du reste des données
- **R²** : Proportion de variance expliquée par le modèle (0 à 1)
- **P-value** : Probabilité que le résultat soit dû au hasard (< 0.05 = significatif)
- **Coefficient** : Impact moyen d'une variable sur la cible
- **IQR** : Interquartile Range (Q3 - Q1), utilisé pour détecter les outliers
- **Isolation Forest** : Algorithme de détection d'anomalies multivariées
- **Régression** : Méthode pour modéliser la relation entre variables
---
## 🚦 Codes Couleurs
### Dans la documentation
- 📊 **Information** : Définitions et concepts
- **Bon** : Bonne pratique
- **Mauvais** : Erreur à éviter
- **Attention** : Point important ou risqué
- 🔍 **Investigation** : Analyse nécessaire
- 🎯 **Objectif** : But à atteindre
### Dans l'application
- 🔴 **Rouge** : Outlier univarié ou corrélation négative forte
- 🟣 **Violet** : Outlier multivarié
- 🟢 **Vert** : Significatif ou fiable
- 🔵 **Bleu** : Corrélation positive forte
---
## 📞 Support et Ressources
### Documentation Technique
- Code source : `/backend/app/core/engine/`
- API endpoints : `/backend/app/api/v1/`
- Frontend : `/frontend/src/features/`
### Standards Statistiques
- [Pearson Correlation](https://en.wikipedia.org/wiki/Pearson_correlation_coefficient)
- [Spearman's Rank](https://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient)
- [Linear Regression](https://en.wikipedia.org/wiki/Linear_regression)
- [Isolation Forest](https://en.wikipedia.org/wiki/Isolation_forest)
---
## 📅 Mises à Jour
**Version actuelle** : 1.0
**Dernière mise à jour** : Janvier 2026
### Changements récents
- Documentation complète créée
- Guides utilisateurs détaillés
- Exemples concrets
- Glossaire et parcours recommandés
---
## 🎓 Bonnes Analyses !
Cette documentation est conçue pour vous accompagner à chaque étape de vos analyses statistiques.
**Rappelez-vous** :
- 📊 **Vérifiez toujours** la corrélation avant de régresser
- 🔍 **Investiguez** les outliers avant de les exclure
- 📈 **Interprétez** les coefficients (pas juste le R²)
- **Documentez** vos décisions
Bonne découverte de l'application !
---
**Version** : 1.0
**Projet** : Application Web d'Analyse de Données
**Plateforme** : Backend Python + Frontend Next.js