StochastiQdata

Détection Fraude Déclarations Assurance

Kaggle

Données de déclarations de sinistres assurance avec label de fraude. Couvre plusieurs lignes : auto, incendie, habitation. Variables : profil assuré, circonstances sinistre, historique police.

IARD Fraude

Score qualité — 0/100

  • · Complétude des métadonnées
  • · Taux de valeurs nulles
  • · Présence d'un dictionnaire
  • · Avis et téléchargements
  • · Disponibilité des benchmarks
0

Informations sur les données

15 420

Lignes

40

Colonnes

2.96

MB

0

Avis

Variable cible

fraud_reported

Licence

CC0 1.0 (domaine public)

Intégrité SHA256

3b080b3f7d8832ba9d3a4d691f720b3439fd367508b86447fe47f3cb5572aa5b

Ce que vous pouvez apprendre avec ce dataset

Compétences techniques

  • Modélisation GLM (Poisson, Gamma, Tweedie)
  • Calcul de la prime pure et technique
  • Classification binaire et gestion du déséquilibre
  • Feature engineering pour détection d'anomalies
  • Validation croisée et évaluation des modèles

Applications métier

  • Tarification automobile ou MRH
  • Analyse de sinistralité
  • Système de scoring anti-fraude
  • Priorisation des dossiers à contrôler

Aperçu des données (10 premières lignes) Cliquez sur une ligne pour l'agrandir

Statistiques & Profil des données

Distributions des variables

Matrice de corrélation (variables numériques)

−1 (corrélation négative) → +1 (corrélation positive)

Visualisations des données

Basées sur les données réelles du dataset

Chargement…