StochastiQdata

Documentation — Fréquence Sinistres Auto RC France (freMTPL2freq)

Référence complète pour utiliser ce dataset

IARD Pricing GLM
Retour au dataset

Description

678 013 polices d'assurance auto française RC. Variables tarifaires (puissance, âge conducteur, bonus-malus, région) et sinistralité (ClaimNb, Exposure). Référence académique Charpentier, Denuit & Trufin (ArXiv:2103.03635). Dataset de référence pour GLM Poisson fréquence.

Source

Kaggle

Lignes

678 013

Colonnes

12

Taille

Licence

cc-by

Variable cible

ClaimNb

Date création

10/03/2026

Format

CSV

Domaines

IARD, Pricing, GLM

Dictionnaire des variables

Le dictionnaire des variables n'est pas encore renseigné pour ce dataset.

Les statistiques automatiques sont disponibles dans l'onglet Statistiques & Profil.

Comment utiliser ce dataset

import pandas as pd

# Charger le dataset
df = pd.read_csv("https://mjqtthaypifkdlaneymx.supabase.co/storage/v1/object/public/datasets-files/caf2b6e4-532d-4d89-8227-f2e12afa2bc5/2f13f392-a56e-4725-837c-05d33873c69f.csv")

# Aperçu rapide
print(df.shape)        # (678013, 12)
print(df.dtypes)
print(df.describe())
df.head(10)

# Variable cible
X = df.drop(columns=["ClaimNb"])
y = df["ClaimNb"]

Citation & Licence

Licence

cc-by

Format BibTeX

@dataset{fr_quence_sinistres_auto_rc_france_fremtpl2freq_2026,
  title  = {Fréquence Sinistres Auto RC France (freMTPL2freq)},
  author = {StochastiQdata},
  year   = {2026},
  url    = {https://stochastiqdata.com/modeling/caf2b6e4-532d-4d89-8227-f2e12afa2bc5},
  note   = {Dataset pour actuaires}
}

Format APA

StochastiQdata. (2026). Fréquence Sinistres Auto RC France (freMTPL2freq) [Dataset].
  https://stochastiqdata.com/modeling/caf2b6e4-532d-4d89-8227-f2e12afa2bc5