StochastiQdata

Documentation — Données Clients Assurance Santé

Référence complète pour utiliser ce dataset

Santé Pricing
Retour au dataset

Description

Données clients d'une compagnie d'assurance santé. Variables : âge, sexe, historique médical, type de couverture et montant de la prime. Analyse de la rentabilité et segmentation des assurés.

Source

Kaggle

Lignes

50 000

Colonnes

14

Taille

Licence

cc0

Variable cible

claim

Date création

10/03/2026

Format

Domaines

Santé, Pricing

Dictionnaire des variables

Le dictionnaire des variables n'est pas encore renseigné pour ce dataset.

Les statistiques automatiques sont disponibles dans l'onglet Statistiques & Profil.

Comment utiliser ce dataset

import pandas as pd

# Charger le dataset
df = pd.read_csv("URL_DU_FICHIER")

# Aperçu rapide
print(df.shape)        # (50000, 14)
print(df.dtypes)
print(df.describe())
df.head(10)

# Variable cible
X = df.drop(columns=["claim"])
y = df["claim"]

Citation & Licence

Licence

cc0

Format BibTeX

@dataset{donn_es_clients_assurance_sant_2026,
  title  = {Données Clients Assurance Santé},
  author = {StochastiQdata},
  year   = {2026},
  url    = {https://stochastiqdata.com/modeling/0a12117c-d738-43f2-8f45-4bec7c5e3bc0},
  note   = {Dataset pour actuaires}
}

Format APA

StochastiQdata. (2026). Données Clients Assurance Santé [Dataset].
  https://stochastiqdata.com/modeling/0a12117c-d738-43f2-8f45-4bec7c5e3bc0