StochastiQdata

Documentation — Coûts Médicaux Personnels

Référence complète pour utiliser ce dataset

Santé Pricing GLM
Retour au dataset

Description

1 338 assurés avec coût médical individuel annuel. Variables : âge, sexe, IMC, nombre d'enfants, tabagisme, région. Dataset de référence pour la régression des dépenses de santé et la tarification assurance santé.

Source

Kaggle

Lignes

1 338

Colonnes

7

Taille

Licence

cc0

Variable cible

charges

Date création

10/03/2026

Format

CSV

Domaines

Santé, Pricing, GLM

Dictionnaire des variables

Le dictionnaire des variables n'est pas encore renseigné pour ce dataset.

Les statistiques automatiques sont disponibles dans l'onglet Statistiques & Profil.

Comment utiliser ce dataset

import pandas as pd

# Charger le dataset
df = pd.read_csv("https://mjqtthaypifkdlaneymx.supabase.co/storage/v1/object/public/datasets-files/ad5761c3-82c6-4918-aa05-3eac8ed20dab/8f5e4ba0-fa53-40fe-8aac-2d2a98e12c49.csv")

# Aperçu rapide
print(df.shape)        # (1338, 7)
print(df.dtypes)
print(df.describe())
df.head(10)

# Variable cible
X = df.drop(columns=["charges"])
y = df["charges"]

Citation & Licence

Licence

cc0

Format BibTeX

@dataset{co_ts_m_dicaux_personnels_2026,
  title  = {Coûts Médicaux Personnels},
  author = {StochastiQdata},
  year   = {2026},
  url    = {https://stochastiqdata.com/modeling/ad5761c3-82c6-4918-aa05-3eac8ed20dab},
  note   = {Dataset pour actuaires}
}

Format APA

StochastiQdata. (2026). Coûts Médicaux Personnels [Dataset].
  https://stochastiqdata.com/modeling/ad5761c3-82c6-4918-aa05-3eac8ed20dab