Indicateurs Santé Diabète (CDC BRFSS)

Kaggle

253 680 réponses à l'enquête CDC BRFSS 2015 avec indicateur diabète et 21 variables de santé. Idéal pour la classification risque diabète, modélisation de prévalence et segmentation risque santé.

Santé ML

Open in Kaggle Documentation Comparer Notebooks

Score qualité — 0/100

· Complétude des métadonnées
· Taux de valeurs nulles
· Présence d'un dictionnaire
· Avis et téléchargements
· Disponibilité des benchmarks

Informations sur les données

253 680

Lignes

Colonnes

21.68

Avis

Variable cible

Diabetes_binary

Période couverte

2015 – 2022

Licence

CC0 1.0 (domaine public)

Intégrité SHA256

19f367e3e3350768f0c144c5d73ee5b355f67a57eaaa86ca7bd8aec594d8b1d0

Ce que vous pouvez apprendre avec ce dataset

Compétences techniques

Modélisation des dépenses de santé
Segmentation et profils patients
Validation croisée et évaluation des modèles

Applications métier

Prévision des coûts de santé
Gestion des risques santé

Aperçu des données (10 premières lignes) Cliquez sur une ligne pour l'agrandir

Statistiques & Profil des données

Distributions des variables

Matrice de corrélation (variables numériques)

−1 (corrélation négative) → +1 (corrélation positive)

Visualisations des données

Basées sur les données réelles du dataset

Chargement…

Parcours data complet — de A à Z

Suivez chaque étape du travail data science appliqué sur ce dataset.

Accès au dataset

import pandas as pd

# Chargement direct depuis StochastiQdata
url = "https://mjqtthaypifkdlaneymx.supabase.co/storage/v1/object/public/datasets-files/2bda6025-daf4-4aea-9d9f-20cb92856a7e/9700ad76-2570-471a-a628-f8cc67bae730.csv"
df  = pd.read_csv(url)

# Aperçu
print(df.shape)   # (253 680 lignes, 22 colonnes)
print(df.head())

library(readr)

# Chargement direct depuis StochastiQdata
url <- "https://mjqtthaypifkdlaneymx.supabase.co/storage/v1/object/public/datasets-files/2bda6025-daf4-4aea-9d9f-20cb92856a7e/9700ad76-2570-471a-a628-f8cc67bae730.csv"
df  <- read_csv(url)

# Aperçu
dim(df)
head(df)

curl -L -o "indicateurs_santé_diabète_(cdc_brfss).csv" \
  "https://mjqtthaypifkdlaneymx.supabase.co/storage/v1/object/public/datasets-files/2bda6025-daf4-4aea-9d9f-20cb92856a7e/9700ad76-2570-471a-a628-f8cc67bae730.csv"

Benchmarks — Performance des modèles

Aucun benchmark disponible pour ce dataset.

Soyez le premier à soumettre vos résultats !

Modèles

Chargement des modèles…

Notebooks

Aucun notebook disponible pour ce dataset.

Partagez votre analyse et contribuez à la communauté !

Avis de la communauté

Aucun avis pour ce dataset.

Soyez le premier à donner votre avis !

Donner votre avis

Commentaires

Chargement…

Écrire un commentaire

Questions à explorer avec ce dataset

Quels profils de patients génèrent les dépenses de santé les plus élevées ?

Comment prédire le risque d'hospitalisation à 12 mois ?

Les pathologies chroniques expliquent-elles l'essentiel de la variance des coûts ?

Existe-t-il des clusters de patients avec des comportements de consommation similaires ?

Comment modéliser la récurrence des séjours hospitaliers ?

Quels indicateurs avancés permettent de détecter une dégradation de l'état de santé ?

Découvrez plus de cas d'usage et méthodologies sur notre page Modélisation

Voir tous les parcours

Indicateurs Santé Diabète (CDC BRFSS)

Informations sur les données

Ce que vous pouvez apprendre avec ce dataset

Compétences techniques

Applications métier

Aperçu des données (10 premières lignes) Cliquez sur une ligne pour l'agrandir

Statistiques & Profil des données

Distributions des variables

Matrice de corrélation (variables numériques)

Visualisations des données

Parcours data complet — de A à Z

Import des données de santé

Actions concrètes

Librairies & outils

Exemple de code

Nettoyage & Segmentation

Actions concrètes

Librairies & outils

Exemple de code

EDA — Profils de consommation

Actions concrètes

Librairies & outils

Exemple de code

Modélisation des coûts de santé

Actions concrètes

Librairies & outils

Exemple de code

Tarification & Chargements

Actions concrètes

Librairies & outils

Exemple de code

Validation & Équilibre technique

Actions concrètes

Librairies & outils

Exemple de code

Accès au dataset

Benchmarks — Performance des modèles

Modèles

Soumettre un modèle

Notebooks

Avis de la communauté

Donner votre avis

Commentaires

Écrire un commentaire

Questions à explorer avec ce dataset

Vous aimerez aussi

Citer ce dataset

Historique des versions 1 version