Dataset:heart disease数据集的简介、下载、使用方法之详细攻略

网友投稿 329 2022-09-04

Dataset:heart disease数据集的简介、下载、使用方法之详细攻略

Dataset:heart disease数据集的简介、下载、使用方法之详细攻略

目录

​​heart disease数据集的简介​​

​​1、数据集简介​​

​​heart disease数据集的下载​​

​​heart disease数据集的使用方法​​

heart disease数据集的简介

预测患者的病情,同时指出哪些变量对心脏病的可能性有显著影响。         最初,数据集来自美国疾病控制与预防中心,是行为风险因素监测系统(BRFSS)的主要组成部分,该系统每年进行电话调查,以收集美国居民的健康状况数据。正如CDC所描述的那样:“BRFSS成立于1984年,有15个州,现在收集所有50 个州以及哥伦比亚特区和三个美国领土的数据。BRFSS每年完成超过40万次成人访谈,使其成为世界上最大的持续进行的健康调查系统。最近的数据集(截至2022年2月15日)包括2020年的数据。它包含401958行和279列。绝大多数专栏都是询问受访者健康状况的问题,比如“你走路或爬楼梯有严重困难吗?”或者“你一生中吸过至少100支烟吗?”【注:5包= 100支香烟】”。在这个数据集中,我注意到许多不同的因素(问题)直接或间接影响心脏病,所以我决定从它中选择最相关的变量,并进行一些清理,以便它可以用于机器学习项目。         如上所述,原来将近300个变量的数据集被缩减到只有大约20个变量。除了经典的EDA之外,这个数据集还可以用于应用一系列机器学习方法,最显著的是分类器模型(逻辑回归、SVM、随机森林等)。应该将变量“心脏病”作为一个二元—受访者是否患有心脏病。但是请注意,类是不平衡的,所以经典的模型应用程序方法是不可取的。修正权重/欠采样应该会产生更好的结果。         heart disease数据集是2020年CDC对40万成年人健康状况的年度调查数据。

相关地址:​​Personal Key Indicators of Heart Disease | Kaggle​​

1、数据集简介

英文

中文

备注

HeartDisease

是否为曾报告患有冠心病(CHD)或心肌梗死(MI)的受访者

yes/no

BMI

体重指数(BMI)


Smoking

你一生中吸过至少100支烟吗?【注:5包= 100支香烟】

yes/no

AlcoholDrinking

重度饮酒者(成年男性每周饮酒超过14杯,成年女性每周饮酒超过7杯

yes/no

Stroke

(曾经告诉过)有人告诉过你中风吗?

yes/no

PhysicalHealth

现在想想你的身体健康,包括身体疾病和受伤,在过去的30天里有多少天你的身体健康状况不好?(0~30天)


MentalHealth

想想你的心理健康,在过去的30天里,有多少天你的心理健康状况不好?(0~30天)


DiffWalking

你走路或爬楼梯有严重困难吗?

yes/no

Sex

你是男性还是女性?

Male/Female

AgeCategory

Fourteen-level年龄范畴

14个阶段,18~24,25~29,30~34 ,35~39,40~44,45~49,50~54,55~59,60~64,65~69,70~74,75~79,80 or older ;

Race

种族

6个类别,American Indi an/Alaskan Native,Asian,Black,White,Hispanic,other

Diabetic

(曾经告诉过)有人告诉过你有糖尿病吗?

4个选项,No、"No,borderline diabetes"、Yes、"Yes (during pregnancy)"

PhysicalActivity

在过去30天内,报告在正常工作以外进行体育活动或锻炼的成年人

yes/no

GenHealth

总的来说你的健康状况是…

5个选项,Excellert、Fair、Good、Poor、very good

SleepTime

平均来说,你在24小时内睡了多少个小时?

1~24

Asthma

(曾经告诉过)有人告诉过你有哮喘吗?

yes/no

KidneyDisease

不包括肾结石、膀胱感染或尿失禁,你曾被告知有肾脏疾病吗?

yes/no

SkinCancer

(曾经告诉过)有人告诉过你有皮肤癌吗?

yes/no

heart disease数据集的下载

数据集下载地址:​​​disease数据集的使用方法

相关文章

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:C#中IEnumerable、ICollection、IList、IQueryable 、IQueryable 、List之间的区别
下一篇:ERP员工入职登记(五)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~