本研究是一项以人群为基础的前瞻性队列研究,从2010年6至8月开展的基线调查中采用整群抽样的方法选取北京房山农村社区32个行政村登记的40岁及以上常住户籍居民,共计7 577人完成了心血管疾病及其相关危险因素的基线调查,包括完整的问卷调查、体格检查和生化检测[3]。基线调查后的随访工作包括每年的电话随访和每3年1次的现场随访,结合该地区的监测系统(包括健康档案和死因监测等常规监测以及村医提供的随访事件线索的定向监测),对冠心病、脑卒中、糖尿病、高血压及恶性肿瘤等主要慢性疾病的发病和死亡事件进行追踪调查,并通过连接医疗保险数据库和该地区主要二级医院的电子病历档案中的住院及死亡数据进行诊断核实。最近一次现场随访时间为2016年8月,电话随访时间为2017年1月,医疗保险和电子病历数据库记录核查时间为2017年1月,由于目前队列人群的随访周期未到10年,依照国际惯例[4]本研究将对基线无冠心病、脑卒中、心房颤动及心力衰竭病史的40~79岁人群进行5年ASCVD发病风险预测模型的评估。根据纳入排除标准,本研究的研究对象选择流程如
调查前对所有调查员集中进行统一培训;现场调查过程中由质控员核查全部问卷和体检表的完整性,并抽取1%复核其完整性、有效性;结局事件的随访和确认通过监测系统、电话和现场随访以及已覆盖99%以上人群的医疗保险系统,以有效减少低估或遗漏结局事件,并且通过医院数据库的核查确诊以降低高估结局事件的风险。生化检测符合北京市临床检验中心临床检验室间质量评价标准,具有严格的实验室内和实验室间的质量控制措施;数据录入过程中使用Epidata 3.0软件进行平行双录入,并设置逻辑核查。
目的 在中国北方农村人群的前瞻性队列中,独立验证并比较动脉粥样硬化性心血管疾病(atherosclerotic cardiovascular disease,ASCVD)5年发病风险预测模型的准确性,对模型的实际应用进行评价并提供证据。方法 研究对象为2010年6至8月参加基线调查并随访至2017年1月的6 489名基线调查时未患ASCVD的40~79岁北京房山农村人群,分别采用美国心脏病学会/美国心脏协会指南最新发布的汇总队列公式(pooled cohort equations,PCE)和中国动脉粥样硬化性心血管疾病风险预测研究(prediction for ASCVD risk in China,China-PAR)的模型计算预测的5年发病风险。通过Kaplan-Meier方法调整获得5年实际观察到的新发ASCVD事件(包括急性心肌梗死、冠心病死亡以及致死和非致死性脑卒中)的发病率,并计算预测风险/实际发病率的比值以评价验证队列中是否存在风险高估或低估。研究人群按照ASCVD预测风险分为4个类别(<5.0%、 5.0%~7.4%、 7.5%~9.9%以及≥10.0%)进行比较。采用区分度 C统计量、校准度卡方值以及校准图评估模型的预测准确性。结果 在本验证队列6 489名研究对象平均5.82年的随访时间内,共出现新发ASCVD事件955例。China-PAR模型高估了ASCVD的5年发病风险,再校准后对男性和女性的发病风险分别高估了22.2%和33.1%;而PCE模型的高估程度更严重,再校准后男性和女性分别高估了67.3%和53.1%。China-PAR和PCE模型的区分度接近, C统计量及其95%可信区间在男性中分别为0.696(0.669~0.723)和0.702(0.675~0.730),在女性中分别为0.709(0.690~0.728)和0.714(0.695~0.733)。China-PAR模型的校准度卡方值在男性和女性中分别为17.2和54.2,但PCE模型的校准度较差(男性和女性分别为192.0和181.2)。另外,只有China-PAR模型的校准图显示其预测风险与实际发病率的一致性较好,特别是在男性人群。结论 作为国内开展ASCVD风险评估和一级预防的工具,China-PAR模型对于中国北方农村人群ASCVD 5年发病风险的预测优于PCE模型,特别是在男性中更加准确。
Objective: To validate five-year risk prediction models for atherosclerotic cardiovascular di-sease (ASCVD) in a contemporary rural Northern Chinese population.Methods: Totally 6 489 rural adults aged 40 to 79 years without clinical ASCVD were enrolled at baseline between June and August 2010, and followed up through January 2017. Expected prediction risk using the China-PAR (prediction for ASCVD risk in China) model was compared with the pooled cohort equations (PCE) reported in the American College of Cardiology / American Heart Association guideline. Kaplan-Meier analysis was used to obtain the observed ASCVD event (including nonfatal myocardial infarction, coronary heart disease death, nonfatal or fatal stroke) rate at 5 years, and the expected-observed ratios were calculated to eva-luate overestimation or underestimation in the cohort. The participants in the cohort were divided into 4 categories (<5.0%, 5.0%-7.4%, 7.5%-9.9%, and ≥10.0%) for comparisons based on ASCVD prediction risk. The models were assessed by discrimination C statistic, calibration χ2, and calibration charts and plots for illustration as well.Results: Over an average 5.82 years of follow-up in this validation cohort with 6 489 rural Chinese participants, 955 subjects developed a first ASCVD event. Recalibrated China-PAR model overestimated ASCVD events by 22.2% in men and 33.1% in women, while the overestimations were much higher for recalibrated PCE as 67.3% in men and 53.1% in women. Gender-specific China-PAR model had C statistics of 0.696 (95% CI, 0.669-0.723) for men and 0.709 (95% CI, 0.690-0.728) for women, which were similar to those of 0.702 (95% CI, 0.675-0.730) for men and 0.714 (95% CI, 0.695-0.733) for women in the PCE. Calibration χ2 values in China-PAR were 17.2 and 54.2 for men and women, respectively; however, the PCE showed poorer ca-libration ( χ2=192.0 for men and χ2=181.2 for women). In addition, the calibration charts and plots illustrated good agreement between the observations and the predictions only in the China-PAR model, especially for men.Conclusion: In this validation cohort of rural Northern Chinese adults, the China-PAR model had better performance of five-year ASCVD risk prediction than the PCE, indicating that recalibrated China-PAR model might be an appropriate tool for risk assessment and primary prevention of ASCVD in China.
动脉粥样硬化性心血管疾病(atherosclerotic cardiovascular disease, ASCVD)主要包括冠心病、脑卒中以及其他外周血管疾病, 是目前全球范围内疾病死亡的首位原因。随着我国城镇化和老龄化的加速发展, ASCVD的流行已成为重要的公共卫生问题之一。ASCVD发病风险预测模型是开展心血管疾病一级预防的重要基础, 2013年美国心脏病学会(American College of Cardiology, ACC)/美国心脏协会(American Heart Association, AHA)联合在《2013年ACC/AHA心血管风险评估指南》中率先发布了汇总队列公式(pooled cohort equations, PCE), 用于美国白人和黑人10年ASCVD发病风险评估[1]; 2016年中国动脉粥样硬化性心血管疾病风险预测研究(prediction for ASCVD risk in China, China-PAR)也新开发了适用于中国人群的China-PAR模型[2]。对上述最新发布的预测模型进行外部验证, 将会直接影响到风险评估工具的推广和应用, 因此本研究在中国北方农村人群的前瞻性队列中, 独立验证并比较PCE和China-PAR模型的预测准确性, 为模型的实际应用评价提供证据。
本研究是一项以人群为基础的前瞻性队列研究, 从2010年6至8月开展的基线调查中采用整群抽样的方法选取北京房山农村社区32个行政村登记的40岁及以上常住户籍居民, 共计7 577人完成了心血管疾病及其相关危险因素的基线调查, 包括完整的问卷调查、体格检查和生化检测[3]。基线调查后的随访工作包括每年的电话随访和每3年1次的现场随访, 结合该地区的监测系统(包括健康档案和死因监测等常规监测以及村医提供的随访事件线索的定向监测), 对冠心病、脑卒中、糖尿病、高血压及恶性肿瘤等主要慢性疾病的发病和死亡事件进行追踪调查, 并通过连接医疗保险数据库和该地区主要二级医院的电子病历档案中的住院及死亡数据进行诊断核实。最近一次现场随访时间为2016年8月, 电话随访时间为2017年1月, 医疗保险和电子病历数据库记录核查时间为2017年1月, 由于目前队列人群的随访周期未到10年, 依照国际惯例[4]本研究将对基线无冠心病、脑卒中、心房颤动及心力衰竭病史的40~79岁人群进行5年ASCVD发病风险预测模型的评估。根据纳入排除标准, 本研究的研究对象选择流程如图1所示, 共有6 489名研究对象纳入最终的统计分析。本研究已通过北京大学生物医学伦理委员会的批准, 所有研究对象调查前均书面签署知情同意书。
参照ACC/AHA指南[1]及China-PAR研究[2]的预测模型中纳入的变量及定义, 本研究中ASCVD事件的定义主要包括脑卒中和冠心病的发病和死亡。脑卒中定义为急性进行性的血管源性中枢神经系统局灶性或大范围功能障碍(包括出血性、缺血性脑卒中), 且必须经过CT或MRI确诊(ICD-10编码为I60~I64、I67、I69); 冠心病定义为由冠状动脉器质性(动脉粥样硬化或动力性血管痉挛)狭窄或阻塞引起的心肌缺血缺氧(心绞痛)或心肌坏死(心肌梗死)(ICD-10编码为I20~I25)。上述诊断均需由二级及以上医院确诊。问卷调查中, ASCVD家族史定义为研究对象的父母或兄弟姐妹中至少一人有冠心病或脑卒中病史; 吸烟定义为平均每天吸纸烟1支(或采用其他吸烟方式消耗相当于1支纸烟的烟草量)及以上, 并已持续1年及以上; 糖尿病定义为空腹血糖水平≥ 7.0 mmol/L, 或2 h口服葡萄糖耐量试验≥ 11.1 mmol/L, 或有明确的糖尿病病史并在接受降糖药物治疗; 高血压治疗定义为调查前两周内规律服用降压药物进行治疗。体格检查过程中, 血压、身高、体重、腰围等指标采用标准、规范的方法进行测量。空腹抽取静脉血, 血脂生化指标使用7060型全自动生化分析仪(日本HITACHI公司)进行血清学检测。
调查前对所有调查员集中进行统一培训; 现场调查过程中由质控员核查全部问卷和体检表的完整性, 并抽取1%复核其完整性、有效性; 结局事件的随访和确认通过监测系统、电话和现场随访以及已覆盖99%以上人群的医疗保险系统, 以有效减少低估或遗漏结局事件, 并且通过医院数据库的核查确诊以降低高估结局事件的风险。生化检测符合北京市临床检验中心临床检验室间质量评价标准, 具有严格的实验室内和实验室间的质量控制措施; 数据录入过程中使用Epidata 3.0软件进行平行双录入, 并设置逻辑核查。
基线数据中连续变量用均数± 标准差表示, 分类变量用百分比(%)表示, 对非正态分布资料用对数转换后进行统计学检验, 均为双侧检验, 显著水平为α =0.05, 连续变量和分类变量分别采用t检验和卡方检验比较不同性别之间各模型预测变量的基线差异。5年ASCVD发病风险评分的预测值分别采用China-PAR模型[2]和美国白人的PCE模型[4]中各自的公式和参数分性别进行计算, 保持预测变量的系数不变, 并用本队列人群基线时危险因素水平以及ASCVD发病风险的均值进行再校准(recalibration)。ASCVD发病风险预测模型的验证包括区分度(discrimination)和校准度(calibration)的评估[5]:区分度是反映预测模型的风险评分正确区分早发病者为高风险的能力, 通常采用C统计量(Harrell’ s C statistics)评估受试者特征曲线的曲线下面积, 一般认为0.7以上较好; 校准度用来衡量预测模型估计的绝对风险的预测值与观察到的实际情况之间拟合的一致程度, 通常采用Hosmer-Lemeshow检验评价预测模型的校准度, 按照风险评分的预测值分为10组进行比较并作图表示, 总体χ 2< 20表示校准度好。根据ACC/AHA指南[1]的建议, 将研究对象按照5年ASCVD发病预测风险分为4类:< 5.0%、5.0%~7.4%、7.5%~9.9%以及≥ 10.0%, 每个分类中观察到的5年ASCVD实际发病率通过Kaplan-Meier分析获得, 并计算预测风险/实际发病率的比值(expected-observed ratio, EOR), EOR为1表示预测准确, EOR> 1表示高估风险, EOR< 1表示低估风险[6]。采用SAS 9.4软件进行统计分析。
本研究队列中40~79岁基线无ASCVD病史的研究对象共6 489人, 平均随访时间为(5.82± 1.14)年, 共计37 784.15人年, 研究人群的平均年龄55.5岁, 34.2%为男性(2 217/6 489), 基线特征如表1所示。结果显示, 男性比女性具有更高的吸烟率、腰围和血压水平, 但高血压治疗、ASCVD家族史和糖尿病的比例以及血脂水平低于女性。除了糖尿病的比例, 其余预测变量在男、女性之间的分布差异均有统计学意义(P< 0.05), 提示各类主要的心血管危险因素存在性别差异, 风险预测模型需分性别进行评估。在平均5.82年的随访周期内, 共发生955例ASCVD结局事件(其中男性343例、女性612例), 经过Kaplan-Meier方法调整后的5年ASCVD发病率男性高于女性。
与Kaplan-Meier方法调整后的5年ASCVD实际发病数(247.6)相比, 在男性中再校准后的China-PAR(302.6)和PCE(414.3)模型均显示预测发病数高估, 且PCE模型高估更严重(表2); 进一步计算EOR发现, 各模型在男性中EOR> 1, 均提示出现风险高估, 但相比于PCE模型风险高估的67.3%, China-PAR模型仅高估了22.2%。在男性中, China-PAR和PCE模型的C统计量及其95%可信区间分别为0.696(0.669~0.723)和0.702(0.675~0.730), 模型验证的区分度均在0.7左右, 提示China-PAR和PCE模型的区分度均较好, 但在男性中的校准度只有China-PAR模型的预测准确性较好(χ 2=17.2, P=0.028)。
根据ACC/AHA指南的风险分组, 分别比较风险高估的情况(图2), 发现在预测风险最高组(风险≥ 10%), 男性PCE模型高估的情况(84.6%)尤为严重(图2B), 而China-PAR模型仅高估了19.1%(图2A)。进一步按照10组风险划分, 绘制Hosmer-Lemeshow校准图(图3), 在男性中同样发现PCE模型偏离45° 的校准线, 而且预测风险越大偏离越远, 而China-PAR模型校准度较好, 与前述校准度χ 2的结果一致。因此, 在男性中China-PAR比PCE模型外部验证的预测准确性更好。
在女性中再校准后的China-PAR和PCE模型的验证也显示了预测风险的高估(表2), China-PAR模型在女性中的风险高估(33.1%)比在男性中严重, 而PCE模型在女性中的风险高估(53.1%)程度比在男性中略低。在女性中, China-PAR和PCE模型的C统计量及其95%可信区间分别为0.709(0.690~0.728)和0.714(0.695~0.733), 模型验证的区分度均比在男性中的值略高, 但在女性中的校准度均较差(P< 0.001)。
ACC/AHA指南的风险分组图显示, 在女性中预测风险最高组(风险≥ 10%), China-PAR模型和PCE模型的预测风险分别高估了58.2%和33.0%(图2B)。10组风险划分的Hosmer-Lemeshow校准图也发现, 在女性中无论是China-PAR模型还是PCE模型, 在最高风险组都偏离45° 的校准线较远(图3)。因此, 在女性中China-PAR模型外部验证的预测准确性不及在男性中的结果。
对风险预测模型的校准和人群绝对风险的评估将直接影响到ASCVD的风险分层, 以及后续在此基础上实施指南推荐的降脂治疗等干预措施[7]。ACC/AHA最新的PCE模型虽然可以用来评估包括脑卒中和冠心病在内的ASCVD发病风险[1], 但由于心血管疾病谱、危险因素流行情况等差异, 国外队列开发的预测工具往往不适用于中国人群[2]。因此, 2016年中国动脉粥样硬化性心血管疾病风险预测研究首次发布了适用于中国人群ASCVD风险预测的China-PAR模型, 但目前尚无研究进行独立外部验证的报道。
本研究在中国北方农村人群的前瞻性队列中同时比较了China-PAR和PCE模型的预测准确性, 发现China-PAR模型对于中国人群5年ASCVD发病风险的预测优于PCE模型, 特别是在男性中更加准确。但需要注意的是, 在本研究人群中再校准后的China-PAR和PCE模型都出现了不同程度的风险高估, 特别是PCE模型高估的比例在男性和女性分别为67.3%和53.1%, 这一结果与目前已报道的多数PCE模型的外部验证研究一致。PCE模型发布后的3年内, 至少有9个来自西方国家的独立外部验证队列, 其中包括著名的美国女性健康研究(women’ s health study)、医生健康研究(physicians’ health study)以及女性健康倡议观察性研究(women’ s health initiative observational study)等[7], 均发现PCE模型高估了发病风险, 后续在美国的其他大型队列人群中的独立验证研究也显示ASCVD的10年发病风险会高估60%~90%[6]。普遍出现风险高估的一个可能的原因是, 建立PCE模型所采用队列的基线募集时间从上世纪的1968年到1990年, 陈旧的基线数据并不能反映当前ASCVD危险因素流行情况的变化。
目前PCE模型在其他人群中验证的报道较少, 香港心血管危险因素患病率研究(cardiovascular risk factor prevalence study, CRISPS)[8]在1995年基线募集并随访到2012年底的1 476名年龄40~79岁的中国人群的队列中也验证了PCE模型, 结果显示校准度女性(χ 2=10.1)优于男性(χ 2=24.1); 区分度较好, C统计量及其95%可信区间男性为0.714(0.657~0.770), 女性为0.765(0.690~0.840), 提示发达城市人群的危险因素特征可能更接近于西方人群, 但考虑到该研究的样本量较小, 上述结论还需要进一步在大样本人群中验证, 因为来自美国多种族动脉粥样硬化研究(multi-ethnic study of atherosclerosis, MESA)发现PCE模型的风险预测具有明显的种族差异, 风险高估比例最高的就是华人(男性高估314%, 女性高估252%)[9]。
虽然大部分已报道的研究对PCE模型预测ASCVD的10年发病风险的验证结果提示高估风险, 但美国脑卒中地理和种族差异原因研究(reasons for geographic and racial differences in stroke, REGARDS)[4]的前瞻性队列(2003年至2007年共纳入10 997例年龄在45~79岁基线无ASCVD的美国白人和黑人)亚组分析结果显示, 在根据PCE模型计算需要启动他汀治疗的人群中, 其实际观察到的风险与预测的5年ASCVD风险相似, 支持PCE模型在临床治疗决策中的有效性, 但该研究整体的校准度仍较差。与本研究的情况类似, 由于REGARDS研究的随访时间不到10年, 研究者只比较了5年的预测风险与观察到的ASCVD发生率。此外, 来自欧洲的哥本哈根一般人群研究(Copenhagen general population study, CGPS)[10]也验证了5年ASCVD发病风险的PCE模型, 该研究从2003年至2008年共纳入37 892例40~75岁的丹麦人, 研究对象平均年龄56岁, 57%为女性, 平均随访4.8年, 结果显示在风险评分≥ 10%的高危人群中预测风险高估了40%, 该结果比本研究发现的再校准后的风险高估程度更低; 但该研究并未排除基线时已患有心房颤动及心力衰竭者, 考虑到这些研究对象本身ASCVD发病的高风险, 如果排除后该研究的高估程度也将会更严重。
作为China-PAR模型的原始验证队列之一, 中国代谢综合征社区干预研究(community intervention of metabolic syndrome in China, CIMIC)[2]自2007年至2008年在我国山东、河南和江苏随访了70 838名年龄35~74岁的社区人群, 平均随访5.9年。CIMIC队列也同时比较了China-PAR和PCE模型预测5年ASCVD发病风险的准确性, 结果显示两个模型的区分度较好, 但校准度均较差(P< 0.001); CIMIC研究队列中China-PAR模型预测风险(男性高估12.0%, 女性高估27.5%)优于PCE模型(男性高估67.3%, 女性低估9.7%)。CIMIC研究人群与本研究人群在基线募集时间、随访时间、男女比例以及平均年龄方面非常接近, 在男性中的结果也与本研究基本一致, 但在女性中的结果和预测准确性相差较大。鉴于ASCVD的性别差异以及女性特有的一些危险因素, 如绝经状态等对心血管疾病的影响[11], 国外的一些预测模型如Reynolds风险评分[12]已经考虑到这一问题, 因此后续研究需要重点考虑在女性人群的风险预测模型中加入相关预测因素。另外, 不同人群中阿司匹林、他汀类等药物的应用比例也可以解释预测风险高估及程度不同的部分原因, 并且考虑到ASCVD结局事件发生随时间的变化并非简单的线性关系, 5年和10年发病风险预测模型验证结果的差异仍需要通过进一步随访并在后续研究中验证。最后, 由于本研究人群仅是中国北方农村人群, China-PAR模型在南方或城市人群中的预测准确性还需要其他研究进一步独立验证。
综上所述, 本研究提示China-PAR模型对于中国北方农村人群5年ASCVD发病风险的预测优于PCE模型, 特别是在男性中更加准确。从公共卫生的角度而言, 采用准确适合的风险预测工具进行人群ASCVD风险评估, 将对进一步制定心血管疾病一级预防策略具有重要意义。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|