中新健康丨“80后死亡率”为何出现误导数据?专家解读
创始人
2025-02-18 22:07:19
0

  中新网2月18日电(记者 张尼)“80后死亡率突破5.2%”“80后的死亡率已经超过70后”……近期,网络上一连串骇人听闻的数字引发关注,80后们更是提心吊胆。但随后相关消息被辟谣。

  这一误导人的数据是如何算出来的?AI是否可能出现偏差?记者采访了权威专家。

  数据引用不实、死亡比例与死亡率混淆

  中新健康发现,此次大多数相关文章都号称其数据来自第七次人口普查的“权威数据”。根据80后的“现存人口”和“总出生人口”计算,得到存活率降至94.8%,死亡率达到5.2%。

  但仔细推敲就会发现数据的漏洞。

  首先是数据引用问题。网传文章所谓80后“死亡人数1100万”“现存2.12亿”并没有官方统计数据,所以在数据来源方面就引发质疑。

  其次是死亡率的计算问题。

  根据国家统计局关于死亡率的定义,死亡率(又称粗死亡率)指在一定时期内(通常为一年)一定地区的死亡人数与同期内平均人数(或期中人数)之比,用千分率表示。

  由此可见,网传数据中出现了严重的概念混淆。

  “死亡率是用千分率表示,而不是用1减去人口的存活率,不能将累计的死亡比例作为死亡率。”中国人民大学人口与健康学院教授李婷接受中新健康记者采访时说。

  她表示,死亡率的计算是一个复杂的过程,现实中会通过一系列的数学模型或者是专业模型生命表的方式对数据进行调整,还会和多个其他数据源交叉比对,才能去评估死亡状况。

  至于“80后死亡率超70后”的说法,李婷表示,我国的人均预期寿命在稳定上涨,在此背景下,除非发生特殊情况,否则不会出现这么大一个年龄组死亡率倒挂。

  语料训练不足或致AI出错

  中新健康记者发现,这条在网络上广为传播的消息没有任何权威信源。李婷在自己撰写的文章中也曾分析,这次这条流传颇广的误导性消息最初来源很可能是和AI的对话所得。

  那么为何AI会产生这样的偏差呢?

  “我个人推测,一方面是因为很多学术期刊是闭源的,另一方面也是在这方面的语料不足。”李婷给出了个人看法。

  她分析称,目前AI依赖于语料的训练,但是在实际的学术应用中,它对学术语料的获取有一定的缺陷,这个缺陷可能很大程度在于大量的学术资源是闭源的,很难获取到。现阶段,如果想让AI提供一个较专业的学术文献,经常发现它会“编”出一些不存在的文献,这样也就容易产生误导。

  “另外,本身与‘死亡率’相关的人口研究,相对是比较冷门的,不在日常语料中高频出现,即便出现,在大部分非专业人士的认知里,也分不清死亡率、死亡概率(死亡比例)这些词之间的差异,所以有可能造成网上有些资料将术语进行混用,出现概念混淆。”李婷说。(完)

相关内容

热门资讯

青海西宁迎来2025年首场降雪 1月4日,西宁市民众在雪中跑步。中新社记者 马铭言 摄1月4日,环卫工人清扫路面积雪。中新社记者 马...
2024年我国全年地震灾害损失...   中新网北京1月6日电 近日,中国地震台网发布“2024年度地震活动盘点”。2024年,我国全年地...
甘肃兰州:《风起大汉》沉浸式演... 1月2日,甘肃省兰州市七里河区兰州中心《风起大汉》沉浸式演艺街区内,演职人员进行表演。中新社记者 李...
广东侨乡潮州“大吴会客厅”吸引... 广东侨乡潮州,大吴村的“大吴会客厅”吸引村民游客休闲游玩。中新社记者 陈楚红 摄 广东侨乡潮州,大吴...
200余件伊朗精美文物在新疆展... 12月11日,新疆乌鲁木齐市,正在新疆博物馆展出的“古波斯的荣耀——伊朗文物精华展”吸引众多市民和游...
湖北襄阳积极探索历史遗存活化利...   中新网襄阳1月10日电 (张倩龙)连日来召开的襄阳市两会上,实施历史文化活化利用工程、高水平推动...
重庆忠县:红杉碧水交相辉映 景... 图为红杉林与碧水交相辉,景美如画。赵军 摄图为红杉林与碧水交相辉映,景美如画。赵军 摄图为红杉林与碧...
跨年夜:长沙造雪狂欢迎接202... 12月31日晚,长沙文和友举办了一场怀旧跨年活动,现场通过20世纪80年代的歌舞表演伴随着人工造雪,...