最近,一位���仅27岁的华裔小哥,火了!
他花了一周时间自建的新冠预测模型,准确率竟然击败了那些经验老道、耗费巨资建模的全球专业机构。
他的模型,甚至得到了美国疾控中心的青睐,并被采用。
不仅如此,他还被彭博评为“新冠病毒数据超级明星”。
他是谁?真的有这么厉害吗?
01
他竟是个医学“门外汉”?!
先给大家简单介绍一下吧。
这位华裔小伙名叫顾友阳(Youyang Gu,音译),出生在一个华裔移民家庭,在伊利诺伊州和加州长大。
他拥有 MIT(麻省理工)的电气工程和计算机科学硕士学位,以及一个数学学位。
不过,令人吃惊的是,他完全没有接受过医学或者流行病学方面的相关培训。
看起来是个医学“门外汉”的顾友阳,因为什么萌生了自建一个新冠预测模型的念头呢?
缘分开始于2020年的春天。
疫情暴发后,对疫情趋势作出预测的机构也越来越多。
当时,有两个机构的预测模型脱颖而出,它们来自帝国理工学院和健康计量与评估研究所(IHME)。不过,这两个模型对于疫情的发展趋势的预测,却有着大相径庭的结果。
帝国理工学院预测,待到夏天来临时,美国的新冠死亡人数可能会达到200万。而IHME却做出了相对更保守的预测,认为这个数字可能为6万。在去年8月初时,美国的新冠死亡人数约为16万,这与两所机构的预测结果都有一定的差距。
虽然自己是个医学“小白”,但他认为自己处理数据模型方面的背景,应该能够在创建模型时派上用场。小北os:果然,学霸就是学霸,你们不行,那就我亲自动手吧~建立一个新冠预测模型的想法,对顾友阳来说并不是一时冲动。
接下来,在模型的建立过程中,得益于顾友阳的金融行业工作经验,他不断将自己的预测与真实的死亡数据进行对比,并根据对比结果不断调整自己模型的算法。但是,这并不意味着顾友阳所用到的算法有多么的高级。他首先考虑到的是新冠病毒检测数、住院人数和其他因素之间的关系。但是,在研究之后,顾友阳却发现联邦政府的数据,和各个州所提供的数据存在着不一致的现象。这时,对于顾友阳来说,当务之急就是得到最靠谱的数据。
经过思考后,顾友阳决定另辟蹊径,利用过去的死亡人数来预测未来的死亡人数。仅仅一周后,顾友阳自建的新冠疫情预测模型就在网站上正式发布了。更让人惊讶的是,在三周后,这一则个人创建的预测模型,被美国疾控中心列为6个主要预测模型之一!
随后,顾友阳被美国疾控中心邀请,定期参加CDC流行病学家团队和专业建模人员的回忆。自然而然的,顾友阳的网站也迎来了一大波流量,每天都会有上百万人到这里查看疫情状况。在接下来的时间里,顾友阳的预测模型也不负众望,一次又一次地超越了许多权威机构的预测结果。4月底时,他的模型预测,到5月9日美国新冠死亡人数将达到8万人,实际死亡人数为79926。随后,5月18日9万人,5月27日10万人,顾友阳的预测模型再次预测准确。
他的模型,甚至得到了著名数据科学家Jeremy Howard的高度评价:“唯一看起来合理的模型。”
“他是唯一一个真正查看数据,并且做得正确的人。”
随着更完善、更专业的模型不断地涌现,2020年11月,顾友阳决定停止这项工作。马萨诸塞大学阿默斯特分校的生物统计和流行病学副教授Nicholas Reich,对顾友阳颇为赞赏。“他看到其他的模型也做的很好,他认为自己的工作完成了。”
不过,有人的地方就有江湖,对于顾友阳潇洒的离场,也免不了有一些“流言蜚语”。在IHME任职的Murray就指出,顾友阳的模型存在着明显的缺陷。“他没有考虑到新冠病毒的季节性特质,如果不退出的话,他对于冬天第三波疫情的预估会不准确。”Murray还直言,顾友阳模型的算法对于短期预测比较有效,但在宏观层面却起不到太大的作用,既不能解释病毒变异,也不能解释疫苗对变异毒株可能无效的情况。不过,顾友阳却拒绝回应IHME的Murray对他模型的评价和相关言论。“我非常感谢Chris Murray博士和他的团队所做的工作,”他说,“没有他们,我可能不会有今天的成绩。”很多网友都很好奇,顾友阳停止预测模型后,又在做什么呢?休息了一段时间之后,顾友阳又开始他的“预测事业”了。这次,顾友阳想要预测的是美国的感染人数与疫苗推出速度的关系,以及何时能够达到群体免疫。
他目前的预测表明,到今年6月,大约61%的美国人口应该获得免疫——不管是因为接种疫苗还是感染后痊愈。“年龄只是一个数字。你不需要几十年的经验进行深度思考和适应当下。”
“在这个信息唾手可得的数字时代,不要因为缺乏专业知识,而放弃追求自己感兴趣的东西。”