kaggle官网 Kaggle发起CORD-19数据集文本挖掘竞赛
据世界卫生组织最新统计,截至目前,全球至少有168019人感染冠状病毒,死亡人数已达6610人。特朗普在周一的简报中表示,美国新冠肺炎病毒感染和死亡人数继续上升,最早可能在7月和8月控制新型冠状病毒。
抗冠状病毒,AI也帮不上忙。最近AI界提出了应对冠状病毒的新措施。
艾伦人工智能研究所发布新冠肺炎开放研究数据集
为了应对新冠肺炎引发的新型肺炎,以艾伦人工智能研究所为代表的研究团队决定发起一场大行动,聚集所有人的力量来破解冠状病毒的前世。
近日,艾伦的AI研究院与微软研究院、美国国立卫生研究院国家医学图书馆、白宫科技办公室共同发布了新冠肺炎开放研究数据集,免费提供了29000篇与冠状病毒全家相关的学术文章,包括13000多篇全文文档。该数据库将每周更新最新的研究成果,涵盖在同行评审出版物中发表的最新研究和bioRxiv和medRxiv等档案中的新内容。目前,
当然,发布数据集不是为了发布,而是为了挖掘。毕竟,面对海量的数据和快速更新的研究,文学的作用是有限的。
微软首席科学家埃里克·霍维茨(Eric Howeici)表示:“创建这个开放数据集的目标是激励人工智能社区创建工具,帮助科学家掌握成千上万篇文章,以便科学技术能够找到应对新冠肺炎的方法。”。
参见:
https://pages.semanticscholar.org/coronavirus-research
Kaggle发起了CORD-19数据集文本挖掘竞赛
新冠肺炎开放研究数据集发布后,Kaggle立即推出了CORD-19数据集文本挖掘大赛,呼唤AI神!
“我们呼吁全球人工智能专家开发文本和数据挖掘工具,以帮助医学界找到一些高度优先的科学问题的答案。CORD-19数据集代表了迄今为止最广泛的可用于数据挖掘的机器可读冠状病毒文献集,它给全球AI研究界提供了应用文本和数据挖掘方法寻找问题答案的机会,并在内容的各个部分之间形成意见,以支持CORD-19在全球范围内开展的相应工作。对数据挖掘工具的需求非常迫切,因为冠状病毒的研究成果越来越多,医学界很难应对。”
需要挖掘的十个关键问题
为了帮助AI神指出数据挖掘的方向,Kaggle在官网公布了现阶段的10个关键问题:
你对冠状病毒传播、潜伏期、环境稳定性了解多少?
你对新冠肺炎的风险因素了解多少?
你对冠状病毒的遗传学、起源和进化了解多少?
需要提交样本的样本任务-帮助理解地理位置如何影响病毒传播
有哪些与保健相关的出版内容?
有哪些出于伦理和社会科学考虑而发表的内容?
有哪些关于信息共享和跨部门合作的出版内容?
目前对非药物干预了解多少?
你对疫苗和治疗方法了解多少?
你对疾病的诊断和监测了解多少?
以上10个问题的关键问题来自美国国家科学、工程和医学科学院21世纪新发传染病和健康威胁委员会的研究课题,以及世界卫生组织对新冠肺炎的研发蓝图。
奖金
卡格尔将为每项任务中符合评估标准的获奖者提供1000美元的奖金,奖金可以以现金形式发放,也可以作为慈善捐赠捐赠给新冠肺炎救灾研究工作。
竞赛官网
https://www . kaggle . com/Allen-institute-for-ai/CORD-19-research-challenge
自然语言处理将帮助人类克服更多的医学问题
有机器学习专家表示,基于Transformer的文本生成和NLP的开发是2019年最重要的人工智能发展之一,2020年会有更大的进步。
艾伦人工智能研究所所长柳文欢·埃齐奥尼说,人工智能可以加速进步,帮助找到问题的答案,但他强调,人工智能可以增强人的能力,人工智能本身不能解决问题。
目前使用NLP对抗冠状病毒的机构不在少数:
哈佛医学院开发的NLP工具,可以审核病历、社交媒体、公共卫生数据;
一家名为BlueDot的公司通过NLP检索新闻和公共卫生数据,在世界卫生组织面前警告冠状病毒的爆发;
阿里达摩前段时间发布的NLP模型StructBERT,在通用语言理解评估基准上拔得头筹。阿里还将该NLP应用于疾控中心进行病历文本分析和流行病学调查。
在DC竞赛平台上,AI战病、小分子医学属性预测竞赛和AI战病、口罩佩戴检测竞赛也在进行中。距离网上提交截止日期还有一周。有兴趣的同学赶紧!
人工智能战争疾病小分子医学属性预测竞赛
AI战争疫情口罩佩戴测试大赛
所有这些,在全球科技界的共同努力下,让我们相信我们能够克服困难,攻克冠状病毒。
-数据城堡-