第二届自然语言生成与智能写作技术评测 —

专委首页 >> 技术评测

第二届自然语言生成与智能写作技术评测 —— 中医辨证评测任务

1.任务背景

辨证为中医诊疗过程中具有特色的任务之一，现实场景中，中医从业者需要根据望闻问切等方式观察到的病人的情况，推理判断出该病人当前属于哪种证型，然后根据证型对证下药进行治疗。其中根据病人信息，利用脑中知识判断出属于哪种证型的推理过程即为辨证。实际场景中辨证的方法很多种，包括八纲辨证、病性辨证、病位辨证等，推理过程也会非常的复杂耗时。其辨证的准确率会直接影响到治疗的效果，因此辨证任务十分重要.

这里，我们将该任务引入到计算机领域，将其转化为自然语言处理能够解决的任务形式。通过针对中医辨证的交叉学科研究，将进一步推动中医信息化、现代化和智能化。本任务得到中国中文信息学会自然语言生成专业委员会（筹）支持，将在第二届中国自然语言生成大会（NLGIW2023）召开研讨会，并在大会上对获奖团队颁奖。

2.任务介绍

具体地，我们将该任务简单定义成：给定一段由自然语言文本书写的病人的详细情况描述（包括现病史，主诉，四诊信息），模型需要从候选的证型标签中，预测出当前病人样例所对应的正确的证型。该任务一般以多标签分类的形式进行解决。

3.数据集简介

(1) 数据集为JSON格式，每一行代表一个样本，实例如下：

标题	描述	具体样例
User_id	病人ID	479372
ICD_ID & ICD_name	国际疾病分类	BNP120吐血病
Norm_syndrome	病人证型	气虚不摄证
chief_complaint	主诉	呕血2小时
description	病人病史描述(为支撑辨证的核心文本段落)	患者2小时前无明显诱因出现吐鲜血，色红，反酸、嗳气、烧心偶作，偶有恶心干呕，无发热，头晕偶作，无心慌胸闷，未进食，无便血，当时未予重视。于今晨6时再次吐鲜血，量约50mL，遂至我院就诊，门诊查“新型冠状病毒核酸试验未见明显异常。胸部CT：右肺中叶陈旧性索条”，遂由门诊收入我科，入院时患者：吐血未作，反酸、嗳气、烧心偶作，偶有恶心干呕，无发热，头晕偶作，无心慌胸闷，未进食，无便血，近期体重无明显下降，舌红苔薄白，脉细弦。
detection	中医四诊信息(该段落由模板填充生成，样例之间仅存在略微差别)	中医四诊摘要：神志清晰，精神尚可，形体形体适中，语言清晰，口唇红润；皮肤正常，无斑疹。头颅大小形态正常，无目窼下陷，无白睛，耳轮正常，无耳瘘级生疮；颈部对称，无青筋暴露，无瘿瘤瘰疬，胸部对称，虚里搏动正常，腹部平坦，无癥瘕痞块，爪甲色泽红润，双下肢对称，舌淡红，苔白，脉细。

(2) 除此之外，我们还提供相关证型的知识描述，包括定义、病因和常见疾病，例如：

{

"Name": "气虚不摄证",

"Definition": "指因气虚，不能够对血液起到正常的固摄作用，从而导致各种出血症状的病证。常见于便血、吐血、鼻衄等疾病中。"

}

4.评测指标

本任务采用Macro-F1和EM作为评测指标，衡量预测的证型和目标证型的一致性。

5.基线模型

本任务提供Hugging face Transformers框架的数据预处理、训练测试等代码库，并公开相关基线模型ZY-BERT和中医领域预训练语料，详见https://github.com/Borororo/ZY-BERT。

6.时间安排

	时间	说明
报名注册	5月10日	发布共享任务说明，接受参与者报名
发布训练集和验证集	5月12日	发布训练数据集和验证数据集
发布测试集	6月25日	发布测试数据集
提交结果	7月1日	提交测试数据集结果和技术报告
评测会议	7月23日	发布任务最终结果，并进行颁奖和研讨

7.发起单位

发起单位：北京理工大学

指导单位：中国中文信息学会自然语言生成与智能写作专业委员会（筹）

联系人：任慕成，北京理工大学【报名请联系本邮箱】：rdoctmc@gmail.com

任务主席：高扬，北京理工大学联系方式：gyang@bit.edu.cn

8. 反作弊声明

(1) 参与者禁止注册多账户报名，经发现将取消成绩并严肃处理。

(2) 参与者禁止在指定考核技术能力的范围外利用规则漏洞或技术漏洞等不良途径提高成绩排名，经发现将取消成绩并严肃处理。

(3) 可以接触到赛题相关数据的人员，其提交结果将不计入排行榜及评奖。

9. 交流平台

通过联系人邮箱报名后，主办方建立技术讨论群（微信群），供选手讨论、沟通，主办方也将安排工作人员定期在群内答疑，且后续的相关活动信息均会在群内发布。

10. 数据协议

该评测数据遵循协议：CC BY-NC-SA 4.0。此外，我们对数据集进行了脱敏处理，所有数据不会包含病人的个人信息，该数据仅能用做学术研究用途，禁止用于商业等其他任何非学术研究的行为。