基于医药知识图谱的组题系统文献综述

 2022-12-12 19:17:40

开题报告内容:(包括拟研究或解决的问题、采用的研究手段及文献综述,不少于 2000 字)

一、课题意义

知识图谱(Knowledge Graph)是一种揭示实体之间关系的语义网络,是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系其基本组成单位是『实体-关系-实体』三元组,以及实体及其相关属性-值对,实体之间通过关系相互联结,构成网状的知识结构。通过数据挖掘、信息处理等方式可以揭示数据之间的复杂关系。

随着健康中国战略的提出,人们对自身健康的重视程度提高,对于获取医药健康知识的需求愈发强烈。秉承拓宽医药健康知识的输送渠道,满足广大的用户需求的初衷,我们团队预计构建一个基于中文医药知识图谱的智能应用平台,该平台是一个能够输出专业、直观的医药知识,提供易用、智能的医药信息工具的图谱平台。

综上所述,本系统属于“基于医药大数据的知识图谱构建和智能应用平台”中的一部分,是基于知识图谱的数据之间网状联系的特点将疾病信息联系起来,将碎片的疾病信息进行组句,进而组成题目的一个组题系统。

二、国内外进展情况

在知识图谱的各类研究中,问答系统是最为广泛的一种,例如现在较为成熟的手机助手:Google Now和Siri,都能够提供问答、搜索应用等功能,用户在使用过程中,软件会收集数据进行分析,进而可以预测用户的部分行为。

基于知识图谱的问答系统的构建主要三种方法:基于模板匹配的方法、基于语义解析的方法、基于向量建模的方法。其中,基于模板匹配的方法是最基本的方法,其依靠关键字匹配的方式来返回答案,知识图谱结合使将匹配对象由散乱的非结构化文本变为严谨的结构化文本。模板匹配的方法是将用户的自然语言转化为三元组形式,根据三元组寻找与之相匹配的SPARQL查询模板,再根据SPARQL查询模板与知识库中的RDF数据相匹配获得最终的答案[1]。优点有问答成功率高,响应速度快。缺点则是需要人工构筑大量的模板来保证和用户问题的匹配,一旦用户的问题中没有相对应的模板,则会导致返回答案的不准确。为了优化自然语言查询方面的问题,2018年Google公司发布了Bert算法[2],这也是目前在NLP领域里表现最好的算法之一。2019年Aiting Liu等人[3]融入Bert预训练系统生成模板,解决了人工创造模板以及算法需要大规模训练数据量的缺点,且相较之前最好的方法正确率提高了一个百分点。

至于本课题所研究的基于知识图谱来实现自动组题的方向,目前还没有类似的研究。

三、国内外已有研究方法

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版