56星座屋
当前位置: 首页 星座百科

会话层特点(会话式知识库问答的焦点实体转换建模)

时间:2023-06-08 作者: 小编 阅读量: 1 栏目名: 星座百科

会话式知识库问答的焦点实体转换建模©原创作者|朱林论文解读:ModelingTransitionsofFocalEntitiesforConversationalKnowledgeBaseQuestionAnswering论文作者:Y。

©原创作者 | 朱林

论文解读:

Modeling Transitions of Focal Entities for Conversational Knowledge Base Question Answering

论文作者:

Yunshi Lan, Jing Jiang

论文地址:

https://aclanthology.org/2021.acl-long.255.pdf

收录会议:

ACL2021

01 介绍

会话式知识库问答(Conversational Knowledge Base Question Answering, CKBQA)是探讨如何解答知识库一系列相关问题的一个研究方向。典型场景如下图所示:

图1 会话式知识库问答样例

目前,主流单轮知识库问答(single-turn KBQA)方法中,针对CKBQA问题往往存在“记忆障碍”缺陷,后续问题的回答中容易丢失历史中记录的实体信息,导致无法连贯准确地解答一系列问题。

本篇论文中,作者试图对这些隐含的实体进行建模,这些实体被作者称之为焦点实体(Focal Entities),如图1中的《伟大的盖茨比》、F. Scott Fitzgerald等等。

此外,作者提出了一种新的基于图的模型来对焦点实体的转换进行建模,应用图卷积网络(Graph Convolution Networks, GCN)导出每个问题中焦点实体的概率分布,然后将其与标准知识库问答模块结合以得到最终的答案。

作者在两个数据集上进行实验,证明了其提出方法的有效性。

02 方法

整体架构

图2 整体架构示意图

图2展示了整体架构。作者首先使用实体转换图(Entity Transition Graph)来对会话中涉及的所有实体及其交互进行建模,这些实体是候选的焦点实体。

图的边反映了会话如何从一个实体转移到另一个实体,这种转换可以帮助估计一个实体是当前焦点实体的可能性。

在会话的每一轮之后,该实体转换图由图构造器(Graph Constructor)增量构建。为了获得该图中每个实体成为焦点的可能性,焦点实体预测器(Focal Entity Predictor)根据先前的焦点实体分布和会话生成新的焦点实体分布的历史,由会话历史编码器(Conversation History Encoder)使用标准序列模型(Standard Sequence Model)进行编码。最后,将生成的焦点实体分布合并到传统的KBQA模块中,以得到最终的预测结果。

实体转移图和图构造器

如上所述,作者构建实体转移图的方式基于对焦点实体的以下直觉观察:

● 焦点实体通常是对先前问题的回答。故图中包含了所有先前的答案实体。

● 焦点实体也可能与先前问题中实体有关。故图中包含了查询的那些实体。

● 焦点实体往往保持不变,在会话中具有“粘性”属性,故为每个节点添加了一个自环边。

● 焦点实体经常回到与第一个问题相关的某个实体。故总是添加从最新答案实体到与第一个问题相关的实体的边。

● 如果一个实体在会话历史中经常被讨论,它可能更有可能成为焦点实体。故在图中为这些实体提供了更多的连接性。

图3 实体转移图的具体例子

会话历史编码器

会话历史编码器的目标是对先前问题的文本上下文及其预测答案进行编码,特别是实体以外的信息。会话历史编码器的输出是一个单独的向量,它将作为附加输入传至焦点实体预测器中。

与以前的方法类似,作者利用分层编码器(Hierarchical Encoder)对会话历史进行编码,其中低层独立编码单个问题和预测答案,高层编码连接问题和答案序列以导出单个向量。

具体来说,作者在底层采用BiLSTM网络编码每个问题和每个预测的答案。高层编码器利用Recurrent Network对序列进行编码生成一系列hidden vector,最后一个hidden vector用于输出。

值得注意的是,虽然作者的会话历史编码器方法承袭了之前的工作,但之前的工作往往直接使用序列编码结果作为最终表示,引入了噪音。相比之下,作者的方法仅使用它来帮助预测焦点实体的分布。

焦点实体预测器

训练目标

模型的训练目标来自两部分:

(1) 尽量减少错误回答问题造成的损失。使用了标准的交叉熵损失函数。

(2)监督焦点实体预测器的训练。本文按如下方式生成训练数据:如果有一个实体可以生成至少一个查询并得出正确答案,作者将其视为该问题的正确焦点实体,分配值1,否则为0。最后,作者对分布进行归一化后尝试最小化KL散度。

03 实验

主要结果

表1 Acc/F1对比结果

作者在大规模CKBQA数据集ConvQuestions和CSQA数据集子集ConvCSQA上进行了方法评估。采用平均准确率和F1分数来衡量性能。

作者的方法在ConvQuestions和ConvCSQA上的性能分别比现有技术高9.5个百分点和14.3个百分点。证明了作者的方法在两个数据集上的有效性。

通过实验结果可以发现,类似ConvHistory等仅通过标准的两级分层序列模型简单地对会话历史进行建模并不总能提高性能。这表明以加深加厚模型的蛮力方式去包含所有历史会话信息可能无法有效捕获最重要的会话上下文信息。

进一步分析

表2 消融实验结果

表3 不同方法随着对话轮次增加的准确率下降情况

图5 两个对话案例中预测的焦点实体分布(每个彩条表示焦点实体的概率)

作者通过消融实验验证了其各个模块的有效性(表2),比较了不同方法在多轮问答中准确率的衰减程度证明了在多轮问答中的高效性(表3),并最终用两个案例展示了其焦点实体预测的准确性(图5)。

此外,作者细致分析了焦点实体预测错误的情况,以为后续工作做铺垫。作者发现错误主要是由于以下原因:

(1) 错误关系预测(43%):本文模型中的关系预测是由一个简单的答案预测器完成的,关系易预测错误。后续可以改用性能更佳的预测器。

(2) 查询生成失败(29%):很多情况下,由于知识库的不完整或查询生成器的限制,很难从知识库中收集到正确的查询。

(3) 主题实体的错误链接(22%):问题的主题实体的识别错误也会导致导致最终答案的错误,因为如果实体链接器将问题链接到错误的实体,则不太可能正确地回答问题,这是KBQA面临的普遍挑战。

04 结论

在本文中,作者提出了一种知识库会话中焦点实体的预测和建模的方法,以改进CKBQA。作者的方法准确率超过了目前的两个基线方法,并在两个基准数据集上实现最先进的性能。

05 启发

本文留给了我们一些启发和思考:

(1) 当需要解决上下文关联的序列问题的时候,传统利用静态信息进行编码或者简单将历史信息叠加编码往往无法起到很好的效果,存在大量噪声。而通过分析序列中共性特征进行有效编码或者概率推导能进一步提高序列问题的准确率。常用的框架为GCN、注意力模型等等。

(2) 目前的深度学习方法逐渐朝着精细化、可解释性的方向发展,不再是曾经一个或几个通用模型针对不同问题迁移一下、组合一下、调个参数就行的。现在的方法越来越需要解释清楚 “为何有用?”和“能够不用?”这两个问题。

当然,目前绝大部分创新模型仍然以直觉的思维方式进行设计和架构,其有效性往往只能从实验数据角度证明,而很少能从严密逻辑或者数学推导中验证,如何看待这个问题留待读者思考。

私信我领取目标检测与R-CNN/数据分析的应用/电商数据分析/数据分析在医疗领域的应用/NLP学员项目展示/中文NLP的介绍与实际应用/NLP系列直播课/NLP前沿模型训练营等干货学习资源。

    推荐阅读
  • 送给父亲的一句话(送给父亲的暖心话语)

    我是神父,受您儿女们的嘱托,向您传送父亲节的祝福。父亲节马上要到了,愿你的父亲健康幸福!爸爸,父亲节快到了,这二十多年来,您为我付出的太多太多,我这辈子都是报答不完的,希望您每天都开开心心,健康平安。父爱如山,连绵而伟岸;父爱如水,刚与柔并济;父爱如风,无处而不在;父爱如光,灿烂而热烈;祝父亲节日快乐,健康幸福!即使不在我身边,那份浓浓的父爱仍然会帮助我,祝您父亲节快乐!

  • 一路长虹是什么意思(科普一路长虹的意思)

    下面更多详细答案一起来看看吧!一路长虹是什么意思一路长虹是指电视收视率越来越高。虹,意思是像彩虹那样长而灿烂,这个词语只是一个代表电视剧或者电影的一个收视率祝福语。一路长虹不是成语,一开始只在电视台内部人员之间流传及使用。另外,形容收视率高的成语还有万人空巷、万头攒动、无往不胜、战无不胜、座无虚席等。

  • 野菜不是你想吃随便就可以吃(野菜虽美味采食需慎重)

    所以购买或采摘时应选择新鲜幼嫩的香椿芽,并减少存放时间,尽快食用。尤其是过敏体质或患有一些慢性病的人群,尽量少吃或不吃香椿。另外,荠菜中草酸含量较高,食用之前建议焯水。有研究表明,马齿苋中含有较高含量的α-亚麻酸,同时含有多种功能性成分,具有一定的抗菌、抗病毒、抗肿瘤、降血脂、降血糖、抗衰老等作用。尤其老人、婴幼儿、孕产妇、哺乳期妇女、过敏体质人群,尽量少食或者不食用。

  • 人生海海山山而川不过尔尔啥意思(人生海海山山而川不过尔尔如何理解)

    接下来我们就一起去了解一下吧!人生海海山山而川不过尔尔啥意思意思是人生像大海一样茫然,总是起起落落,有很多不确定因素,走过平湖烟雨,跨过岁月山河,最终发现也不过如此。人生海海,生生而川出自麦家的《人生海海》,告诉人们人生总是会在没有任何约定的情况下就意外遇见温暖,还有持续不断的希望。鼓励人在任何情况下也不要放弃希望,因为希望绵延不断。也不要放弃对美好生活的追求,因为总有些温暖不期而遇。

  • 肛门瘙痒可以用红霉素软膏 肛门瘙痒可以用红霉素软膏擦吗

    红霉素软膏的主要作用皮肤感染作为抗生素类软膏,红霉素软膏首先用于治疗和预防皮肤感染。除了抗感染之外,红霉素软膏还有其它一些用途。轻微创伤如身体轻微挫伤、划伤或其它创伤都可使用红霉素软膏,一般用法是将患处清洗消毒,之后将适量药膏涂于患处,1日2次。口角炎口角炎多因感染引起,以学龄前儿童多见。细菌性口角炎可以涂抹少量红霉素软膏,同时服用维生素B2。

  • 计算机指令中的地址码指什么(计算机指令中的地址码是什么)

    计算机指令中的地址码指什么地址码和机器码是产品出厂时已经设定的号码,用以区别不同的设备,就如同机器的身份号。地址码一般为7位数,机器码为16位数。数字信息机和语音信息机采用的是地址码。可手动更改数字信息机的地址码,每台机器最多可设定7个地址码,详细操作请见说明书。

  • 烟台养老保险缴费基数是多少 烟台社保的缴费基数

    2022年烟台市社会保险缴费基数的上下限依据烟人社字﹝2022﹞95号文之规定,我市2022年度职工基本养老保险、失业保险、工伤保险个人月缴费基数的上限为19899元,下限为3980元。提高标准所需资金,由各地统筹中央、省级城乡居民基本养老保险补助资金予以落实。

  • 红毛丹的功效与作用(红毛丹的功效与作用简述)

    以下内容希望对你有帮助!红毛丹的功效与作用红毛丹的功效与作用如下。红毛丹有增强人体免疫力的作用:红毛丹果肉里含有的维生素可以让细胞的抵抗能力增强。红毛丹有滋养头皮发、护肤美肤的作用,长期使用一定量的红毛丹,能够让头发得到滋润,还可以补气血健美皮肤。红毛丹有清热解毒的作用:红毛丹可以清心去火、清热除燥,能够帮助人体消除血液中的热毒,而且红毛丹的树根熬煮后也是有此等功效的。

  • 2020年三水区公办初中积分入学录取工作安排

    填报时要上传积分申请人的户口簿本人页、学生本人页图片,非三水区学籍的学生,还要上传《学籍基本信息表》原件图片。入围录取的学生,根据三水区公办初中学位安排规则,以积分从高到低排名次序,参考个人志愿统筹安排学位。在8月4日前由分配的学校通知学生并完成注册工作。逾期注册视为放弃学位。至此,三水区公办初中招生录取工作全部结束。

  • 太极图的含义(太极图解释)

    太极图的含义太极图是我国古代说明宇宙现象的图,一种是用圆形的图像表示阴阳对立面的统一体,圆形外边附八卦方位,道教常用它做标志。另一种是宋周敦颐所画的,代表宋代理学对于世界形成问题的看法。《太极图》据传是宋朝道士陈抟所传出。周敦颐著《太极图说》加以解释。周敦颐“一方面从陈抟派道家易里吸收了太极图式说并与新的解释,另一方面继承了汉唐以来义理学派的传统成为宋明道学家解易的先驱。”