56星座屋
当前位置: 首页 星座百科

会话层特点(会话式知识库问答的焦点实体转换建模)

时间:2023-06-08 作者: 小编 阅读量: 1 栏目名: 星座百科

会话式知识库问答的焦点实体转换建模©原创作者|朱林论文解读:ModelingTransitionsofFocalEntitiesforConversationalKnowledgeBaseQuestionAnswering论文作者:Y。

©原创作者 | 朱林

论文解读:

Modeling Transitions of Focal Entities for Conversational Knowledge Base Question Answering

论文作者:

Yunshi Lan, Jing Jiang

论文地址:

https://aclanthology.org/2021.acl-long.255.pdf

收录会议:

ACL2021

01 介绍

会话式知识库问答(Conversational Knowledge Base Question Answering, CKBQA)是探讨如何解答知识库一系列相关问题的一个研究方向。典型场景如下图所示:

图1 会话式知识库问答样例

目前,主流单轮知识库问答(single-turn KBQA)方法中,针对CKBQA问题往往存在“记忆障碍”缺陷,后续问题的回答中容易丢失历史中记录的实体信息,导致无法连贯准确地解答一系列问题。

本篇论文中,作者试图对这些隐含的实体进行建模,这些实体被作者称之为焦点实体(Focal Entities),如图1中的《伟大的盖茨比》、F. Scott Fitzgerald等等。

此外,作者提出了一种新的基于图的模型来对焦点实体的转换进行建模,应用图卷积网络(Graph Convolution Networks, GCN)导出每个问题中焦点实体的概率分布,然后将其与标准知识库问答模块结合以得到最终的答案。

作者在两个数据集上进行实验,证明了其提出方法的有效性。

02 方法

整体架构

图2 整体架构示意图

图2展示了整体架构。作者首先使用实体转换图(Entity Transition Graph)来对会话中涉及的所有实体及其交互进行建模,这些实体是候选的焦点实体。

图的边反映了会话如何从一个实体转移到另一个实体,这种转换可以帮助估计一个实体是当前焦点实体的可能性。

在会话的每一轮之后,该实体转换图由图构造器(Graph Constructor)增量构建。为了获得该图中每个实体成为焦点的可能性,焦点实体预测器(Focal Entity Predictor)根据先前的焦点实体分布和会话生成新的焦点实体分布的历史,由会话历史编码器(Conversation History Encoder)使用标准序列模型(Standard Sequence Model)进行编码。最后,将生成的焦点实体分布合并到传统的KBQA模块中,以得到最终的预测结果。

实体转移图和图构造器

如上所述,作者构建实体转移图的方式基于对焦点实体的以下直觉观察:

● 焦点实体通常是对先前问题的回答。故图中包含了所有先前的答案实体。

● 焦点实体也可能与先前问题中实体有关。故图中包含了查询的那些实体。

● 焦点实体往往保持不变,在会话中具有“粘性”属性,故为每个节点添加了一个自环边。

● 焦点实体经常回到与第一个问题相关的某个实体。故总是添加从最新答案实体到与第一个问题相关的实体的边。

● 如果一个实体在会话历史中经常被讨论,它可能更有可能成为焦点实体。故在图中为这些实体提供了更多的连接性。

图3 实体转移图的具体例子

会话历史编码器

会话历史编码器的目标是对先前问题的文本上下文及其预测答案进行编码,特别是实体以外的信息。会话历史编码器的输出是一个单独的向量,它将作为附加输入传至焦点实体预测器中。

与以前的方法类似,作者利用分层编码器(Hierarchical Encoder)对会话历史进行编码,其中低层独立编码单个问题和预测答案,高层编码连接问题和答案序列以导出单个向量。

具体来说,作者在底层采用BiLSTM网络编码每个问题和每个预测的答案。高层编码器利用Recurrent Network对序列进行编码生成一系列hidden vector,最后一个hidden vector用于输出。

值得注意的是,虽然作者的会话历史编码器方法承袭了之前的工作,但之前的工作往往直接使用序列编码结果作为最终表示,引入了噪音。相比之下,作者的方法仅使用它来帮助预测焦点实体的分布。

焦点实体预测器

训练目标

模型的训练目标来自两部分:

(1) 尽量减少错误回答问题造成的损失。使用了标准的交叉熵损失函数。

(2)监督焦点实体预测器的训练。本文按如下方式生成训练数据:如果有一个实体可以生成至少一个查询并得出正确答案,作者将其视为该问题的正确焦点实体,分配值1,否则为0。最后,作者对分布进行归一化后尝试最小化KL散度。

03 实验

主要结果

表1 Acc/F1对比结果

作者在大规模CKBQA数据集ConvQuestions和CSQA数据集子集ConvCSQA上进行了方法评估。采用平均准确率和F1分数来衡量性能。

作者的方法在ConvQuestions和ConvCSQA上的性能分别比现有技术高9.5个百分点和14.3个百分点。证明了作者的方法在两个数据集上的有效性。

通过实验结果可以发现,类似ConvHistory等仅通过标准的两级分层序列模型简单地对会话历史进行建模并不总能提高性能。这表明以加深加厚模型的蛮力方式去包含所有历史会话信息可能无法有效捕获最重要的会话上下文信息。

进一步分析

表2 消融实验结果

表3 不同方法随着对话轮次增加的准确率下降情况

图5 两个对话案例中预测的焦点实体分布(每个彩条表示焦点实体的概率)

作者通过消融实验验证了其各个模块的有效性(表2),比较了不同方法在多轮问答中准确率的衰减程度证明了在多轮问答中的高效性(表3),并最终用两个案例展示了其焦点实体预测的准确性(图5)。

此外,作者细致分析了焦点实体预测错误的情况,以为后续工作做铺垫。作者发现错误主要是由于以下原因:

(1) 错误关系预测(43%):本文模型中的关系预测是由一个简单的答案预测器完成的,关系易预测错误。后续可以改用性能更佳的预测器。

(2) 查询生成失败(29%):很多情况下,由于知识库的不完整或查询生成器的限制,很难从知识库中收集到正确的查询。

(3) 主题实体的错误链接(22%):问题的主题实体的识别错误也会导致导致最终答案的错误,因为如果实体链接器将问题链接到错误的实体,则不太可能正确地回答问题,这是KBQA面临的普遍挑战。

04 结论

在本文中,作者提出了一种知识库会话中焦点实体的预测和建模的方法,以改进CKBQA。作者的方法准确率超过了目前的两个基线方法,并在两个基准数据集上实现最先进的性能。

05 启发

本文留给了我们一些启发和思考:

(1) 当需要解决上下文关联的序列问题的时候,传统利用静态信息进行编码或者简单将历史信息叠加编码往往无法起到很好的效果,存在大量噪声。而通过分析序列中共性特征进行有效编码或者概率推导能进一步提高序列问题的准确率。常用的框架为GCN、注意力模型等等。

(2) 目前的深度学习方法逐渐朝着精细化、可解释性的方向发展,不再是曾经一个或几个通用模型针对不同问题迁移一下、组合一下、调个参数就行的。现在的方法越来越需要解释清楚 “为何有用?”和“能够不用?”这两个问题。

当然,目前绝大部分创新模型仍然以直觉的思维方式进行设计和架构,其有效性往往只能从实验数据角度证明,而很少能从严密逻辑或者数学推导中验证,如何看待这个问题留待读者思考。

私信我领取目标检测与R-CNN/数据分析的应用/电商数据分析/数据分析在医疗领域的应用/NLP学员项目展示/中文NLP的介绍与实际应用/NLP系列直播课/NLP前沿模型训练营等干货学习资源。

    推荐阅读
  • 形成酸雨的主要气体是什么(形成酸雨的主要气体)

    以下内容大家不妨参考一二希望能帮到您!形成酸雨的主要气体是什么酸雨是指PH小于5.6的雨雪或其他形式的降水,形成的主要气体有二氧化硫、三氧化硫、硫化氢、二氧化氮。酸雨主要是人为的向大气中排放大量酸性物质所造成的。酸雨又分硝酸型酸雨和硫酸型酸雨。

  • 木棉花的花语是什么(木棉花的意义)

    接下来我们就一起去了解一下吧!珍惜眼前的幸福,珍惜身边的人给他们快乐与幸福。它的花期通常在3月或者4月份,在这一段时间盛开,而传说中四月的第十一天,是木棉花盛开的日子,所以4月11被定为木棉花的日子。

  • 炒凉皮不碎技巧(炒凉皮不碎有什么技巧)

    以下内容大家不妨参考一二希望能帮到您!炒凉皮不碎技巧炒凉皮不碎技巧:就是在做凉皮时不能炒太久,变软会失去筋度。胡萝卜切丝,蒜薹切段,葱切花,猪肉切丝,大蒜拍扁。成品凉皮一张张卷起切粗条,抖散备用。生抽,白糖,盐,鸡精,醋,胡椒粉调成汁备用。热锅倒适量食用油烧热加入大蒜,肉丝翻炒至金黄,加入胡萝卜丝和蒜薹炒熟,凉皮翻炒均匀后随即淋入调好的汁儿翻炒均匀。

  • 近几年灭绝的鱼(瞭望在长江源寻鱼)

    长江被誉为我国淡水渔业的摇篮、鱼类基因的宝库。据青海省渔业部门统计,长江流域青海段分布有土著鱼类21种。因此,严格意义上长江源的关键鱼类指的是裂腹鱼中的小头裸裂尻鱼。2019年,李伟带领团队参加长江源科考时,将小头裸裂尻鱼列为长江源鱼类研究的代表对象。2019年4月,科考小组五个人,两台车,开始了沿河寻觅之旅。“全球平均气温上升已是科学界的共识,位于青藏高原的长江源是全球气候变化的敏感区。”科考发现,江源地区

  • 鹧鸪在什么时候季节鸣叫(鹧鸪的孵化期有多长)

    鹧鸪在什么时候季节鸣叫鹧鸪一般会在繁殖季节鸣叫,繁殖期为3-6月,3-4月间开始求偶交配。求偶期间鸣叫更为频繁,常在山岩、树桩、灌木或乔木枝上鸣叫,尤以黎明和黄昏时更甚,往往是一鸟先鸣叫,其他雄鸟一起跟随,此起彼伏。鹧鸪的孵化期在21天左右,雏鸟出壳后不久即可跟随亲鸟活动。鹧鸪的繁殖期为每年的3-6月,3-4月间开始求偶交配,每窝产卵3-6枚,多时可达8枚,卵为椭圆形或梨形,颜色为淡皮黄色至黄褐色。

  • 秋天的诗词(这些都是关于秋天的诗句)

    迢迢新秋夕,亭亭月将圆《戊申岁六月中遇火》,今天小编就来说说关于秋天的诗词?《戊申岁六月中遇火》自古逢秋悲寂寥,我言秋日胜春朝。《秋词》是处红衰翠减,苒苒物华休。惟有长江水,无语东流。宋·柳永《八声甘州》落时西风时候,人共青山都瘦。《昭君怨》雨色秋来寒,风严清江爽。《酬裴侍御对雨感时见赠》秋声万户竹,寒色五陵松。唐·李颀《望秦川》秋色无远近,出门尽寒山。宋·苏轼《九日次韵王巩》

  • 广州有几种车牌(广州车牌你有吗)

    在广州的普通上班族,有房贷还想拥有一辆车,已经不容易了。但有车想让个广州牌,那更是难上加难,再加之限行,参与摇号,竞价的人是越来越多,那中标的机会更是渺茫了!截止日期是8日24时止。9月拟配置的中小客车增量指标共16313个,是这样分配的:1.以摇号方式向单位和个人配置节能车增量指标7285个,其中,单位指标100个,个人指标7185个。

  • qq注销账号有哪几个步骤(QQ将开注销帐号功能)

    1999年2月10日,一个名为OICQ、只有几百K的软件正式上线。当时,腾讯方面表示,这是QQ团队对帐号注销功能的灰度测试。网友截图出于安全考虑,也有网友表示支持有人说,QQ不推出注销服务有自己的考虑,这是为了防止用户QQ密码被他人知道后恶意注销,给用户带来无法挽回的损失。腾讯2018年第三季度财报显示,QQ智能终端月活跃账户同比增长6.9%至6.979亿。

  • 高跟鞋不合脚怎么办(穿高跟鞋不合脚怎么办)

    4、合理利用袜子,如果不喜欢垫各种鞋垫的朋友,可以穿一双船袜,再穿高跟鞋,那样既不影响穿着效果,也不影响美观,也是比较简单和实用的方法。

  • 年四旺名字打分104分 年四旺事迹

    文章目录:一、年四旺相关名字打分113二、年四旺相关名字评分115三、年四旺相关名字推荐四、年四旺相关名字大全五、其他人还看了一、年四旺相关名字打分113年灯石志明年橘纪红兵武尊道后书法孔多塞年贷款孙敬媛年立秋里蓝业珍冯景华年见朱诗词林于思冯桂年粤日林格孟昭毅年家薛邑马布鱼鲁初雪苏沫沫卜庆中年上年掌柜秦源达刘登龙严学锋国韵酒年线高成江裘梦年维泗红沙日年周王克斌王翔千毛淑红龙威信李万和年神范小慧王大