CN112396185B - 一种事实验证方法、系统、计算机设备和存储介质 - Google Patents
一种事实验证方法、系统、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112396185B CN112396185B CN202110081136.XA CN202110081136A CN112396185B CN 112396185 B CN112396185 B CN 112396185B CN 202110081136 A CN202110081136 A CN 202110081136A CN 112396185 B CN112396185 B CN 112396185B
- Authority
- CN
- China
- Prior art keywords
- node
- nodes
- sentence
- statement
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/046—Forward inferencing; Production systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本申请涉及一种事实验证方法、系统、计算机设备和存储介质,该方法包括:输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集;基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图;将所述声明和所述证据集进行拼接,对节点进行初始化,得到节点的特征表示;根据所述分层异构图中节点的神经网络传播方向,对节点的特征表示进行基于推理的更新;对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果。该方法通有助于捕捉证据之间的关系,并提升了推理模型的可解释性,此外,该方法还显示出分层异构图神经网络方法的有效性,显著提高了事实验证的准确度和效率。
Description
技术领域
本申请涉及信息技术领域,特别是涉及一种事实验证方法、系统、计算机设备和存储介质。
背景技术
对于事实验证,现有的方法主要把事实验证任务与传统的自然语言推理任务进行类比,通过构建声明-证据对并提取特征来支撑下游的预测任务。传统的自然语言推理方法一般通过拼接声明和相关证据句,并提取相应句子级别的特征,从而作为预测层的输入。除此以外,还可以针对每一个证据句子够着声明-证据对,从而更精细的考虑到不同证据带来的影响。但是,这些方法都没有考虑到证据句子之间的语义关联性,因此难以解决一些需要多个证据共同判断的声明。为了解决该问题,通过引入全连接的图结构把不同的证据句子作为图中的节点,基于图进行证据句子的整合推理。除以以外,人们也提出在由切分的证据句子上进行图的构建,从而进一步探索证据间可能存在的语义关联。
但是先前的方法通常只是提取了句子级别的特征作为证据的特征表示,却忽略了结合实体以及上下文这些可以丰富证据表示的重要特征。此外,现有的方法主要是为了提高标签预测的准确性,而忽视了对事实验证模型可解释性的探索,这可能导致验证结果并不可靠。而且,现有的模型通常只关注提升单证据或多证据场景下的事实验证,不能同时适用于这两种情况。
发明内容
基于此,有必要针对上述技术问题,提供一种事实验证方法、系统、计算机设备和存储介质。
第一方面,本发明实施例提供了一种事实验证方法,包括以下步骤:
输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集;
基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图;
将所述声明和所述证据集进行拼接,对节点进行初始化,得到节点的特征表示;
根据所述分层异构图中节点的神经网络传播方向,对节点的特征表示进行基于推理的更新;
对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果。
进一步的,所述输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集,包括:
根据输入的所述声明,利用句子解析器提取所述声明的关键词组;
通过检索工具的应用接口检索所述关键词组的关联文档,将所述关联文档存储在文章集中;
搭建句子检索模型对所述文章集中的文章进行句子检索,输出和所述声明相关的关联句子;
利用所述检索模型对所述关联句子进行相关度打分,将分数落在预设阈值之内的句子作为证据集。
进一步的,所述基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图,包括:
从所述证据集中分别提取出所有句子组成的上下文节点、证据句组成的句子节点和名词短语组成的实体节点;
构建从所述实体节点到所述句子节点的第一有向边、从所述句子节点到所述上下文节点的第二有向边;
根据所述实体节点构建句子级链接、上下文级链接和文章级链接的第三有向边。
进一步的,所述对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果,包括:
将所述实体节点、句子节点和上下文节点的特征表示进行拼接,并通过一个单层的感知器得到推理路径的特征表示;
计算所述推理路径相对于所述声明的对齐向量,得到推理路径的选择概率;
根据所述选择概率计算所述声明的预测标签分布,通过所述预测标签分布推理出所述声明的预测结果。
另一方面,本发明实施例还提供了一种事实验证系统,包括:
证据检索模块,用于输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集;
异构图模块,用于基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图;
节点初始模块,用于将所述声明和所述证据集进行拼接,对节点进行初始化,得到节点的特征表示;
节点更新模块,用于根据所述分层异构图中节点的神经网络传播方向,对节点的特征表示进行基于推理的更新;
结果预测模块,用于对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果。
进一步的,所述证据检索模块包括证据集单元,所述证据集单元用于:
据输入的所述声明,利用句子解析器提取所述声明的关键词组;
通过检索工具的应用接口检索所述关键词组的关联文档,将所述关联文档存储在文章集中;
搭建句子检索模型对所述文章集中的文章进行句子检索,输出和所述声明相关的关联句子;
利用所述检索模型对所述关联句子进行相关度打分,将分数落在预设阈值之内的句子作为证据集。
进一步的,所述异构图模块包括图构建单元,所述图构建单元用于:
从所述证据集中分别提取出所有句子组成的上下文节点、证据句组成的句子节点和名词短语组成的实体节点;
构建从所述实体节点到所述句子节点的第一有向边、从所述句子节点到所述上下文节点的第二有向边;
根据所述实体节点构建句子级链接、上下文级链接和文章级链接的第三有向边。
进一步的,所述结果预测模块包括标签推理单元,所述标签推理单元用于:
将所述实体节点、句子节点和上下文节点的特征表示进行拼接,并通过一个单层的感知器得到推理路径的特征表示;
计算所述推理路径相对于所述声明的对齐向量,得到推理路径的选择概率;
根据所述选择概率计算所述声明的预测标签分布,通过所述预测标签分布推理出所述声明的预测结果。
本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集;
基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图;
将所述声明和所述证据集进行拼接,对节点进行初始化,得到节点的特征表示;
根据所述分层异构图中节点的神经网络传播方向,对节点的特征表示进行基于推理的更新;
对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集;
基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图;
将所述声明和所述证据集进行拼接,对节点进行初始化,得到节点的特征表示;
根据所述分层异构图中节点的神经网络传播方向,对节点的特征表示进行基于推理的更新;
对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果。
本申请的有益效果是:本发明实施例公开了一种事实验证方法、系统、计算机设备和存储介质,该方法中首先根据检索到的证据句,首先构造一个节点包含句子、实体和上下文的异构图,利用基于双向结构的编码器分别初始化上下文节点、句子节点和实体节点的特征表示;其次,采用了一种分层结构,实现语义特征从粒度节点到粗粒度节点进行传播;在图中提取潜在的推理路径,并通过拼接同一路径中涉及的节点特征表示对路径进行编码;最后,使用一个分类器来预测每个推理路径的标签,并通过各路径与声明的相关性来聚合结果。该方法通过使用分层异构图结合不同粒度特征进行证据表示学习,有助于捕捉证据之间的关系。通过从细粒度到粗粒度的特征传播推理过程,有助于提升推理模型的可解释性,并显示出分层异构图神经网络方法的有效性,显著提高了事实验证的准确度和效率。
附图说明
图1为一个实施例中事实验证方法的流程示意图;
图2为一个实施例中证据集采集的流程示意图;
图3为一个实施例中构建分层异构图的流程示意图;
图4为一个实施例中通过预测标签分布进行事实验证的流程示意图;
图5为一个实施例中事实验证系统的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
随着信息爆炸,人们不可避免地接受一些假新闻和误导性的声明。如何自动验证这些声明的真实性已成为一个重要的研究课题。为了解决这个问题,事实验证任务被提出来用以自动的验证声明的真实性,比如通过从维基百科此类值得信赖的知识库中抽取出相关的证据来进行推理判断。事实验证模型可以相应地将一项声明标记为“支持”、“反驳”或“信息不足”,表明相关证据是否能够支持、驳斥该项声明或表示该项声明不能判断。
在一个实施例中,如图1所示,提供了一种事实验证方法,该方法包括以下步骤:
步骤101,输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集;
步骤102,基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图;
步骤103,将所述声明和所述证据集进行拼接,对节点进行初始化,得到节点的特征表示;
步骤104,根据所述分层异构图中节点的神经网络传播方向,对节点的特征表示进行基于推理的更新;
步骤105,对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果。
具体地, 在进行事实验证过程中,首先根据检索到的证据句,首先构造一个节点包含句子、实体和上下文的异构图,利用基于双向结构的编码器分别初始化上下文节点、句子节点和实体节点的特征表示;其次,采用了一种分层结构,实现语义特征从粒度节点到粗粒度节点进行传播;在图中提取潜在的推理路径,并通过拼接同一路径中涉及的节点特征表示对路径进行编码;最后,使用一个分类器来预测每个推理路径的标签,并通过各路径与声明的相关性来聚合结果。该方法通过使用分层异构图结合不同粒度特征进行证据表示学习,有助于捕捉证据之间的关系。通过从细粒度到粗粒度的特征传播推理过程,有助于提升推理模型的可解释性,并显示出分层异构图神经网络方法的有效性,显著提高了事实验证的准确度和效率。
在一个实施例中,如图2所示,事实验证过程中证据集采集具体包括:
步骤201,根据输入的所述声明,利用句子解析器提取所述声明的关键词组;
步骤202,通过检索工具的应用接口检索所述关键词组的关联文档,将所述关联文档存储在文章集中;
步骤203,搭建句子检索模型对所述文章集中的文章进行句子检索,输出和所述声明相关的关联句子;
步骤204,利用所述检索模型对所述关联句子进行相关度打分,将分数落在预设阈值之内的句子作为证据集。
具体地,该过程可以分为两个关键阶段,即文档检索和句子选择。在文献检索环节,采用实体链接的方法检索相关文献。具体来说,对于每个声明,本实施例首先应用一个基于研究库中的句子解析器来提取潜在的实体,该实体可以称为句子中的关键词组。然后通过维基百科提供的应用接口在维基百科中搜索相关文档,并将排名前K的文章存储在一个集合中,该集合定义为。在句子选择阶段中,本实施例使用基于检索模型为给定声明检索的文章中的句子生成一个排名分数。使用带有负采样的修正铰链损失函数来训练该检索模型,最后利用训练好的该模型计算所有检索到的句子的相关度得分,最后输出排名前位的句子作为证据集。
在一个实施例中,如图3所示,对于分层异构图的构建包括:
步骤301,从所述证据集中分别提取出所有句子组成的上下文节点、证据句组成的句子节点和名词短语组成的实体节点;
步骤302,构建从所述实体节点到所述句子节点的第一有向边、从所述句子节点到所述上下文节点的第二有向边;
步骤303,根据所述实体节点构建句子级链接、上下文级链接和文章级链接的第三有向边。
具体地,本实施例以证据集作为输入,构造一个分层的异构图。为了考虑不同层次的特征,本实施例构造了一个由实体、句子和上下文三种节点组成的图。具体来说,本实施例将证据集中的所有句子连接成一个长句,并将其视为上下文节点。对于句子节点,本实施例将证据集中的每个证据句作为单独节点。此外本实施例使用命名实体识别工具提取证据句中的名词短语,将其作为实体节点,而且,两个节点可能引用同一个实体。为了约束信息传播的方向和捕捉证据语句之间的关系,本实施例设计了从细粒度节点到粗粒度节点的有向边和同类节点之间的无向边。对于句子节点,用全连接的子图在每对句子之间建立边。为了在充分挖掘实体之间的关系同时避免大量实体带来的噪音,本实施例为实体节点构建了三种类型的边:句子级链接、上下文级链接以及文章级链接。句子级链接表示同一句子中节点之间的连接,上下文级链接表示不同文章中属于同一实体的节点之间的连接。文章级链接构建的节点之间的连接为其中一个节点位于文章标题中,另一个节点位于文章的其余部分。此外,本实施例为每个实体到句子对构造了从实体节点到句子节点的有向边,以及为每个句子到上下文对构造句子节点到上下文节点的有向边。这样,最终得到一个分层异构的图结构。
在一个实施例中,如图4所示,通过预测标签分布进行事实验证的过程包括:
步骤401,将所述实体节点、句子节点和上下文节点的特征表示进行拼接,并通过一个单层的感知器得到推理路径的特征表示;
步骤402,计算所述推理路径相对于所述声明的对齐向量,得到推理路径的选择概率;
步骤403,根据所述选择概率计算所述声明的预测标签分布,通过所述预测标签分布推理出所述声明的预测结果。
具体的,在进行预测之前首先进行特征表示的初始化和更新。例如,对于上下文节点而言,首先拼接声明和序列证据,然后将其输入到预训练好的语言编码模型中来生成上下文节点的特征表示;对于实体节点而言,利用与实体相关的文本跨度来生成实体的向量表示。具体的,我们首先构建一个二元矩阵 M,其中当第j个单词在第i个实体的文本跨度区间之内,则标记M(i,j)=1, 否则为0。然后通过将证据句子的单词表示与二元矩阵M相乘,从而保留下证据的单词表示矩阵中与实体相关的行。最后,将与实体相关的文本跨度内的单词的向量表示进行最大值池化和平均值池化,再进行拼接,并通过一个单层的感知器得到最终的实体特征表示。
在节点特征初始化以后,再进行节点特征的更新,对于同类型的节点,比如实体节点,本实施例采用一种图注意力网络机制进行节点的特征传播。对于不同类型的节点间的更新,即从实体节点到句子节点和从句子节点到上下文节点。例如,首先计算句子节点 i和实体节点 j之间的注意力权重,然后在句子节点i上聚合相关实体节点的特征得到句子聚合的实体特征。此外,为了保留更多的节点本身的特征,本实施例将每个证据句子聚合的实体特征以及证据句子特征进行结合,得到候选的句子节点特征。总体来说,按照这样的步骤进行特征的传播:实体节点在由实体组成的实体图中进行节点特征的更新。句子节点聚合来自实体节点的特征,并在句子节点构成的子图中更新自身的特征。上下文节点聚合来自句子节点的特征。
在进行最后的预测阶段,首先获得来自不同推理路径的预测结果,然后根据与声明的相关程度聚合产生最后的预测结果。将由实体节点到上下文节点的链接视为推理路径,即实体-句子-上下文这样的形式。通过拼接这些节点的特征表示作为整个路径的向量表示。由于一个句子节点与多个实体节点相链接,需要区分与该句子相关的实体节点。本实施例采用计算句子节点与多个实体节点的相关度得分;将实体节点表示与句子以及上下文节点的特征表示进行拼接,并通过一个单层的感知器从而得到推理路径的特征表示;接下来,计算每个推理路径相对于声明的对齐向量,生成每个路径的选择概率;最后,利用选择概率得到声明的预测标签分布,通过所述预测标签分布推理出所述声明的预测结果。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种事实验证系统,包括:证据检索模块501、异构图模块502、节点初始模块503、节点更新模块504和结果预测模块505,其中:
证据检索模块501,用于输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集;
异构图模块502,用于基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图;
节点初始模块503,用于将所述声明和所述证据集进行拼接,对节点进行初始化,得到节点的特征表示;
节点更新模块504,用于根据所述分层异构图中节点的神经网络传播方向,对节点的特征表示进行基于推理的更新;
结果预测模块505,用于对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果。
在一个实施例中,如图5所示,所述证据检索模块501包括证据集单元5011,所述证据集单元5011用于:
据输入的所述声明,利用句子解析器提取所述声明的关键词组;
通过检索工具的应用接口检索所述关键词组的关联文档,将所述关联文档存储在文章集中;
搭建句子检索模型对所述文章集中的文章进行句子检索,输出和所述声明相关的关联句子;
利用所述检索模型对所述关联句子进行相关度打分,将分数落在预设阈值之内的句子作为证据集。
在一个实施例中,如图5所示,所述异构图模块502包括图构建单元5021,所述图构建单元5021用于:
从所述证据集中分别提取出所有句子组成的上下文节点、证据句组成的句子节点和名词短语组成的实体节点;
构建从所述实体节点到所述句子节点的第一有向边、从所述句子节点到所述上下文节点的第二有向边;
根据所述实体节点构建句子级链接、上下文级链接和文章级链接的第三有向边。
在一个实施例中,如图5所示,所述结果预测模块505包括标签推理单元5051,所述标签推理单元5051用于:
将所述实体节点、句子节点和上下文节点的特征表示进行拼接,并通过一个单层的感知器得到推理路径的特征表示;
计算所述推理路径相对于所述声明的对齐向量,得到推理路径的选择概率;
根据所述选择概率计算所述声明的预测标签分布,通过所述预测标签分布推理出所述声明的预测结果。
关于事实验证系统的具体限定可以参见上文中对于事实验证方法的限定,在此不再赘述。上述权事实验证系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图6示出了一个实施例中计算机设备的内部结构图。该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现权限异常检测方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行权限异常检测方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,如图6所示,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集;基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图;将所述声明和所述证据集进行拼接,对节点进行初始化,得到节点的特征表示;根据所述分层异构图中节点的神经网络传播方向,对节点的特征表示进行基于推理的更新;对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据输入的所述声明,利用句子解析器提取所述声明的关键词组;通过检索工具的应用接口检索所述关键词组的关联文档,将所述关联文档存储在文章集中;搭建句子检索模型对所述文章集中的文章进行句子检索,输出和所述声明相关的关联句子;利用所述检索模型对所述关联句子进行相关度打分,将分数落在预设阈值之内的句子作为证据集。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从所述证据集中分别提取出所有句子组成的上下文节点、证据句组成的句子节点和名词短语组成的实体节点;构建从所述实体节点到所述句子节点的第一有向边、从所述句子节点到所述上下文节点的第二有向边;根据所述实体节点构建句子级链接、上下文级链接和文章级链接的第三有向边。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将所述实体节点、句子节点和上下文节点的特征表示进行拼接,并通过一个单层的感知器得到推理路径的特征表示;计算所述推理路径相对于所述声明的对齐向量,得到推理路径的选择概率;根据所述选择概率计算所述声明的预测标签分布,通过所述预测标签分布推理出所述声明的预测结果。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集;基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图;将所述声明和所述证据集进行拼接,对节点进行初始化,得到节点的特征表示;根据所述分层异构图中节点的神经网络传播方向,对节点的特征表示进行基于推理的更新;对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据输入的所述声明,利用句子解析器提取所述声明的关键词组;通过检索工具的应用接口检索所述关键词组的关联文档,将所述关联文档存储在文章集中;搭建句子检索模型对所述文章集中的文章进行句子检索,输出和所述声明相关的关联句子;利用所述检索模型对所述关联句子进行相关度打分,将分数落在预设阈值之内的句子作为证据集。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从所述证据集中分别提取出所有句子组成的上下文节点、证据句组成的句子节点和名词短语组成的实体节点;构建从所述实体节点到所述句子节点的第一有向边、从所述句子节点到所述上下文节点的第二有向边;根据所述实体节点构建句子级链接、上下文级链接和文章级链接的第三有向边。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将所述实体节点、句子节点和上下文节点的特征表示进行拼接,并通过一个单层的感知器得到推理路径的特征表示;计算所述推理路径相对于所述声明的对齐向量,得到推理路径的选择概率;根据所述选择概率计算所述声明的预测标签分布,通过所述预测标签分布推理出所述声明的预测结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种事实验证方法,其特征在于,包括以下步骤:
输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集;
基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图;
将所述声明和所述证据集进行拼接,对节点进行初始化,得到节点的特征表示;
根据所述分层异构图中节点的神经网络传播方向,对节点的特征表示进行基于推理的更新;
对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果;
在进行事实验证过程中,首先根据检索到的证据句,首先构造一个节点包含句子、实体和上下文的异构图,利用基于双向结构的编码器分别初始化上下文节点、句子节点和实体节点的特征表示;其次,将实体节点、句子节点和上下文节点按照粒度粗细进行排序;然后采用了一种分层结构,实现语义特征从细粒度节点到粗粒度节点进行传播,具体方式为从实体节点到句子节点再到上下文节点进行特征的传播;在图中提取潜在的推理路径,并通过拼接同一路径中涉及的节点特征表示对路径进行编码;
所述分层异构图中节点的神经网络传播为基于图注意力网络机制的节点特征传播,所述传播方向为从实体节点到句子节点再到上下节点,实现不同类型节点间的更新。
2.根据权利要求1所述的事实验证方法,其特征在于,所述输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集,包括:
根据输入的所述声明,利用句子解析器提取所述声明的关键词组;
通过检索工具的应用接口检索所述关键词组的关联文档,将所述关联文档存储在文章集中;
搭建句子检索模型对所述文章集中的文章进行句子检索,输出和所述声明相关的关联句子;
利用所述检索模型对所述关联句子进行相关度打分,将分数落在预设阈值之内的句子作为证据集。
3.根据权利要求1所述的事实验证方法,其特征在于,所述基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图,包括:
从所述证据集中分别提取出所有句子组成的上下文节点、证据句组成的句子节点和名词短语组成的实体节点;
构建从所述实体节点到所述句子节点的第一有向边、从所述句子节点到所述上下文节点的第二有向边;
根据所述实体节点构建句子级链接、上下文级链接和文章级链接的第三有向边;
为实体节点构建了三种类型的边:句子级链接、上下文级链接以及文章级链接,句子级链接表示同一句子中节点之间的连接,上下文级链接表示不同文章中属于同一实体的节点之间的连接;文章级链接构建的节点之间的连接为其中一个节点位于文章标题中,另一个节点位于文章的其余部分。
4.根据权利要求1所述的事实验证方法,其特征在于,所述对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果,包括:
将所述实体节点、句子节点和上下文节点的特征表示进行拼接,并通过一个单层的感知器得到推理路径的特征表示;
计算所述推理路径相对于所述声明的对齐向量,得到推理路径的选择概率;
根据所述选择概率计算所述声明的预测标签分布,通过所述预测标签分布推理出所述声明的预测结果。
5.一种事实验证系统,其特征在于,包括:
证据检索模块,用于输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集;
异构图模块,用于基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图;
节点初始模块,用于将所述声明和所述证据集进行拼接,对节点进行初始化,得到节点的特征表示;
节点更新模块,用于根据所述分层异构图中节点的神经网络传播方向,对节点的特征表示进行基于推理的更新;
结果预测模块,用于对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果;
所述事实验证系统在进行事实验证过程中,首先根据检索到的证据句,首先构造一个节点包含句子、实体和上下文的异构图,利用基于双向结构的编码器分别初始化上下文节点、句子节点和实体节点的特征表示;其次,将实体节点、句子节点和上下文节点按照粒度粗细进行排序;然后采用了一种分层结构,实现语义特征从细粒度节点到粗粒度节点进行传播,具体方式为从实体节点到句子节点再到上下文节点进行特征的传播;在图中提取潜在的推理路径,并通过拼接同一路径中涉及的节点特征表示对路径进行编码;
所述分层异构图中节点的神经网络传播为基于图注意力网络机制的节点特征传播,所述传播方向为从实体节点到句子节点再到上下节点,实现不同类型节点间的更新。
6.根据权利要求5所述的事实验证系统,其特征在于,所述证据检索模块包括证据集单元,所述证据集单元用于:
根 据输入的所述声明,利用句子解析器提取所述声明的关键词组;
通过检索工具的应用接口检索所述关键词组的关联文档,将所述关联文档存储在文章集中;
搭建句子检索模型对所述文章集中的文章进行句子检索,输出和所述声明相关的关联句子;
利用所述检索模型对所述关联句子进行相关度打分,将分数落在预设阈值之内的句子作为证据集。
7.根据权利要求5所述的事实验证系统,其特征在于,所述异构图模块包括图构建单元,所述图构建单元用于:
从所述证据集中分别提取出所有句子组成的上下文节点、证据句组成的句子节点和名词短语组成的实体节点;
构建从所述实体节点到所述句子节点的第一有向边、从所述句子节点到所述上下文节点的第二有向边;
根据所述实体节点构建句子级链接、上下文级链接和文章级链接的第三有向边;
所述图构建单元为实体节点构建了三种类型的边:句子级链接、上下文级链接以及文章级链接,句子级链接表示同一句子中节点之间的连接,上下文级链接表示不同文章中属于同一实体的节点之间的连接;文章级链接构建的节点之间的连接为其中一个节点位于文章标题中,另一个节点位于文章的其余部分。
8.根据权利要求5所述的事实验证系统,其特征在于,所述结果预测模块包括标签推理单元,所述标签推理单元用于:
将所述实体节点、句子节点和上下文节点的特征表示进行拼接,并通过一个单层的感知器得到推理路径的特征表示;
计算所述推理路径相对于所述声明的对齐向量,得到推理路径的选择概率;
根据所述选择概率计算所述声明的预测标签分布,通过所述预测标签分布推理出所述声明的预测结果。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110081136.XA CN112396185B (zh) | 2021-01-21 | 2021-01-21 | 一种事实验证方法、系统、计算机设备和存储介质 |
US17/575,466 US11521041B2 (en) | 2021-01-21 | 2022-01-13 | Fact validation method and system, computer device and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110081136.XA CN112396185B (zh) | 2021-01-21 | 2021-01-21 | 一种事实验证方法、系统、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112396185A CN112396185A (zh) | 2021-02-23 |
CN112396185B true CN112396185B (zh) | 2021-05-11 |
Family
ID=74625122
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110081136.XA Active CN112396185B (zh) | 2021-01-21 | 2021-01-21 | 一种事实验证方法、系统、计算机设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11521041B2 (zh) |
CN (1) | CN112396185B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11947914B2 (en) * | 2020-06-30 | 2024-04-02 | Microsoft Technology Licensing, Llc | Fact checking based on semantic graphs |
US11593356B2 (en) * | 2020-09-11 | 2023-02-28 | ForgeRock, Inc. | Never stale caching of effective properties |
CN113312920B (zh) * | 2021-06-18 | 2024-02-02 | 中国人民解放军国防科技大学 | 基于图对比学习的验证方法、系统、设备和存储介质 |
CN113849599B (zh) * | 2021-09-03 | 2023-01-24 | 北京中科睿鉴科技有限公司 | 基于模式信息和事实信息的联合虚假新闻检测方法 |
CN114048286B (zh) * | 2021-10-29 | 2024-06-07 | 南开大学 | 一种融合图转换器和共同注意力网络的自动事实验证方法 |
CN114065741B (zh) * | 2021-11-16 | 2023-08-11 | 北京有竹居网络技术有限公司 | 用于验证表述的真实性的方法、设备、装置和介质 |
CN115982348B (zh) * | 2022-10-19 | 2024-08-16 | 苏州大学 | 一种篇章级事件可信度识别方法、装置及存储介质 |
CN116383239B (zh) * | 2023-06-06 | 2023-08-15 | 中国人民解放军国防科技大学 | 一种基于混合证据的事实验证方法、系统及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107003997A (zh) * | 2014-12-04 | 2017-08-01 | 微软技术许可有限责任公司 | 用于交互式对话系统的情绪类型分类 |
US10196144B2 (en) * | 2014-02-28 | 2019-02-05 | Lucas J. Myslinski | Drone device for real estate |
CN110837892A (zh) * | 2019-11-12 | 2020-02-25 | 广东外语外贸大学 | 基于带类型关系路径嵌入的事实溯因推理方法 |
EP3633680A1 (en) * | 2002-02-04 | 2020-04-08 | QIAGEN Redwood City, Inc. | Drug discovery methods |
CN111784199A (zh) * | 2020-07-23 | 2020-10-16 | 中国人民解放军国防科技大学 | 业务与信息与技术相互演化的系统、方法及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101902835B (zh) * | 2009-05-27 | 2014-09-10 | 中国移动通信集团公司 | 中继节点识别方法、基站、中继节点及移动管理实体 |
US11222052B2 (en) * | 2011-02-22 | 2022-01-11 | Refinitiv Us Organization Llc | Machine learning-based relationship association and related discovery and |
US10409669B2 (en) * | 2016-11-16 | 2019-09-10 | Nec Corporation | Discovering critical alerts through learning over heterogeneous temporal graphs |
US11410052B2 (en) * | 2019-01-24 | 2022-08-09 | International Business Machines Corporation | System for minimizing reevaluation of a ground truth corpus in response to concept drift |
CN111460165A (zh) * | 2019-12-06 | 2020-07-28 | 北京沃东天骏信息技术有限公司 | 用于知识图谱链接预测的方法、装置和计算机可读存储介质 |
US20220108188A1 (en) * | 2020-10-01 | 2022-04-07 | International Business Machines Corporation | Querying knowledge graphs with sub-graph matching networks |
-
2021
- 2021-01-21 CN CN202110081136.XA patent/CN112396185B/zh active Active
-
2022
- 2022-01-13 US US17/575,466 patent/US11521041B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3633680A1 (en) * | 2002-02-04 | 2020-04-08 | QIAGEN Redwood City, Inc. | Drug discovery methods |
US10196144B2 (en) * | 2014-02-28 | 2019-02-05 | Lucas J. Myslinski | Drone device for real estate |
CN107003997A (zh) * | 2014-12-04 | 2017-08-01 | 微软技术许可有限责任公司 | 用于交互式对话系统的情绪类型分类 |
CN110837892A (zh) * | 2019-11-12 | 2020-02-25 | 广东外语外贸大学 | 基于带类型关系路径嵌入的事实溯因推理方法 |
CN111784199A (zh) * | 2020-07-23 | 2020-10-16 | 中国人民解放军国防科技大学 | 业务与信息与技术相互演化的系统、方法及存储介质 |
Non-Patent Citations (7)
Title |
---|
Connecting the dots: Document-level neural relation extraction with edge-oriented graphs;Christopoulou, F.,et.al;《arXiv preprint arXiv:1909.00228》;20191231;全文 * |
Discovering graph patterns for fact checking in knowledge graphs;Lin, P.,et.al;《In International Conference on Database Systems for Advanced Applications》;20180531;全文 * |
HGAT: hierarchical graph attention network for fake news detection;Ren, Y., et.al;《HGAT: hierarchical graph attention network for fake news detection》;20201231;全文 * |
Hierarchical propagation networks for fake news detection: Investigation and exploitation;Shu, K.,et.al;《In Proceedings of the International AAAI Conference on Web and Social Media》;20200531;全文 * |
Joint neural collaborative filtering for recommender systems;Chen, W.,;《ACM Transactions on Information Systems (TOIS)》;20191231;全文 * |
Reasoning over semantic-level graph for fact checking;Zhong, W.,et.al;《 arXiv preprint arXiv:1909.03745》;20191231;全文 * |
基于图的多层次注意力事实验证算法;谢艺菲,等;《计算机工程与应用》;20201029;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112396185A (zh) | 2021-02-23 |
US20220230050A1 (en) | 2022-07-21 |
US11521041B2 (en) | 2022-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112396185B (zh) | 一种事实验证方法、系统、计算机设备和存储介质 | |
Zhang et al. | Adversarial attacks on deep-learning models in natural language processing: A survey | |
Zhao et al. | Modeling sentiment dependencies with graph convolutional networks for aspect-level sentiment classification | |
CN113761936B (zh) | 一种基于多头自注意力机制的多任务篇章级事件抽取方法 | |
CN104834747B (zh) | 基于卷积神经网络的短文本分类方法 | |
Zhang et al. | Top-down tree long short-term memory networks | |
CN111143576A (zh) | 一种面向事件的动态知识图谱构建方法和装置 | |
US11947914B2 (en) | Fact checking based on semantic graphs | |
CN112579477A (zh) | 一种缺陷检测方法、装置以及存储介质 | |
CN112905801B (zh) | 基于事件图谱的行程预测方法、系统、设备及存储介质 | |
Le et al. | Text classification: Naïve bayes classifier with sentiment Lexicon | |
Liu et al. | Aliasing black box adversarial attack with joint self-attention distribution and confidence probability | |
Hou et al. | Method and dataset entity mining in scientific literature: a CNN+ BiLSTM model with self-attention | |
CN107103363B (zh) | 一种基于lda的软件故障专家系统的构建方法 | |
Huang et al. | Local-to-global GCN with knowledge-aware representation for distantly supervised relation extraction | |
CN111476038A (zh) | 长文本生成方法、装置、计算机设备和存储介质 | |
CN114818682A (zh) | 基于自适应实体路径感知的文档级实体关系抽取方法 | |
Qian et al. | A joint model for named entity recognition with sentence-level entity type Attentions | |
Paria et al. | A neural architecture mimicking humans end-to-end for natural language inference | |
CN108875024B (zh) | 文本分类方法、系统、可读存储介质及电子设备 | |
Cheng et al. | Integration of automatic sentence segmentation and lexical analysis of ancient Chinese based on BiLSTM-CRF model | |
CN113312920A (zh) | 基于图对比学习的验证方法、系统、设备和存储介质 | |
Risch et al. | Explaining offensive language detection | |
CN113435212B (zh) | 一种基于规则嵌入的文本推断方法及装置 | |
Hourali et al. | Coreference resolution using neural mcdm and fuzzy weighting technique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |