核函数
在关系抽取任务中,给定句子空间X,核函数K:X*X-> [0, ∞)表示一个二元函数,它以X中的两个句子x,y为输入,返回二者之间的相似度得分K(x,y)
例如,我们可以为句子定义一个特征向量计算函数Ø(·),那么句子x和y对应特征向量的点集K(x, y)=Ø(x)T·Ø(y)可以作为核函数的一种实现形式
具体而言,给定输入文本T中的两个实体e1和e2,核函数方法采用下述方法计算它们之间满足关系r的置信度
首先从标注数据中找到文本T',且T'中包含满足关系r的e1'和e2'。然后基于核函数计算T和T'之间的相似度,作为e1和e2满足关系r的置信度
该做法背后体现的思想是:如果两个实体对同时满足某个关系r,这两个实体对分别所在的文本上下文也应该相似,该相似通过核函数计算得到