基于上下文信息和排序学习的实体链接方法

基于上下文信息和排序学习的实体链接方法

摘要

为解决英语命名实体链接问题，提出一种基于上下文信息和排序学习的实体链接方法。首先使用上下文信息对实体指称进行扩充，并在维基百科中检索候选实体列表，然后通过抽取实体指称与候选实体之间的各类特征，利用ListNet排序算法对候选实体列表进行排序，选出Top1的候选实体作为链接结果，最后对未找到候选的实体指称即NIL实体，通过实体聚类算法进行关联链接。

关键词 : 英语实体链接；上下文信息；排序学习；ListNet排序算法；实体聚类

目前较为普遍的实体链接方法是，首先形成候选实体列表，然后对该列表进行排序，最后再进行链接。

基于上下文信息和排序学习的实体链接方法。

优点：

1.采用合理的策略生成候选实体列表

2.对候选实体列表进行高精度的排序

3.NIL实体聚类中，将规则与传统的聚类算法相结合

基于上下文信息和排序学习的实体链接方法

预处理：主要从TAC KBP官方发布的源数据集中提取实体指称信息和实体指称的上下文

实体指称扩充：利用指称上下文中的同指关系以及从Wikipedia中抽取的词表和从爬虫获取的网络知识对实体指称进行扩充

候选实体检索：对每个实体指称，从Wikipedia知识库中检索出对应的候选实体列表

候选排序：特征抽取和排序学习算法

这篇论文实现方法以及过程都较为普通，论文就不放上来了

I'm so cute. Please give me money.

本文作者：先逃跑再说
本文链接：https://wentianhao.github.io/2020/06/18/%E5%9F%BA%E4%BA%8E%E4%B8%8A%E4%B8%8B%E6%96%87%E4%BF%A1%E6%81%AF%E5%92%8C%E6%8E%92%E5%BA%8F%E5%AD%A6%E4%B9%A0%E7%9A%84%E5%AE%9E%E4%BD%93%E9%93%BE%E6%8E%A5%E6%96%B9%E6%B3%95/
版权声明：本博客所有文章除特别声明外，均默认采用许可协议。

摘要

相关工作

基于上下文信息和排序学习的实体链接方法