• / 12

文言文知识图谱生成方法及系统

关 键  词:
生成知识图谱 生成方法及系统 文言文知识图谱生成方法及系统 知识图谱生成方法及 生成方法及其
资源描述:

《文言文知识图谱生成方法及系统》由会员分享,可在线阅读,更多相关《文言文知识图谱生成方法及系统(12页珍藏版)》请在我爱发明文档网上搜索。

1、表示第a组融合知识点的标识知识点的重要度; 确定第a组融合知识点的标识知 识点出现次数最多的第一文言骤A1-A3: 步骤A1、 根据如下公式(2)计算每组融合知识点的标识知识点的重要度: 其中, Qa5.如权利要求1所述的方法, 其特征在于, 所述根据所述标识知识点, 生成文言文知识 图谱, 包括步 频率系数最高的目标固定搭配文字组合, 将该目标固定搭配文字组合作为该组融合知识点 的标识知识点。 标识知识点, 包括: 针对每一组融合知识点: 从该组融合知识点中的多个固定搭配文字组合中, 确定出现识点。 4.如权利要求1所述的方法, 其特征在于, 所述根据所述出现频率系数确定每组融合知 识点中的。

2、两个固定搭配文字组合之间的近似度等于或大于预设近似度阈值; 将所述多个固定搭配文字组合归为一组融合知: 确定近似度等于或大于预设近似度阈值的多个固定搭配文字组合, 所述多个固定搭配 文字组合中, 任意征在于, 所述根据所述近似度确定多组融合知识点, 每组融合知识点中包括多个固定搭配文字 组合, 包括2,3m; k1,2,3n; i 为1,2,3n中的任一个数值。 3.如权利要求1所述的方法, 其特文章中出现的次数; n表示固定搭配 文字组合的总数; m表示所述文言文库中的文言文文章总数; j1,中的第j个文言文文章中出现的次数; Tkj表示第k 个固定搭配文字组合在所述文言文库中的第j个文言文。

3、定搭配文字组合在所述文言文库中的出现频率系数; Rij表示所述 第i个固定搭配文字组合在所述文言文库 利用公式(1)得到所述文言文库中的每一个固定搭配文字组合的出现频率系数; 其中, Yi表示第i个固要求1所述的方法, 其特征在于, 所述确定文言文库中的每一个固定搭配文字组合的出现频率系数, 包括:现频率系数确定每组融合知识点中的标识知识点; 根据所述标识知识点, 生成文言文知识图谱。 2.如权利似度; 根据所述近似度确定多组融合知识点, 每组融合知识点中包括多个固定搭配文字组 合; 根据所述出文库中的每一个固定搭配文字组合的出现频率系数; 计算每一个固定搭配文字与其它固定搭配文字组合之间的近。

4、24 CN 111984799 A 1.一种文言文知识图谱生成方法, 其特征在于, 包括: 确定文言合归类的效率。 权利要求书3页 说明书7页 附图1页 CN 111984799 A 2020.11. 的分析, 实现了在文言文知识图谱中将相似的固 定搭配文字组合进行归类显示, 提高了固定搭配 文字组 中的标识知识点, 最后, 根据上述标识知识点, 生 成文言文知识图谱。 上述技术方案, 通过智能化融合知识 点, 每组融合知识点中包括多个固定搭配文字组 合, 根据上述出现频率系数确定每组融合知识点现频率系数, 计算每一 个固定搭配文字与其它固定搭配文字组合之间 的近似度, 根据上述近似度确定多组开了文言文知识图谱生成方法及 系统。 该技术方案, 通过确定文言文库中的每一 个固定搭配文字组合的出0/216(2020.01) (54)发明名称 文言文知识图谱生成方法及系统 (57)摘要 本发明公 (72)发明人 崔炜 (51)Int.Cl. G06F 16/36(2019.01) G06F 4海松鼠课堂人工智能科技有限公 司 地址 200237 上海市徐汇区宜州路188号2 幢9层、 10层21)申请号 202011036405.2 (22)申请日 2020.09.27 (71)申请人 上19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日。

展开阅读全文
  我爱发明文档网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:文言文知识图谱生成方法及系统
链接地址:https://www.woaifaming.net/doc/4973.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 20018-2021 我爱发明网版权所有

经营许可证编号:粤ICP备20005300号-1



收起
展开