• / 10

通用的条款与文档匹配方法

关 键  词:
通用 条款 文档 匹配 方法
资源描述:

《通用的条款与文档匹配方法》由会员分享,可在线阅读,更多相关《通用的条款与文档匹配方法(10页珍藏版)》请在我爱发明网上搜索。

1、如权利要求1所述的方法, 其特征在于, 使用KL距离算法计算文档材料a的词项分布 与每一条款的条款主条款i的每一所述查询语句从业务数据 库、 开源知识库和互联网上查询收集该条款i的相关文档数据。 4.现的主题内容词, 类型块是指条款的材料类型限定词。 3.如权利要求1所述的方法, 其特征在于, 根据对象块、 主题内容块和类型块; 其中, 实体对象块是条款中出现的实体对象词, 主题内容块是指条款中出.如权利要求1所述的方法, 其特征在于, 步骤1)中, 根据条款切割体系将条款分成三 种词块: 实体返回匹配概率最高的条款; 其中, 相似度S为根据返回类别m筛选出 的条款j与文档材料a的相似度。 2。

2、据返回的类别对返回的条款进行筛选; 然后根据返回类别m的概率值和相似度S计 算条款j的匹配概率值, 似度, 返回相似度大于设定阈值的条款; 利用各条款的条款分类模型对该文档材 料进行类别分类; 5)根类模型; 4)对于一待匹配条款的文档材料a, 计算该文档材料a的词项分布与每一条款的条款主 题模型相文档类型, 每一类型对应一标注数据子集, 利用每一标注数据子集训练得到该条款i的一对 应类型的条款分i的条款主题 模型; 根据步骤1)处理得到的条款i的词块类型对标注数据集I中的每一文档标注其对应的 展词的分布概率作为扩展词的 权重, 根据权重对扩展词排序获得前N个扩展词及其对应的权重, 作为该条款。

3、I, 通过查询词扩展技术确定条款i中每个 条款词w对应的文档词, 作为条款词w的扩展词; 计算每个扩一文档所对应的条款, 获得每一条款i对应的标注数据集; 3)对于每一条款i, 根据条款i的标注数据集条款的多个查询语句; 2)根据条款i的每一所述查询语句查询收集该条款i的相关文档数据并标注所收集每 条款切割体系对所选每一条款句子进行分词块操作, 并对相应词块添加解释词 和扩展词, 生成针对每一所选05.29 CN 111209375 A 1.一种通用的条款与文档匹配方法, 其步骤包括: 1)根据文档难以匹配的问题。 权利要求书1页 说明书5页 附图3页 CN 111209375 A 2020.。

4、据返回的类别概率值和相似度计算 各条款的匹配概率值, 返回匹配概率最高的条 款。 本发明解决了条款与于一待匹配条款的文档材料a, 计算该文 档材料a与每一条款的条款主题模型相似度和类 别分类; 5)根对于每一条款i, 根据条款i的标注数据集I 训练得到该条款i的条款主题模型和条款分类模 型; 4)对该条款i的相关文档数据并标注所收集每一文档 所对应的条款, 获得每一条款i对应的标注数据 集; 3)块添 加解释词和扩展词, 生成针对每一条款的多个查 询语句; 2)根据条款i的每一查询语句查询收集 文档匹配 方法, 其步骤包括: 1)根据条款切割体系对所选 每一条款句子进行分词块操作, 并对相应词.01) (54)发明名称 一种通用的条款与文档匹配方法 (57)摘要 本发明公开了一种通用的条款与彬 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/332(2019骆丹马路 许洪波刘萍 (74)专利代理机构 北京君尚知识产权代理有限 公司 11200 代理人 司立中国科学院信息工程研究所 地址 100093 北京市海淀区闵庄路甲89号 (72)发明人 张鹏周美林(21)申请号 202010031467.8 (22)申请日 2020.01.13 (71)申请人 (19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日。

展开阅读全文
  我爱发明网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:通用的条款与文档匹配方法
链接地址:https://www.woaifaming.net/doc/740165.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 20018-2021 我爱发明网版权所有

经营许可证编号:粤ICP备20005300号-1



收起
展开