• / 17

题目自动标注分类的方法和系统

关 键  词:
题目 自动 标注 分类 方法 系统
资源描述:

《题目自动标注分类的方法和系统》由会员分享,可在线阅读,更多相关《题目自动标注分类的方法和系统(17页珍藏版)》请在我爱发明文档网上搜索。

1、近似值和中文文本语义近似值: 在上述公式(1)中, Title(An, Bm)表示所述题目文本数据样对所述题目文本数据样本进行文本语种信息识别处理, 从而获得所 述题目文本数据样本中包括的英文文本语义, 以此获得所 述题目文本数据样本对应的英文文本信息和中文文本信息具体包括: 根据下面公式(1), 动标注分类的方法, 其特征在于: 在所述步骤S2中, 对所述题目文本数据样本进行文本语种信息识别处理本数据, 从而将 所有目标题目对应的题目文本数据组成题目文本数据样本。 3.如权利要求2所述的题目自目文本字符轮廓信息, 并根据所述 题目文本字符轮廓信息, 将所述灰度化图像转换为对应目标题目的题目文。

2、波处理, 从而将所述二 维图像转换为灰度化图像; 步骤S103, 从所述灰度化图像中提取得到相应的题得关于每一个所述目标题目 的二维图像; 步骤S102, 对所述二维图像进行像素二值化处理和背景降噪滤述目标题目 的题目文本数据样本具体包括: 步骤S101, 对每一个所述目标题目进行扫描拍摄, 以此获获得关于每一个所述目标题目 的图像信息, 并对所述图像信息进行文本数据转换处理, 从而获得关于若干所所述的题目自动标注分类的方法, 其特征在于: 在所述步骤S1中, 对若干目标题目分别进行拍摄, 以此干所述目标题目匹配划分到不同题目集合 中, 从而实现对若干所述目标题目的自动分类。 2.如权利要求1。

3、以此获得 所述题目文本数据样本对应的学科类型标注信息; 步骤S4, 根据所述学科类型标注信息, 将若文文本信息和中文文本信息; 步骤S3, 对所述英文文本信息和所述中文文本信息进行词语类型识别处理, 步骤S2, 对所述题目文本数据样本进行文本语种信息识别处理, 以此获得所述题目文 本数据样本对应的英 息, 并对所述图像信息进行文本数据转换处理, 从而获得关于若干所述目标题目的题目文 本数据样本; 其包括如下步骤: 步骤S1, 对若干目标题目分别进行拍摄, 以此获得关于每一个所述目标题目的图像信 A 2020.11.24 CN 111985193 A 1.题目自动标注分类的方法, 其特征在于,效。

4、率和便于后续对题目进行分析处理。 权利要求书4页 说明书11页 附图1页 CN 111985193能够对 海量的不同类型目标题目进行有针对性的和高 效的自动标注与分类, 从而提高对题目进行深加 工的类型, 并且进 行适应性的标注, 最后根据该标注的结果将目标 题目自动分类到相应的题目集合中, 这样别包含的英文文本和中文 文本, 再根据该英文文本和该中文文本各自包含 的词汇类型得到其对应所属的学科通过对目标题目进行拍摄和将拍摄得到 的图像转换为相应的题目文本数据, 并识别得到 题目文本数据样本分明名称 题目自动标注分类的方法和系统 (57)摘要 本发明提供了题目自动标注分类的方法和 系统, 其20.01) G06K 9/00(2006.01) G06K 9/40(2006.01) (54)发40/284(2020.01) G06F 40/289(2020.01) G06F 40/30(20 (72)发明人 樊星 (51)Int.Cl. G06F 40/166(2020.01) G06F 海松鼠课堂人工智能科技有限公 司 地址 200237 上海市徐汇区宜州路188号2 幢9层、 10层21)申请号 202011048811.0 (22)申请日 2020.09.29 (71)申请人 上19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日。

展开阅读全文
  我爱发明文档网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:题目自动标注分类的方法和系统
链接地址:https://www.woaifaming.net/doc/5061.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 20018-2021 我爱发明网版权所有

经营许可证编号:粤ICP备20005300号-1



收起
展开