服务器文档检索,知识库文档快速检索方法、应用服务器计算机可读存储介专利_专利查询 - 天眼查...-程序员宅基地

技术标签: 服务器文档检索  

1. 一种知识库文档快速检索方法,应用于应用服务器,其特征在于,所述方法包括步 骤: 接收用户输入的检索信息; 对所述检索信息进行分析、处理以获取查询词; 根据所述查询词对知识库中的文档进行搜索,并根据搜索匹配度对搜索结果进行排 序; 通过摘要生成模型及关键词生成模型获得各文档的摘要及关键词;及 输出排序后的搜索结果,并对应输出目标文档的所述摘要及关键词。

2. 如权利要求1所述的知识库文档快速检索方法,其特征在于,所述对所述检索信息进 行分析、处理以获取查询词的步骤还包括: 当所述检索信息为句子时,通过语法分析及语义分析结合的方式对输入的句子进行分 词处理,剔除无意义的字词符号,抽取出若干个所述查询词;及 当所述检索信息为单词时,依据预设的规则把所述单词在概念上扩展成对应的同义 词、近义词及上下位词,依据同义近义词相似度算法抽取部分扩展词或接收用户选择的扩 展词作为所述查询词。

3. 如权利要求2所述的知识库快速检索方法,其特征在于,所述对所述检索信息进行分 析、处理以获取查询词的步骤还包括: 对所述检索信息进行语义分析与语法分析相结合的分词处理,将经过分词处理分割得 到的词语作为所述查询词; 将分割出的所述査询词在概念上扩展成对应的同义词、近义词或者上下位词,依据相 似度优先算法抽取部分扩展词或接收用户选择的扩展词; 把所述查询词和限定的扩展词一起作为所述查询词。

4. 如权利要求1-3任一项所述的知识库快速检索方法,其特征在于,所述根据所述查询 词对知识库中的文档进行搜索,并根据搜索匹配度对搜索结果进行排序的步骤还包括: 根据所述查询词进行全文检索操作; 以数据库为源,建立索引库,利用TF-IDF计算权重获得搜索匹配度;及 对检索结果根据所搜匹配度进行智能排序,并且使检索词高亮显示。

5. 如权利要求4所述的知识库快速检索方法,其特征在于,所述检索操作包括跨语言信 息检索、拼写检查及正则检索。

6. 如权利要求4所述的知识库快速检索方法,其特征在于,所述根据所述查询词对知识 库中的文档进行搜索,并根据搜索匹配度对搜索结果进行排序的步骤还包括: 根据历史记录和热搜进行搜索结果自动补全。

7. 如权利要求1所述的知识库快速检索方法,其特征在于,所述通过摘要生成模型及关 键词生成模型获得各文档的摘要及关键词的步骤还包括: 对目标文档进行断句、分词,将目标文档的内容拆分成句子及词语;及 通过所述摘要生成模型获取权重值大于预设值的句子生成所述摘要,通过所述关键词 生成模型选择词频大于预设值的词语生成所述关键词。

8. 如权利要求7所述的知识库快速检索方法,其特征在于,所述通过摘要生成模型及关 键词生成模型获得各文档的摘要及关键词的步骤还包括: 根据如下公式建立所述摘要生成模型:

以词频统计为基础建立所述关键词生成模型; 其中,Wi各个句子的权重值;Wij为每个句子和各个关键词的权重,WPi为位置权重值, WSi为语义权重值,a和b为权重系数,wp (ij)为第j各关键词在第i各句子中出现的频数,SP (j)为各个句子里面包含有第j各关键词的句子数,m为句子总数,η为关键词总数。

9. 一种应用服务器,其特征在于,所述应用服务器包括存储器、处理器及存储在所述存 储器上并可在所述处理器上运行的知识库文档快速检索系统,所述知识库文档快速检索系 统被所述处理器执行时实现如权利要求1-8中任一项所述的知识库文档快速检索方法的步 骤。

10. —种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有知识库文 档快速检索系统,所述知识库文档快速检索系统可被至少一个处理器执行,以使所述至少 一个处理器执行如权利要求1-8中任一项所述的知识库文档快速检索方法的步骤。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_35893552/article/details/119626301

智能推荐

selenium.common.exceptions.WebDriverException错误解决_selenium.webdriverexception:-程序员宅基地

文章浏览阅读2.4k次。selenium.common.exceptions.WebDriverException错误解决参考资料说明解决讨论参考资料https://blog.csdn.net/mango_ZZY/article/details/105138176https://selenium-python.readthedocs.io/installation.html#drivers说明今天在python3.7环境下用snapshot_selenium渲染pyecharts的图片,报了以下错:selenium.c_selenium.webdriverexception:

cmd命令杀掉本地java进程_cmd删除运行的java.exe-程序员宅基地

文章浏览阅读1.7k次。taskkill /F /IM java.exe_cmd删除运行的java.exe

2024三掌柜赠书活动第二期:实战AI大模型_实战ai大模型 电子书-程序员宅基地

文章浏览阅读1.1w次,点赞38次,收藏25次。随着人工智能技术的不断发展,越来越多的应用场景需要处理大规模的数据集和复杂的计算模型。传统的AI模型可能无法满足这些需求,因此,实战AI大模型成为了许多技术圈大佬和程序开发人员广泛关注的焦点。那么本文就来分享介绍实战AI大模型的关键步骤和挑战,帮助读者了解如何突破性能瓶颈,构建更强大的AI模型。《实战AI大模型》是一本旨在填补人工智能(AI)领域(特别是AI大模型)理论与实践之间鸿沟的实用手册。_实战ai大模型 电子书

小白乱写——智能车-程序员宅基地

文章浏览阅读342次,点赞9次,收藏8次。前面几个月一直在调stc32的四轮电磁车,最近学长给了一辆stc16f的三轮车,为喜得新车开心了一晚上,觉得后面就是复制粘贴代码的小case。复制粘贴一波操作后,编译居然报错了,哦哦原来是核心板不一样,library也有小变化。问题不大,又操作了一下,0error,0warning。一开机,我的妈,电机疯转震惊了实验室其他小伙伴,还好没有放桌上开机,不然怎么也得冲出去几米远,又试了改占空比,改系统频率和pwm初始化频率都是一如既往的电机发疯,使得我每次开机前都有心理建设一波,开完机看了现象赶紧关。

【OpenCV入门教程之八】线性邻域滤波专场 方框滤波 均值滤波与高斯滤波_邻域平均与高斯滤波-程序员宅基地

文章浏览阅读195次。【OpenCV入门教程之八】线性邻域滤波专场 方框滤波 均值滤波与高斯滤波_邻域平均与高斯滤波

openssl qt 生成秘钥_delphi - 使用OpenSSL生成密钥对 - 堆栈内存溢出-程序员宅基地

文章浏览阅读593次。我正在使用delphiopenssl包装器生成.pem格式的密钥文件。 我正在使用“ 生成RSA密钥”示例来生成这些密钥。我需要的两天前,我希望找到一种简单的方法来生成RSA密钥,并使用它们来加密/解密某些字符串或TBytes缓冲区。 现在,在搜索了所有可能的解决方案之后,我决定使用OpenSSL来完成这项工作我的问题问题是我无法使用功能输入的文件名创建文件。 但是我仍然得到一个名为“ C”..._lzqtxh

随便推点

PageHelper分页能查出总条数但是列表没有数据_pagehelper查询的时候总数有三条,但是list是空的-程序员宅基地

文章浏览阅读4.7k次。前言如题,转载地址:https://blog.csdn.net/ZS12345678ZS/article/details/91871504原因:pagehelp分页pagenum从1开始_pagehelper查询的时候总数有三条,但是list是空的

Android adb/串口命令设置和获取系统音量_android手机发送usb hid 音量设置指令-程序员宅基地

文章浏览阅读1.6k次。原文地址:https://blog.csdn.net/sunxiaolin2016/article/details/1088437161、查看audio的全部信息(各音频流音量,焦点,策略等) dumpsys audio12、设置音量并且显示音量UI //stream 3表示多媒体,10表示音量值 media volume --show --stream 3 --set 101 23、音量调大调小 media volume --stream 3 --adj r._android手机发送usb hid 音量设置指令

生物传感器技术的进步:从基因测序到智能穿戴设备-程序员宅基地

文章浏览阅读790次,点赞15次,收藏12次。1.背景介绍生物传感器技术是一种用于测量生物系统中物质、信息和能量变化的设备。它们在医疗、环境监测、农业和生物科学等领域具有广泛的应用。随着科技的发展,生物传感器技术不断进步,从基因测序到智能穿戴设备,这些技术的进步为我们提供了更多的可能性和机遇。在本文中,我们将探讨生物传感器技术的进步,包括基因测序、微机器人、生物芯片和智能穿戴设备等领域的发展。我们将讨论这些技术的核心概念、联系和算法原...

COM多线程原理与应用-程序员宅基地

文章浏览阅读33次。http://blog.csdn.net/sheismylife/article/details/217033目录:COM多线程原理与应用... 1目录:... 1前言:... 1套间:... 1套间的定义:... 1套间的分类:... 2套间的进入和退出:.. 2对象的同步:... 2组件对象的同步:... 2COM对象线程模型:.. 2进程内对象...

什么是“月结30天”?(轉)-程序员宅基地

文章浏览阅读9k次。2019独角兽企业重金招聘Python工程师标准>>> ..._月结30天

《深入理解Android内核设计思想》-程序员宅基地

文章浏览阅读523次。《深入理解Android内核设计思想》基本信息作者: 林学森 出版社:人民邮电出版社ISBN:9787115348418上架时间:2014-4-25出版日期:2014 年5月开本:16开页码:687版次:1-1所属分类:计算机 > 软件与程序设计 > 移动开发 > Android更多关于》》》《深入理解Android内核设计思想..._android内核设计思想

推荐文章

热门文章

相关标签