
基本信息:
- 专利标题: 搜索文本的歧义识别方法、系统、设备及存储介质
- 申请号:CN202010440030.X 申请日:2020-05-22
- 公开(公告)号:CN111611452B 公开(公告)日:2023-05-02
- 发明人: 范遥新 , 肖铨武 , 申思 , 陈冬露
- 申请人: 上海携程商务有限公司
- 申请人地址: 上海市长宁区金钟路968号12号楼203室
- 专利权人: 上海携程商务有限公司
- 当前专利权人: 上海携程商务有限公司
- 当前专利权人地址: 上海市长宁区金钟路968号12号楼203室
- 代理机构: 上海隆天律师事务所
- 代理人: 钟宗
- 主分类号: G06F16/903
- IPC分类号: G06F16/903 ; G06F16/9032 ; G06Q30/0601 ; G06Q50/14
摘要:
本发明提供了一种搜索文本的歧义识别方法、系统、设备及存储介质,所述方法包括步骤:基于字符串匹配算法对待识别的搜索文本进行歧义性识别,获得第一识别结果;基于关联待识别的搜索文本的历史搜索数据库,对待识别的搜索文本进行歧义性识别,获得第二识别结果;获取搜索引擎关于待识别的搜索文本的前N个搜索结果,并从每一个搜索结果中提取出第一关键词,依据不相同的第一关键词的个数,确定第三识别结果;构建文本语义匹配模型,依据训练后的文本语义匹配模型,获得第四识别结果;基于上述识别结果,对待识别的搜索文本进行歧义识别;本申请实现了对搜索文本歧义性的多角度识别,提高了识别的准确性。
公开/授权文献:
- CN111611452A 搜索文本的歧义识别方法、系统、设备及存储介质 公开/授权日:2020-09-01
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F16/00 | 信息检索;数据库结构;文件系统结构 |
--------G06F16/10 | .文件系统;文件服务器 |
----------G06F16/903 | ..查询 |