语义检索在专利文献检索中的应用及优化研究

(整期优先)网络出版时间:2019-06-16
/ 2

语义检索在专利文献检索中的应用及优化研究

石勇杨杰

沃杰(北京)科技有限公司北京101399

摘要:为了研究语义检索在专利文献检索中的应用及优化,笔者通过沃杰(北京)科技有限公司多年工作经验,在理论结合实际的前提下进行相关工作的开展。积极积累现场经验,全面协调当前复杂问题。为同行提供建设性意见。

关键词:语义;检索;专利;文献;运用

1引言

国家的发展与科技的进步需要长效而有力的法律法规保护,而发明专利的申请审批率一定程度上体现了相关领域及其下属市场的科技创新能力。极大的反应了产品研发水平与市场开拓性的具体指标。国际上运用相关专利进行已有技术的保护能极大提高跨国公司的竞争力,极大帮助企业在国际上立足。所以专利是申请与审批是一项具体而严谨的工作。基于此,专利文献检索无论是申请方还是审批方都即为重要。在后续的管理和维护上也需要进行专利文献检索例如关键词和相关定义类词句。通常在相关实施细则上需要进行查准率和查全率的全面覆盖,在相关检索策略下进行合适的检索平台布设,尽可能在模糊框架下减少检索噪音带来的干扰和相关效率的下降。避免漏检和错检等现象发生。

2语义检索在专利文献检索中的应用分析

语义检索,是一种智能检索,是指搜索引擎的工作不再拘泥于用户所输入请求语句的字面本身,而是透过现象看本质,准确地捕捉到用户所输入语句后面的真正意图,并以此来进行搜索,从而更准确地向用户返回最符合需求的搜索结果。其中,相关的软件识别系统是基于数据平台读取反馈比对进行的,通常不同查询目标会得出多重运算检索结论,但是因为匹配度的关系,往往会对用户带来不同的体验。例如关键字的检索查询环节,由于用户对相关语意的理解不同会给出不同不标准前提下的错误词汇。所以只有进行先期的智能筛选才能最终进行查询目标终端式的知识库匹配并最终得到相关实体。通过不同的本体关系拟合性推导会逐步完善和理解用户的目标预期和概念性结论。基于相关检索框架和习惯,市面上常见的语义检索系统有Patentics、To-talPatent等。但在PAT-Ku专利大数据平台中,点击首页“语义检索”后,将出现图1所示的检索界面:

图1操作界面

在检索区域输入一段文字,如“支撑板的端部之间设有顶板,顶板上设有散热电机”检索后,即可显示相应结果。语义检索为用户筛选最相似的900件专利进行显示,其中,语义值的大小表示此专利的相似程度,语义值越大,说明此专利的相似度越高,检索结果是按语义值的降序排列。

3语义检索系统的优化

3.1提高与发明点相关的关键词的权重

PAT-Ku平台能带来快速检索,但是当输入公共专利文件的数量,系统作为专利文献的全文检索的概念,导致缺乏关注专利发明点,也就是说,要解决的技术问题和技术效果。因此,会有很多嘈杂的文件,增加用户的读者群。如申请号CN20105741098,申请日期为2010年12月6日,公众号CNl02104507A。索赔1是一种补丁检查方法,适用于包括安全策略服务器、补丁服务器和多个客户机在内的系统。它的特点是允许客户端在补丁检查之前访问网络。该方法包括以下步骤:安全策略服务器获取每个接入网客户端对应的最后一个补丁检查时间戳信息;如果时间戳信息和当前时间超过预置时间,则向对应的客户端提供第一个标识;安全策略服务器从具有第一个标识的接收网络的客户机中选择要检查的客户机,并通过。如果要检查的客户机的补丁检查不合格,则补丁服务器将更新要检查的客户机的补丁。应用描述表明,现有技术中的补丁检查过程导致了较大的网络带宽和补丁服务器的处理压力,本发明的优点是可以整体控制补丁的负载压力。在S系统的CNABS数据库中,审查员使用searchfieldEFFECT,代表所解决的技术问题和有益的效果,输入searchform:/EFFECT(softwareorpatch)和serverandpressure,得到12份专利文件。发现专利文件出版CNl01179425A可以用来评估索赔的创造力。但是,如果用于Patentics语义检索系统和CNl01179425ANDDI/20120120106是输入,没有创意的专利文献,可以发现评价权利要求1在前三页的搜索结果页,共计60专利文件。

专利文献往往解决技术问题,取得技术效果。如果搜索专利文献的全文而不考虑关键点,则有时无法获得有用的搜索结果。为了解决这些缺陷,在语义检索时,可以说解决了专利文献中的技术问题(如问题、缺陷或错误),并说在关键词附近的技术效果(如效果、目的和优点或好处等)增加了权重,使检索结果集中在一项发明专利申请上,有助于提高相关技术问题的效果,并在检索结果页中对技术专利文献的相关性进行排名。

3.2使用对检索结果的反馈和审核机制

在大多数国家的专利工作协助平台上相关的审查员运用Patentics系统只能得到具有一定局限性的检索审查结论,在时效和信息上产生滞后性残差。比如说进行CN20121033420784的我国发明专利的检索式查询,相关系统只能显示在某年发布了片面的驳回该申请的公告。可是在对比工况下的Patenfics系统因为缺乏文件显示而不能进行审查意见的全文发布和批阅。同时在审查过程中对于相关专利创新性权重排比信息也无从知晓,严重制约相关专利撰写人的后续改进,相关的Patentics系统还不能进行引用处的文件优先级对比识别。最终产生了多重噪点数据。所以运用PAT-Ku平台能彻底解决上述问题

3.3纳入非专利文献数据

专利数据库大规模收录是PAT-Ku系统的亮点但是不能进行及时知识的获取和相关参考文献的对比更是某些专利申请过程中相关报告和通知书不全面导致的对比问题和文件失效。非专利文件对检索系统的预测和辅助其实很多程度上帮PAT-Ku系统提高工作效率和用户体验。单一的规避和不完全讨论只能使用户陷入困局。全面进行系统的优化和查准率升级远比查全率更加有失效意义。

4结语

多重构想下的语义检索能帮助相关审查员进行创新点的高效审核,杜绝学术造假和投机现象的发生。而文献数据库的智能人性化操作正式基于传统关键词权重化查重而演变式核算而来的。运用人为思考模式下的主观性能全面和准确的进行大规模文件评价。在非专利文献数据库帮助下全面提高反馈可调式审核细节,使机械式的软件运行审核流程更加可行。也使得专利文献审查工作更加科学和可靠。

参考文献

[1]周胜生.关键词在专利文献检索中的应用[J].情报理论与实践,2010,33(5):67-70.

[2]孙志飞.语义检索在专利文献检索中的应用及改进[J].信息技术,2014(5):127-129.

[3]储振华.不确定语义检索在专利智能服务平台中的应用[D].苏州大学,2009.

[4]伊雯雯.专利信息检索系统中本体半自动构建的研究与应用[D].苏州大学,2008.