挖掘说明书中的检索要素

(整期优先)网络出版时间:2024-05-23
/ 2

挖掘说明书中的检索要素

刘雅洁

国家知识产权局专利局专利审查协作天津中心 

摘要:从说明书中挖掘有效的检索要素,第一,可以体现审查的全面性,第二,可以体现审查的有效性,我们要学会从说明书中挖掘有效的检索要素,从而保证检索的有效性和全面性,最后达到审查的有效性和全面性目标。

关键词:检索;说明书;全面性;有效性

一、引言

提高审查意见通知书尤其是第一次审查意见通知书的全面性和有效性,是提升专利审查质量的重要一环。而为了提高一通的全面性和有限性,必须提高检索的有效性和全面性,良好的检索质量才是审查质量的根基。可以说,检索是一把剑,锋利程度取决于检索的全面性和有效性。在审查的过程中,需要时不时地磨砺这把剑,使得我们手中的剑越来越锋利,以使得检索越来越全面和有效。检索的全面性和有效性保证了,那么通知书的全面性和有效性也就保证了。

说明书中的很多地方很可能会挖掘出有效的检索要素,对于检索要素的确定有着十分重要的作用。而从说明书中挖掘有效的检索要素,第一,可以体现审查的全面性,即使用说明书中的检索要素检索到的对比文件不仅可以公开权利要求中的技术方案,也能公开说明书中的技术特征,第二,可以体现审查的有效性,即使用说明书中的检索要素检索到的对比文件更能贴近本申请所记载的技术方案,不论权利要求如何修改,证据都是最有效的。因此,我们要学会从说明书中挖掘有效的检索要素,从而保证检索的有效性和全面性,最后达到审查的有效性和全面性目标。

从说明书中挖掘有效的检索要素也是需要方法和技巧的,今天我们要讲的是通过说明书中对技术效果、技术手段的举例,来确定检索要素。

二、案例分析

(一)通过说明书中对技术效果、技术手段的举例,来确定检索要素

(1)案情介绍:

该案例涉及的是文字域类型识别方法,而文字域类型识别指的是,例如针对身份证中的文字进行识别,其识别的结果为哪些是属于姓名类型,哪些是属于民族类型等。而本申请针对现有技术中文字域类型识别方法准确率低的技术问题,提出了一种利用长短期记忆人工神经网络(LSTM)方法来识别文字域类型;相关权利要求如下:

1. 一种文字域类型识别方法,其特征在于,所述方法包括:

步骤S101:载入文字数据的语言模型,其中所述语言模型为利用所述文字数据基于神经网络训练得到的文字域分类器;以及

步骤S102:通过所述语言模型确定新输入的文字数据的文字域类型。

权利要求2. 如权利要求1所述的文字域类型识别方法,其特征在于,所述神经网络是长短期记忆人工神经网络LSTM。

(2)审查过程:

分析本申请后可得到检索的重点有两个:1.识别得到的结果是文字域的类型,2.识别文字域类型的方法是长短期记忆人工神经网络(LSTM)。首先,通过百度的检索陌生的LSTM网络可知,LSTM是识别领域中广泛使用的神经网络算法,也是一种较为前沿的神经网络算法,因此,可以推断本申请使用了现有的一种神经网络算法来实现文字域类型,那么检索时,对文字这个检索要素进行扩展:文字 or 文本 or 字符 or 手写,对类型这个检索要素进行扩展:类型 or 类别 or 区域 or属性,但是并没有检索到使用LSTM来识别文字域类型的方法,因为LSTM是一种较为前沿的神经网络算法,可能应用的还不是很广泛,而本申请中的权利要求和说明书中只是限定了使用LSTM来识别文字域类型,并没有将使用LSTM如何识别文字域类型进行详细的说明,那么就可以先针对权利要求1中限定的使用神经网络来识别文字域类型的方法进行检索,针对权利要求2中的LSTM算法可以再结合使用LSTM算法进行识别的其他文献,但是在检索中发现使用神经网络进行文字域类型识别的方法也没有。

再来分析检索的两个重点:1.神经网络,2.文字域类型识别,神经网络是本领域广泛使用的技术术语,因此没法再扩展了,那么扩展的重点就是文字域类型识别,回过头分析说明书中对文字域类型识别的描述,其中举的例子里,文字域类型识别得到的结果可能为姓名、地址、性别、民族、出生日期等,那么可以使用举的例子里识别得到的结果进行尝试,即使用技术效果的举例确定检索要素,考虑到姓名、性别、民族这几个词比较明确,不会产生噪音,而且可能是需求比较大的识别类型,就使用姓名、性别、民族加上神经网络进行检索,检索到了对比文件A(“法院判决书关键信息抽取系统设计与实现”,刘稳等,《湖北工业大学学报》,第33卷,第1期,第63-66页,2018年2月28日),其公开日虽然在本申请的申请日之后,但是在文章中其介绍了命名实体识别是从文本中提取出具有特殊含义或信息的名词和短语,并为之添加标注信息的方法;一般来说,命名实体识别主要是识别出文本的三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)。

由此可见,本申请中的文字域类型识别在本领域中有着特定的术语“命名实体识别”,因此,使用命名实体识别+LSTM在外文论文库中进行检索,得到了对比文件(“Named Entity Recognition with Long Short-Term Memory”,James Hammerton,《CONLL '03 Proceedings of the seventh conference on Natural language learning at HLT-NAACL 2003》,第4卷,第172-175页,2003年12月30日),其公开了使用LSTM进行命名实体识别的方法,因此可以用来评述权利要求1、2的新颖性。

(3)总结

在检索中我们要注重说明书中对技术手段、技术效果的描述,因为像上述案例这样的情况,申请人将现有技术中有着特定术语的技术特征“命名实体识别”使用自己的话“文字域类型识别”来撰写申请时,其实就为审查员的检索设置了障碍,使用“文字域类型识别”这个字面上的技术特征来检索,无论扩展的如何充分都不会检索到可用的对比文件,可能会使我们误以为本申请具有创造性高度,这个时候,不能放弃说明书中任何对该技术特征的描述,

说明书中对“文字域类型识别”的描述,其中举的例子里,文字域类型识别得到的结果可能为姓名、地址、性别、民族、出生日期等,那么可以使用举的例子里识别得到的结果进行尝试,再从举的几个例子中选择不会产生噪音,而且可能是需求比较大的识别类型作为检索要素,即使用姓名、性别、民族作为检索要素。

在现有的很多申请中,都不乏将特定术语使用自己的话来撰写申请的情况。有的时候,我们常常会忽略说明书中对特定术语的举例,因为,举的例子只是其一种实现的可能性,并不具有绝对性,就像上述案例中,对于“文字域类型识别”的举例中,姓名、地址、性别、民族、出生日期等只是识别的几种可能结果,并不代表其识别结果中一定是包含姓名、地址、性别、民族、出生日期。但是这种举例,也给我们审查员一个检索的尝试方向,我们可以使用举例中不会产生噪音,而且可能是需求比较大的识别类型作为检索要素,就有可能检索到本领域中的特定术语,也使我们更靠近可用的对比文件。

通过上述案例的分析可以看到,对于说明书中对技术手段、技术效果的描述,我们一定要充分利用起来,尤其是涉及技术效果、技术手段的举例,我们也不要忽视,可以尝试将其作为检索要素进行检索,能够高效地检索到最接近的现有技术。

三、总结

我们在日常审查中,一定要充分利用说明书中公开的内容,通过对说明书内容的挖掘,获取有效的检索要素,对于说明书中经常容易忽视的举例、代码,也要重视起来,不放弃任何一个可以挖掘出有效检索要素的地方,从而提高检索的全面性和有效性。