化学专利检索的五大难题终于解决

来源:智慧芽学院

本文根据兰腾信息咨询公司化学领域分析师叶心霞老师3月16日做客智慧芽学院线上webinar问答环节编辑整理。叶老师将化学检索的过程比喻成切蛋糕,希望通过叶老师细致专业的解答,学员们也能从看似单调的检索过程中寻找到无限乐趣,学习好攻克化学检索的重难点的技巧,提高化学专利人员的工作效率和质量。

1、 检索中哪些步骤是最主要的也是最重要的?常会遇到一些什么问题,我们怎么避免?

叶老师答:

我觉得检索其实是非常灵活的工作。项目不同,侧重点就不同。比如说以化合物的角度切入的话,当然这个化合物本身是最主要的,不同于一个制备的过程或者是一个药物的组分,或者药物的性状(比如说有一些药物是粉状的还是微球状的,还是别的形貌的,纸质体状的等等),因为检索项目的侧重点不同,在检索的过程中切入的角度可能就不同,要根据每个情况来定。

我也提到了在检索过程中,其实我们要平衡查全和查准。查全和查准的平衡对于检索项目的类别来说,其实也是不一样的,比如说防侵权,就是尽量的查全,而查新检索,就是找到全部的技术特征最符合的那一篇。

我觉得检索工作中最主要的,其实是要有清晰的思路策略。比如说我们会说检索是一块大的蛋糕,基于时间和效率,要从不同的角度去考虑怎么切这个蛋糕。可以先排个优先级,从你觉得最有可能的那个角度去切,然后慢慢的,根据时间和分配的考虑,慢慢越切越大,把这个范围也慢慢越放放宽。

其实在检索中很常见的情况就是把一些检索式输进去后发现结果很多,就不知道下一步该怎么走了。这个时候要有很明确的思路和策略,就是要知道朝哪个方向走,用哪一些限制条件去限制。我觉得在检索过程中这也是乐趣所在,因为根据不同的项目会有不同的思路。

2、在检索CA的过程中发现有这种情况:虽然专利包确实含某个结构式,这个结构式也是有CAS号的,但是在这篇专利中没给这个结构式CAS号,那如果以相应CAS号检索岂不是漏掉了这篇专利?貌似这种情况还有一些?遇到这种情况该怎么办?

叶老师:

也就是说,用CAS号检索的时候,它是不是就是唯一对应的?首先我也说过CAS号的登记号、或者CAS的系统是基于人工检索的过程,所以如果说一篇文章出现了一个有CAS号的物质,那么它就会被索引到系统里。之前我们有个案子也是结构检索,客户给我们的反馈是,文章里没有这个结构式,为什么结果也会出现在最后的结果列表里头呢?我们的解释就是它用别的方式表达了这个物质。虽然它没有出现在最后的结构里,用结构来表示,但是它也会被STN捕捉到,所以像这个同学说的,有个结构式,它有CAS的号码,虽然没有在专利里给出CAS号码,但是它也会被STN的数据库收入。

3、请问叶老师对画一些重复单元的高分子,比如树状化合物,有什么好的经验和建议吗?

叶老师答:

老实来讲STN是一个很复杂的检索体系,目前我也不能说完全掌握。高分子检索其实有一套专门的策略和思路。高分子是由小的单体聚合而成,所以其实从高分子检索的角度来说是从单体的角度切入。那么在STN里面你可以用这些单体找到相应单体的登记号,用这些单体的登记号结合例行检索,不一定要从绘画结构的角度出发来进行检索,这是我的一个建议。

4、在使用SciFinder数据库时,采用ChemDraw画出的结构检索,所得的结果感觉不是太全,请问如何改善呢?

叶老师答:

我在刚才讲到的大部分是STN的数据库,其实SciFinder也是CAS底下另外一个数据库的平台,它跟STN相当于是平行的,但是两者收入的数据库也有一些重合的地方。我们首先要认识SciFinder这个数据库,从我这个从业者的角度会把两个数据库进行比较,比如STN底下收入的数据库相对于SciFinder来说更全面一点。STN有100多个数据库,SciFinder只有6—7个数据库,所以首先SciFinder数据库的收入有一定限制。你说采用ChemDraw画出结构检索得到的结果不够全面,因为我现在不太确定SciFinder的结构检索关于模糊检索的定义是怎么样的,如果它可以像STN这样,不同的集团可以有一定的灵活度的话,我觉得你可以把这个灵活度放宽一点,比如说用整个类别去替代卤素的原子,可能也是要跟这个ChemDraw画出的结构的灵活度有关系,我是这样的想法。

5、 在用SciFinder搜索某个特定药物的专利时,怎么快速确定某个专利是否是化合物专利、制备方法、晶型,只能一个个的去读权利要求吗?有没什么快点办法?

叶老师答:

用SciFinder很快定位的方法是,读一下题目或者是摘要,就会大概知道这个专利是用什么内容。我不确定在SciFinder是怎么样,在STN里面是有个CAS role这个功能,就是CAS的角色,你可以用这个。这个角色也是人工索引的过程,包含很多CAS自己定义的类别,比如是溶液、药物代谢的过程、药物疗效的使用、合成的准备过程还是副产物等等。你可以用CAS role去限制检索出来的专利或者专利集合。这是一个方法,其实CAS role跟专利的分类号有点像,除此之外可以用关键词去限制,比如用制备方法的专利关键词去限制,这是我的看法。