第2章 知识流动的内涵及其实现机理
2.1 知识流动的内涵与量化表征
2.1.1 知识的内涵及其基本特征
1. 知识的概念
知识经济时代,尽管知识已经成为经济及社会发展的核心要素,但是对于知识的精确定义仍然是哲学家、社会科学家关注的话题。
Purser和Pasmore(1992)[82]将知识定义为:用以制定决策的事实、模式、概念、意见、及直觉的集合体。Nonaka(1994)[83]认为知识是一种被确认的信念,通过知识持有者和接收者的信念模式和约束来创造、组织和传递,在传递知识的同时也传递着一套文化系统。知识是从不相关或相关的信息中变化、重构、创造而得到的,其内涵比数据、信息要更广、更深、更丰富。依据Davenport(1998)[84]的观点,知识是一种包含结构化的经验、价值观、关联信息以及专家见解等要素的流动态混合物。它起源于认识者的思想,并对认识者的思想起作用。
上述对知识概念界定的出发点皆不同,因此,对于知识的描述也各有侧重,但可以看出对于知识的概念学者们达成一些基本的共识:首先,知识是传达概念的一种形式,是抽象的;其次,知识源自经验的固化,是人类的认识成果;最后,知识是一个集合体,具有结构性特征。在经济学研究领域,经济学家经常利用知识这个概念,但是却没有详细定义这个概念。知识被理解为一种能够被认识到且被个体利用的工具,是促进生产活动的要素之一,是一种经过加工提炼能够进入经济运行系统的资源。在经济运行过程中,知识被物化为技术装备,或者为劳动力所承载,通过这两种载体对经济运行和生产活动发挥作用。
知识、信息和数据是存在明显区别但是互相联系的概念(见图2.1)。数据是最原始的数据的表示方法,其包含着大量的无用的噪音;信息来源与数据,在数据的基础上剔除噪音得到的有价值的数据就是信息,信息容易被编码因而容易在低成本的情况下被传播、接受、转移或者储存;知识源自信息,在信息的基础上经过提炼抽象得到的能够解决问题的结构化信息才是知识。
图2.1 知识、信息和数据的关系
明确区分这三者之间尤其是信息和知识的概念非常重要。这是因为信息和知识的流动方式存在着明显的差距,同知识相比信息在流动中具有更低的摩擦性。信息是容易被编码的数据,因而容易在低成本的情况下被传播、接受、转移或者储存;而知识包含着一部分因为其本身固有的特质而难以编码、解释的结构性信息,因此,一部分知识如果不是通过直接的面对面的交流是很难传递的。大部分的知识都是先转化成信息,然后再通过信息传播的渠道进行传递的。信息的传播成本可能和距离的远近无关,但是,知识传播的成本随着距离的增加而增加。
基于上述认识,本书将知识定义为:在经验中形成的,以经济运行系统的资源为载体的,承载着各种认知和解决问题、做决定、理解问题的能力的抽象化、结构化信息。
2. 知识的特征
1)竞争性和排他性
排他性和竞争性是经济学分析惯例中最常用的两种性质。一种纯粹的竞争性的商品被特定公司或者特定个人使用的时候就排除了其他个体的使用,而一种纯粹的不具有竞争性的商品被一个个体使用并不影响它被其他个体使用。排他性与技术或者法律系统密切相关。如果一种商品是排他的,那么一个个体的所有权将会阻止其他个体的使用权。通常一般有物质实体的商品都是竞争的、排他的,而公共商品是非竞争的、非排他的。
从自然属性上看,知识是抽象化的概念,一种知识可以同时由很多人使用,且相互之间不构成障碍,因此知识是非竞争性的,当经济个体使用某种知识及其载体生产的商品和服务时,并不妨碍其他经济个体也使用同一种知识或承载着同一种知识的不同载体。然而知识的创造需要成本,知识的自然属性引致的非竞争属性将会导致知识的生产和配置完全脱离竞争市场的力量控制,因此,需要建立某种制度使知识具有某种程度的排他性。这种制度就是知识产权保护制度。在知识产权保护制度框架下,知识的创造者或者所有者可以在一定程度上使其他未经授权的个体不能使用该种知识。知识产权保护制度越完善,知识的排他性也就越强。
知识的非竞争性和部分排他性并不是绝对的,对于不同类型的知识,竞争性程度和非排他性程度也不同。根据Romer(1987)的分类,产品的设计知识是非竞争的、非排他的,而关于过程的知识则是部分排他的。同一种知识,随着时间的演进,其竞争性和排他性程度也会发生变化,一种知识在产生最初排他性非常强,随着时间的推移,随着该知识的传播或者知识产权保护期的失效,其排他性逐渐减弱。
在界定不同的知识时,用竞争性和排他性的程度来衡量,具有重要的意义。因为竞争性和非排他性的程度将会影响知识的流动程度。高排他性为知识的非创造人和非所有人的使用设置了一定的门槛,因此,高排他性知识的流动效率较低,具有一定的时滞性。通过这一机制,排他性和竞争性的程度间接影响创新活动的区域集中程度。当创新主体不需要通过共享知识而进行创新的时候,知识的排他性及竞争性程度将不会影响他的区位选择,他可能会选择地理孤立的区域,也可能会选择地理集中的区位。但是,当共享的知识作为各个创新主体进行创新的重要源泉时,较低的排他性将会导致创新主体更易于出现地理集中现象。这是因为,低排他性能够增加知识的流动效率,特别是在特定区域内部的流动效率,继而促使创新主体的空间集中。
2)隐性与可编码性
知识是抽象的,语言同样是抽象的,因此,在用语言表达知识的过程中存在着比较大的局限性,并非所有的知识都可以用准确的语言来表达。很多知识都含有无法用精确的语言来表达的成分,这种性质就是知识的隐性。知识的隐性意味着知识在一定程度上是高度专用的、难以转移的且难以模仿的。
因为知识的隐性,把知识转化为可以表述的、规范的形式就显得至关重要。[85]知识的表达是语言与逻辑范畴内的问题,知识的表达需要表达者有更深层次的庞大的知识体系作为支撑。[86]知识可以通过语言来进行表达的性质称为可编码性。知识的可编码性意味着知识更容易被物化,从而通过各种途径传播出去。
不同类型的知识有不同的隐性程度和可编码性程度。一般来讲,经验性、逻辑性、技能性知识,深藏于人们的头脑、心理和行为之中,很难被意识到,因而其隐性程度较高,可编码性较低。而关于客观事实的知识,以及涉及客观世界的原理和规律的知识,则容易被意识继而被编码、物化,其隐性程度较低,可编码性较高。
理解知识的隐性及可编码性程度对于认识知识的流动过程有着重要的作用。具有较低隐性程度的知识更容易被标准化、被编码继而通过各种途径被传播。相反,具有较高隐性程度的知识就不容易通过标准的媒介传播。当高程度的隐性知识从一个人传播到另一个人时,需要他们彼此校正自己的表达和解释行为,在这种模式下,面对面的交流变成知识转移的一个必要的条件。[87]因此,当知识有更加隐性的本质的时候,面对面的交流就更加的重要,继而地理接近性就更容易促进知识相关的转移活动的发生。[88]也就是说,知识的可编码性越弱,其在特定地理空间内集中的程度就越高。正如Feldman和Lichtenberg(1997)[87]的研究证明,研究与开发活动所产生的知识的隐性越强,可编码性越弱,研究与开发活动的地理性、可控制性、集中程度也就越高。
3)损耗性
从本质上看,知识存在于人的意识中,是一种无形的资产。无形资产虽然不像有形资产那样容易发生损耗和折旧。但是,因为人类对于客观世界的认识总是在不断地加深,新的知识总是在不断地产生。新知识的产生一方面可能会导致原有的知识因其假设被推翻而灭失,另一方面还可能导致原有的知识老化过时而产生折旧。作为无形资产的知识这种同有形资产类似的灭失和折旧的性质称为知识的损耗性。知识的损耗性是知识生产的一种负的外部性。该负外部性的存在导致知识价值随时间的推移而逐渐衰减,继而导致知识生命周期的缩短。产品生命周期和技术生命周期的缩短是知识生命周期缩短的映射。[90]
不同类型知识随着时间的推移衰减程度是不同的。对于那些研究开发活动比较密集的或者研究与开发周期较短的知识,其衰减程度较高。高技术产业中的新兴产业、朝阳产业总是能够吸引大量的研究与开发力量,因而其知识衰减速度较快。
较高的知识衰减程度可能会导致较快的知识流动速率。Jaffe和Trajtenberg(1996)[89]的研究发现在特定领域(电子、核技术)有很高的引用倾向,而上述技术领域都有明显的高技术衰退率。
知识的衰减程度影响着创新的空间集中程度。如果创新相关的知识的衰减速度较快,有助于产生创新的知识存量是逐渐减少的,这就意味着发明者必须在搜索有用的知识上面花费得更多,而坐落于相同的区域内部将会降低搜索知识的成本,因而在有较高平均知识年衰退率的产业倾向于坐落在新知识源附近。随着价值的衰减,知识流动的本地化效应逐渐降低。Jaffe和Trajtenberg(1996)[89]研究揭示了在专利的第一年,专利的引用本地化倾向更加明显,但是引用的地理集中程度随着时间的推移逐渐减弱。
3. 知识的分类
对知识进行科学的分类是建立在对于知识的内涵的深刻理解之上的。因此,随着人类对于知识内涵的认识的不断深入,知识分类的角度也逐渐拓展,知识的分类体系一直处于动态变化中。在本书中,我们重点阐述与知识的经济属性密切相关的几种分类。
1)事实知识、原理知识、技能知识和人力知识
世界经合组织(OECD)在1996年的年度报告《以知识为基础的经济》中将知识分为四大类,该分类从知识经济的视角出发,目前成为最具权威和流行性的一种分类。根据该分类,知识分为知道是什么的知识(Know-what)、知道为什么的知识(Know-why)、知道怎么做的知识(Know-how)以及知道是谁的知识(Know-who)。
其中,Know-what主要是指事实知识,是关于事实方面的知识,比如2009年世界经济发展状况如何等;Know-why主要是指原理知识,是反映自然原理和客观规律的知识,比如宏观经济运行规律等,这类知识就是我们通常所说的“科学”,这类知识的生产一般需要由大学、科研机构等专门机构来完成;Know-how主要是指技能知识,是指对某些事物的技能和能力,属于技术的范畴,比如统计软件的使用方法等;Know-who主要是指人力知识,涉及谁知道和谁知道如何做某些事的知识,它包含某种特定的社会关系以及社会分工和指导者的特长与水平,属于我们通常所说的经验和判断的范畴。[91]
事实知识“Know-what”往往很容易用语言表达,具有较高的可编码性。技能知识“Know-how”有较高的隐性特质,它们不能很好地被编码,必须通过在别人的帮助或指导下进行实践而获得。原理知识“know-why”就其形态属性看,是较容易被编码的,大量的科学研究成果以科学论文的形式物化并传播,然而就内容属性来看,原理知识大都存在较高的复杂性以及系统性,因此常常也具有较高的隐性。而人力知识“Know-who”属于经验和判断的范畴,不容易被认识到,也不容易被他人所理解和掌握,因此具有较高的隐性特质。
2)显性知识和隐性知识
显性知识和隐性知识(Tacit Knowledge),与知识的隐性和可编码性相对应。具有较高隐性的知识被称为隐性知识,而具有较高可编码性的知识就是显性知识。
最早提出显性知识和隐性知识这一概念的是英国学者迈克尔•波兰尼(Michael Polanyi)。他指出“人类的知识有两种。通常被描述为知识的,即以书面文字、图表和数学公式加以表述的,只是一种类型的知识。而未被表述的知识,像我们在做某事的行动中所拥有的知识,是另一种知识。前者称为显性知识,而后者称为隐性知识”。
按照波兰尼的理解,显性知识是能够被人类以一定符码系统(包括语言、数学公式、各类图表、盲文、手势语、旗语等诸种符号形式)加以完整表述的知识。典型的显性知识主要以专利、科学发明和特殊技术等形式存在于书本、计算机数据库、CD ROM等物质实体中。显性知识是可以表达的,有物质载体的,可确知的。在OECD对于知识的四类划分中,关于Know-what的知识基本属于显性知识。隐性知识和显性知识相对应,是指那种难以表述的知识。隐性知识,往往是个人或组织经过长期积累而拥有的知识,通常不易用言语表达,也不可能传播给别人或传播起来非常困难。隐性知识所对应的是OECD分类中关于Know-how和Know-who的知识,其特点是不易被认识到、不易衡量其价值、不易被其他人所理解和掌握。
正如前文在知识经济学性质中对于隐性和可编码性中探讨的,显性知识和隐性知识的流动机制存在比较大的差别。显性知识因为通常存在着语言等符码载体,因而其传播可以借助信息技术、网络技术等媒介,传播时可以克服空间、时间的阻碍,具有较低的流动成本和较高的传播效率。而隐性知识在传播过程中,通常需要传递者之间不停地校正自己的表达和解释行为,通过非面对面的交流很难传播,因而其流动受制于时间和空间,传播成本较高,效率较低,传播范围也相对较小。
3)科学知识、技术知识和企业知识
对内生经济增长理论、区域经济学、经济地理学理论中知识的概念进行对比,发现在上述理论中知识的内涵是存在差异的。在内生经济增长理论中,知识是逐渐积累的结果,这一结果扮演了提高各个生产要素的生产力的角色。知识通常通过R&D投入的知识生产过程以及“干中学”产生的知识的积累过程两条途径获取。与标准的内生经济增长理论相反,区域经济学以及经济地理学的学者通常都将知识作为一个与Marshall外部性的观点密切相关的概念,形成一个内涵更为广泛的概念。在Marshall以及Schumpeter的观点中,知识还包括诸如关于市场以及组织的知识。[89]
在上述说明之后,似乎需要区分科学知识、技术知识以及企业知识三种知识的概念。科学知识一般以自然法则的形式出现,能够形成技术知识和企业知识发展的基础。它的内涵和OECD分类中的原理知识基本一致。技术知识以发明或者技术解决方案的形式出现,或者能够物化于新产品之中或者能够在产品或者服务的生产中使用。它的内涵和OECD分类中的技术知识基本一致。企业知识包括商业相关的知识,是关于产品、商业概念、市场、顾客以及其他的知识。企业知识一般具有较高的隐性内涵。根据Schumpeter[92]的分析,科学知识是技术知识以及企业知识在创新过程中的背景或者平台。创新可以看成基于技术知识的产品或者技术的改变,也可以看成基于企业知识的组织或者服务的改变。无论哪种创新都可以看成技术知识和企业知识的结合。[93]
上述三种知识的竞争性和非排他性程度存在比较大的差别。科学知识具有公共商品的性质,具有很强的非竞争性和非排他性。但是科学知识仅仅能够为那些受过相关科学训练的人使用,因此拥有不同的接受过科学训练的劳动力的不同的区域以及公司获得科学知识是不同的。不过,近年来,产权保护制度在科学知识的保护力度上也有所加强,在生物技术领域出现了不少在基础科学发现领域上申请专利保护的倾向。这一趋势表明科学知识部分排他性有逐渐增强的势头。技术知识可以以及故意被理解为一个非竞争性、部分排他性的产品(Romer, 1990)。[94]技术知识的非竞争性源自技术本质上不同于其他的经济商品这一事实。一旦花费成本创造出技术知识,它就可以被无数次无附加成本地使用。部分排他性的本质来自公司一般都对其发明申请专利进行保护。但是,专利申请必须提供相应的细节。这就为其他竞争者模仿或者进行周边发明创造提供了机会,因此技术知识可以通过竞争性的目的获得。这些因素降低了技术知识的非排他性。但是需要注意的是,模仿行为是需要消耗资源的,意味着模仿的过程也存在成本和摩擦。企业知识通常都是“干中学”的产物,可以看作一个非竞争性的、部分排他性的产品。尽管企业知识的积累更多是一个以经验为基础的过程,但是通常其也被假定为需要R&D支出的。企业知识的获取同时受到很多因素的限制,比如“商业机密”的保护。近年来通过专利的形式保护商业机密有逐渐增长的趋势。这一趋势加强了企业知识的排他性。
2.1.2 知识流动的内涵
在学术文献中,知识流动的相关概念较多:知识溢出((Knowledge Spillovers)、技术扩散(Technology Diffusion)、知识扩散(Knowledge Diffusion)、技术溢出(Technology Spillovers)、技术转移(Technology Transfer)、知识交易(Knowledge Transactions)等。
从短语结构上解析上述6个概念,依据“定语+名词”的结构可提炼出6个关键词:“知识”“技术”“溢出”“扩散”“转移”“交易”。“知识”的内涵和外延都比较广泛,而“技术”则泛指那些人类为实现社会需要而创造和发展起来的手段、方法和技能的总和,其属于知识的范畴,是知识的一种。“溢出”的产生与外部性密切相关,是指接收者获得某种影响,却没有支付相应代价或者报酬的现象。“交易”与“溢出”的概念相对应,强调等价交换基础上的知识流动。“扩散”泛指物质向其他个体或者地域散布的过程,在特定情况下,扩散也隐含着物质从高浓度区域向低浓度区域转移,直至均匀分布的含义。“转移”是指物质从一地转向另一地的过程。
从对基本构词的分析大致可以了解上述6个知识流动相关概念的区别。
在知识流动研究领域,“知识溢出”“技术扩散”和“知识交易”三个概念得到经济学家的广泛关注,现对其内涵做深入探讨。
知识溢出以外部性为主要特征,对知识溢出的研究通常侧重微观角度。[82]知识溢出可分为纯知识溢出和准知识溢出两种:在纯知识溢出下,接受者和提供者通过非市场方式,不以互惠为目的、自发地进行交流;在准知识溢出下,接受者和提供者以互惠为目的进行知识交流。[95]生产者和消费者之间的知识流动属于准知识溢出。准知识溢出和纯知识溢出之间最大的区别在于是否以互惠为目的。
知识交易可以理解为知识的买卖,是知识拥有者利用市场通过对知识转移过程进行“排他性”控制获得激励的过程。知识交易分为纯知识交易和准知识交易两种。[96]纯知识交易是指通过反映知识价值的产品或者服务的购买而进行的交易过程;而准知识交易则是指基于市场交易关系而产生的免费相关知识流动的过程。准知识交易和纯知识交易都是伴随市场交易进行的,不同的是,后者并不以知识为交易对象且没有支付符合知识价值的对价。
技术扩散是指一项技术从首次商业化应用,经过大力推广、普遍采用、模仿创新的阶段,直至最后因落后被淘汰的过程。这种扩散过程并不是静态地将新技术用于不同产品生产的采用过程,而是一个动态的学习、消化和吸收的自主创新过程。[97]
纵观知识流动的研究,国内外学者对知识流动内涵的界定各不相同。以知识流动主体为切入点,Zhuge(2002)认为,知识流动主体包括知识发送者和接收者,他们不仅是知识的拥有者还是关系互动的承担者。[98]在具体分析知识流动的过程中,知识流动的主体可以是个人、组织或区域。OECD提出国家创新系统研究中知识流动的主体包括企业之间、企业与科研机构和公共部门之间以及人员流动。[99]马旭军(2007)以企业、大学、研究机构作为知识流动主体,提出知识流动是产学研系统内部以及部门之间的流动。[100]池仁勇(2005)以城市为主体,认为城市间的流动关系主要是指城市之间以企业、大学、科研机构和政府金融机构等正式与非正式联系的稳定关系。[101]
以知识流动过程为切入点,Boisot(1995)在研究知识在技术战略公司间交互的过程中,探讨知识流动的概念,他认为知识流动包含知识扩散、知识吸收、知识扫描和问题解决4个环节。Szulanski(1996)认为,知识流动是知识发送者与知识接收者之间知识交换的过程,即知识流动是组织内或组织间跨边界的知识共享,即在一定的情境中,知识从发送单元到接收单元的传送或转移过程。[102]党兴华(2005)认为,知识流动是知识主体间通过网络形式进行合作创新的过程,是创造和整合价值的过程。[103]Oscar等(2008)认为,知识流动由知识创造、知识外化、知识储存、知识转换与共享、知识内化、知识应用6个环节组成。[104]以知识流动目标为切入点,OECD(经济合作与发展组织,2000)认为,知识流动的目的是帮助区域内知识主体学习和获取外部知识。王缉慈等(2001)认为,知识流动是不同个体之间由互动行为引起的知识扩散,这种互动性的结果是个体知识增长进而引致创新。[105]
本书所称的知识流动,从对象上看,是指那些与技术相关的知识、能够产生技术并且作用于生产力的知识的流动;从流动途径上看,包括不通过市场等价交换而是利用外部性获取知识的溢出以及通过市场交易获取知识的交易两种途径;从流动主体上看,本书将区域作为知识流动单元,从创新的角度考察主体间有方向性的动态性的移动过程。
2.1.3 基于专利的知识流动量化表征
在众多技术预测指标中,专利是衡量区域创新能力的主要指标之一。[106][107]专利引用是专利信息的重要组成部分。在一个完整的专利文件中,一般都包括专利引用信息(References或者Citations)。提取这些信息,将其同专利文件中的发明者、专利权人等其他信息结合起来,就构成完整的专利引用数据。专利引用作为专利信息最重要的组成部分,已经广泛应用到知识溢出、知识流动研究中。Criscuolo和Verspagen(2008)在探讨专利引用是否能够成为知识流动的度量指标的过程中,描述了专利引用的法律范畴,他们认为专利引用表示对之前相关领域的发明信息进行完整描述的法律要求的回应。[65]
从理论上讲,专利授权就是关于在被引用专利的基础上进行创新而产生新颖性的专利的法律陈述。因此,原则上讲,专利X被专利Y引用表示X是专利Y产生的知识基础之一,专利引用信息可以追踪技术相关的显性知识甚至是部分隐性知识在个体之间的转移过程。因为专利数据的本身蕴含大量的与发明人、专利权人及其地址的数据,将专利引用数据同上述地理信息相结合,能够追踪知识随着时间变化在空间、机构上的流动过程。
鉴于此,人们在广泛利用专利申请数据的基础上,开始关注专利引用数据,将其作为追踪知识流动的书面凭证(Paper Trial)。以专利引用追踪的知识流动可以涵盖知识流动的大多数途径,无论是基于知识第一类载体的知识流动途径(人与人之间的沟通及交流),还是基于第二类载体的知识流动途径,都可以通过专利引用来反映。
然而,专利引用数据存在着一定的缺陷。
第一,专利固有的一些缺欠导致专利引用数据不可避免地存在相应的缺陷。首先,并不是所有的创新都能够申请专利。并不是所有的发明都能满足专利授权机构对于专利的要求(如新颖性等);且对于有些专利发明人来讲,专利申请是在一定战略驱动下的行为,发明人很可能基于保密或者其他原因而不对其拥有的发明申请专利。鉴于此,专利数据只能在一定程度上测度技术创新,专利引用数据表征的知识流动也具有局限性。其次,不同专利在技术及经济上的重要性、价值存在较大的差距,且不同专利的价值的分布具有非对称性。因此,单纯的专利计数的横向、纵向比较都存在一定的非科学性。在此基础上形成的单纯的专利引用计数的横向、纵向比较也存在一定的局限性。
第二,专利引用数据的产生过程会使专利引用数据的科学性产生一定的缺欠。首先,并不是所有的专利引用数据都是由专利申请人自行添加的,有部分专利引用数据是在专利申请过程中由专利引用审查员添加的。这就意味着并不是所有的专利发明者都了解其引用专利的发明者的工作。即使专利发明人知道其引用专利的发明者之前的工作,很可能他并未从其中获益。在利用专利引用追踪知识流动模式时,我们冒着虚构并不存在知识流动的危险。其次,专利引用存在着一个比较常见的现象:自引,即专利权人引用其已经被授权的专利的行为。对于知识流动研究来说,自引意味着内部化的知识流动,而专利在不同的专利权人之间的引用才更加接近知识流动的本质。
第三,专利引用数据的利用过程(样本数据的选取过程)也必将产生影响专利数据科学性的后果。因数据的固有属性,专利引用数据的利用存在“倒置问题”(Inversion Problem),即为了获取在T年授权的专利A的被引情况,我们需要检查T年之后所有引用A的专利。因此,任何关于专利被引情况的研究,无论研究的样本多少,我们都需要获取所有年份的引用数据,只有这样才能够保证研究的科学性和引用数据抽取的完整性。因此,在专利引用数据分析过程中,因不可能获取全部年份的引用数据而导致的时间截断偏差是不可避免的。
尽管用专利引用数据表征知识流动存在一系列的问题,然而专利引用在一定程度上还是能够捕捉知识的流动过程,能够反映知识流动的一定特质。
第一,尽管并非所有的发明都申请专利,然而大量的专利数据保证了专利引用数据对于整体趋势的预示。此外,由于专利引用本身就有对于技术价值进行评论的功能,被引专利意味着它具有一定的技术价值,而技术价值的存在是知识流动的前提,这在一定程度上提升了引用专利对于知识流动的指示性。
第二,Jaffe等人(2000)[108]对于大样本的专利发明人对其引用专利的熟悉程度的调查指出:超过一半的被调查者表示其在不同程度上熟悉自己所引用的专利;大约三分之一的被调查者表示他们在完成发明之前了解引用专利,只有不到三分之一的被调查者表示,他们不知道被其引用的专利,也就是大约三分之一的专利是由专利审查员添加的;大约60%的被调查者指出他们通过不同的途径从被引专利上获益。上述调查结果表明,专利引用数据可以被解释为表征知识流动的指标。此外,该调研结果还指出,引用专利表征知识流动的显著性水平存在着明显的差异,专利越重要(被引次数越高)则其引用越容易表征知识流动;被引专利和引用专利之间的年份越近,其表征知识流动的程度越高。
第三,专利的自引可以在一定程度上被剔除。以USPTO的数据为例,对于专利权人为非个人的专利,利用每条专利中包含的专利权人库普斯号码为标识,可以将被引专利同库普斯号码的引用专利剔除;而对于专利权人为个人的专利,则可以利用专利中包含的发明人及其企业、地址的信息,将同名且同企业或者同名且同地址的引用专利剔除。通过上述方式,可以在相当大程度上剔除专利的自引现象,客观反映知识流动的状态。
第四,专利引用数据的“倒置问题”导致的时间截断偏差可以利用专利的引用时滞进行一定程度的“平减”。引用时滞是引用专利和被引专利之间的时间差距。尽管从理论上看,只有获取所有年份的引用数据才能保证专利引用研究的科学性和引用数据抽取的完整性,然而引用时滞的存在表征专利引用有一定的规律性。Adam和Jaffe等人(2001)[109]的研究指出,引用在专利授权后5年之内达到高峰,且50%的引用发生在10年之内,只有25%的引用发生在20年之内,仅有5%的引用发生在50年之内(见图2.2)。依据上述研究,如果选取10年作为时间差距,则时间截断偏差会减少到50%;如果选取20年作为时间差距,则时间截断的偏差则会减小到25%。实际上,在进行不同年份、不同区域的比较时,只要以5年作为时间差距,就会在很大程度上降低时间截断偏差的影响。
图2.2 专利引用时滞分布图
综上所述,通过对专利引用数据进行合理的加工处理,能够降低专利引用数据的噪声,从而能够提升专利引用数据指示知识流动的科学性。本书用引用流表征知识流动密度(比如表征地理单元之间的知识流动),揭示知识流动的趋势。知识在区域间流动表示为被引专利的第一位发明者(授权专利文件中发明者一栏中的第一位发明者)所在地区所掌握的信息转移至引用专利的第一位发明者所在地区。对于区域层面来说,一个地区专利被引次数越高,说明该地区拥有的技术越领先、越先进,该地区专利权人(企业)的行业地位越高,该地区被引专利对后期专利的影响力越大,对后来的技术发展影响越大。总体来说,该地区有较强的竞争力,属于领先地区,这些区域是知识来源的提供者。通过对区域间前后专利之间的引用与被引用关系进行考察,结合适当的方法,对专利间的相互引用现象和规律进行分析,可以挖掘各地区知识流动的潜在的趋势和规律。