【摘要】 基于搜寻的知识增长模型(或称Idea Flow理论)是增长理论的重要进展。该理论克服了内生增长理论对知识假设的不现实性,给出了知识增长和技术扩散的微观基础,准确地刻画了知识的准公共品性质,还很好地拟合了经验数据。Jovanovic & Rob (1989),Kortum (1997)及Lucas(2009)的原创性工作从不同角度将搜寻引入知识创造与传播过程。Lucas & Moll(2014)在Lucas(2009)基础上考虑个体的动态优化问题,利用Mean Field Games给出了平衡增长路径;Luttmer(2012a),Buera & Oberfield (2016)用不同的方式整合了Kortum (1997)与Lucas(2009)的思路,各自提出统一的理论框架。目前,基于搜寻的知识增长模型已经被用来研究企业动态、国际贸易与技术扩散、组织结构与收入分配以及空间和城市发展等问题,取得了可观的成果。
【关键词】 搜寻模型 知识增长 技术扩散
【JEL分类】 O3 O4
“一个人既不能试着去发现他知道的东西,也不能试着去发现他不知道的东西。他不会去寻找他知道的东西,因为他既然知道,就没有必要再去探索;他也不会去寻找他不知道的东西,因为在这种情况下,他甚至不知道自己该寻找什么。”
——柏拉图:美诺篇
“生乎吾前,其闻道也固先乎吾,吾从而师之;生乎吾后,其闻道也亦先乎吾,吾从而师之。”
——韩愈:师说
内生增长理论认为,知识增长与人力资本积累是经济增长的核心。然而,它对于知识的假设缺乏微观基础,与现实相距甚远:Romer模型中,知识是完全的公共产品,一个社会能够生产的产品种类越多,创新新产品的成本“自然”就越低;Schumpeter模型中,新一代产品的出现既将老产品逐出市场,又“自动地”令下一代产品的发明更容易。即使是经过修正的内生增长模型,例如,允许领先者与落后者存在技术差距,允许研发部门生产率递减,引入知识产权等,仍然只是对假设条件的更改,而没有触动理论的核心。不仅如此,这些假设还导致了内生增长理论广受诟病的规模效应:人口越多(半内生增长理论中,则是人口增长率越快),自然地经济增长越快。这显然是不符合实际的(例如,著名的Jones 1995批评)。事实上,不论是哪种模型,它们都是在代表性个体(劳动力或企业)假设下得到的,但现实中,异质性问题更常见:例如,Hsieh & Klenow (2009)的研究显示,即使是同一行业内,企业的生产率都存在极大差异。对于知识增长和技术扩散来说,人与人之间知识存量的异质性恰恰是其根源和动力。因此,如何构建一个有微观基础,符合经济现实的模型,刻画知识增长与传播过程,是内生增长理论的一大挑战。
众所周知,知识是“准公共品”:首先,知识不是完全的公共产品(否则的话,任何人的知识都可以为我所用);其次,知识不是完全的私人产品(知识可以被学习和模仿)。用经济学术语来说,知识具有非竞争性和半排他性:任何人都可以去学习知识,不论是独立研究,还是借鉴学习;与此同时,知识能为获得它的个体带来个体收益。
因此,如果把知识学习看成是一个搜寻过程,知识的增长与扩散就显得非常自然了。当只允许独立研究,且有完全的专利保护时,学习对象就是先验的知识分布:人们进行实验就是从先验分布中抽取样本的过程,如果抽到的知识高于当前的知识水平,那么创新成功,获得专利;否则失败。另一方面,当知识分散于经济体内各个个体中,没有专利保护时,学习对象就是其他人:人们在交流过程中,既学习高于自己的人的知识,又为低于自己的人提供学习样本。两种情况分别对应了现实世界的两个极端,前者由Kortum (1997)给出;后者则归功于Lucas(2009)。
现实中,上述两种情况往往是共存的。经济学家为整合两者做出了多种尝试,我们在此只综述两个可行的思路,即Buera & Oberfield (2016)及Luttmer(2012a)。
此外,上述模型没有考虑个体动态优化及总体知识分布演化问题,在Mean Field Game框架下,Lucas& Moll(2014)借鉴Jovanovic& Rob(1989),填补了相应的空白。
基于搜寻的知识增长与扩散模型考虑个体间知识水平/生产率的异质性,很好地刻画了知识的准公共品性质。作为异质性个体模型的一种,正日益得到学界的重视。目前,基于搜寻的知识增长模型已经被用来研究企业动态(Luttmer,2012b;Perla& Tonetti,2014)、国际贸易及国际技术扩散(Buera& Oberfield,2016;Sampson,2016;Alvarez et al.,2013;Perla et al.,2015)、收入分配(Caicedo et al.,2016)及区域发展(Comin et al.,2012;Desmet& Rossi-Hansberg,2014;Davis& Dingel 2013)等问题,取得了一定的成果。本文将列举一二,展示该模型强大的兼容性及对现实的洞察力。
本文安排如下:首先概述三篇原创性文章及它们的扩展,这些研究从不同角度将搜寻引入知识增长与传播过程;其次重点介绍Lucas& Moll(2014)及Buera& Oberfield(2016),Luttmer(2012)的贡献;接着列举其在国际贸易,知识扩散及收入不平等演化方面的应用;最后是简单的总结。
我们在此重述了三篇原创性论文的理论框架,并简要综述每篇论文的若干重要扩展。这三种思路看上去相距甚远,其搜寻内核却是相近的,也是后文众多扩展及衍生模型的思想基础。
Kortum观察到,微观层面上,各个行业和企业的全要素生产率与R&D(以研发人员,专利数量等指标衡量)之间都存在显著的正相关关系,但在宏观上,长期内发达经济体内研究人员的增长并没有带来相应的专利数量及全要素生产率的增长。为此,他构建了一个基于搜寻的创新与经济增长模型来解释这一现象,我们重述如下
。
假设对于每个研究者来说,新发现的Poisson抵达率都是恒定的,为 λ >0。每一个“新发现”都是从先验技术分布中抽取的,不同部门拥有不同的生产率参数。假定 s ∈[0,1]部门的生产率 q s 服从Pareto分布:
参数为
θ
和
。其中,
表示新发现的最低生产率水平,
θ
表示Pareto分布的形状参数,数值越小,则获得更高生产率难度越大。
现在,假设
s
部门的当前生产率水平为
,那么,只有当
时,一项新发现才能称为技术进步,即“创新”;否则的话,只能算是一次研发失败。如果
s
部门有
n
名研发人员,各研发人员工作相互独立,那么创新的Poisson抵达率就应该等于研发人员数量乘以每个研发人员获得新发现的概率,再乘以新发现是创新的概率,也即:
注意到,Pareto分布的性质可以保证,每一次创新相对于现有技术的改进的数学期望(即
q
s
/
-1)都相同,而与
无关(当然,我们假定
>
。简单运算可知:
因此,如果我们能够找到创新频率恒定的稳态,那么期望增长率也将是恒定的。但是,稳态时必有,每个部门的研发人员数量也是恒定的,因此,创新的Poisson抵达率会随着现有技术的不断提升而渐进趋于0,期望增长率也会随之趋于0。这就是Kortum (1997)对研发人员—专利增长之谜的解释:尽管技术前沿在不断进步,但是每个研发人员的知识并没有随之提升:他们还是在原有的先验技术分布中进行搜寻,自然得到创新的概率会越来越低。
Kortum模型很好地拟合了战后美国的专利与研发数据,其内核在一系列重要文章中得到了进一步的发展,如Eaton & Kortum (1999,2001)
。Eaton& Kortum (1999)在Kortum模型中引入了技术采纳过程和知识产权,尤其是专利制度,研究国际技术扩散的影响。此时,世界经济存在唯一的稳态增长率,各国的生产率则由它们吸收新知识的能力决定。Eaton & Kortum(2001)则将Kortum模型与新李嘉图贸易模型结合起来,通过推演得到,研发强度与国家规模、研发生产力及开放程度无关;另一方面,大国的规模优势会影响其福利水平,贸易开放更有利于小国。
Lucas另辟蹊径,没有假设人们从一个先验技术分布中搜寻,而是在人与人之间的交流中相互学习。换句话说,Lucas认为,知识并不是某个抽象的先验分布,而就是所有个体所拥有的信息的总和。我们重述如下。
时间是离散的,用 s ∈[0,1]表示连续统的个体 [1] 。每一期,每个个体与 n 个其他个体相遇/会面/交谈/交流,后者是从经济体中随机抽取的, n 固定。当个体 s 与 s′ 交流时, s 了解并掌握 s′ 的生产率水平 q s ′ , s′ 也了解并掌握 s 的生产率水平 q s 。显然,高生产率的个体依旧使用原来的生产技术,而低生产率的个体则会模仿高生产率个体。
由于所有个体的生产率水平不会下降,而部分个体会上升,因此平均生产率水平也会上升。具体地,考虑 t 期经济总体生产率的分布函数 F t ( q )=Pr{ q s ≤ q },其运动满足:
上式的含义是,任何个体在
t
+1期的生产率水平是其在
t
期生产率和
n
个与之交流的个体的最大值;因此,他在
t
+1期的生产率不大于
q
的概率应等于上述1+
n
个数值均不大于
q
的概率,即
。
为了保证可持续的增长,初始生产率分布的支撑集应当是无界的,因为人们只能从他人身上学习,没有人能实现一开始并不存在的生产率水平。不仅如此,为了保证增长率不趋于零,初始分布还必须有足够厚的右尾。Frechet分布具有这样良好的性质,Lucas假设 F 0 满足Frechet分布,也即:
其中参数为 θ ∈(0,1), λ 0 >0。
那么,任何时期的生产率分布都是Frechet的,且有:
其中参数为
θ
∈(0,1)
由Frechet分布的性质,
t
期的平均生产率与
成正比:
这里,
是常数。因此,平均生产率的增长率
g
依赖于交流频率
n
和形状参数
θ
:
Lucas模型抓住了人与人之间交流的外部性,把它作为经济增长的引擎,并且得到了均衡增长路径,这是一项重大突破。然而,它对初始分布的假设过度严苛(无界分布,厚尾),而且没有考虑个体的优化问题(如果交谈是有成本的话,那么高生产率个体显然不愿意交谈),这些问题在之后的文献中得到了改进。
最后,我们再简单介绍Lucas模型的扩展。Lucas(2009)的后半部分,以及Lucas(2015)都考虑了上述社会学习机制对于收入分配的影响。Lucas(2009)在OLG模型中引入了世代结构:由于知识积累存在差异,世代之间收入分配的形态也不同,工作时间越久,不平等程度越强。Lucas(2015)则将教育引入基本模型:教育程度将直接影响工作后的学习效率,受教育年限越长,交流的Poisson抵达率越高,工作后收入变化的幅度也越大。
在进入下一节之前,我们再回顾一下Jovanovic& Rob(1989)的工作,他们将个体优化问题引入知识增长过程中,给出了稳态均衡,并认为知识的外部性会导致想法过早地得到实施。
考虑离散时间,测度为1的个体,每个个体有一定数量的想法(ideas)。想法的持有人可以选择马上将该想法转化成物质财富(即进行生产),也可以进一步发展这个想法,使其更加成熟。具体地,考虑一个特征为 x 的想法,如果投入生产,则该想法消失,生产 x 单位的计价品;我们称 x 为想法的质量。另一方面,为了发展想法,个体必须与其他人交流,交流对象是随机的。如果一个持有想法 x 个体与另一个持有 y 想法的个体相遇,那么相遇后 x 个体的想法将变为 x′ ,服从分布:
其中,
m
表示模仿强度,若
x
≥
y
,
m
=0;否则,为一个正常数。Ψ(
x′
|
z
)的支撑集为
;对于任何
z
1
>
z
2
,有Ψ(
x′
|
z
1
)≤Ψ(
x′
|
z
2
)。
此外,每一期有测度为
δ
的新想法从分布
F
(
x
)中抽取,
F
的支撑集为
假设相遇的固定成本为 c ,那么个体优化问题可以写作:
其中, H t ( x )是t期相遇发生前的知识分布(Distribution of Ideas Prior to Meetings)。
这是McCall模型的一个版本;可知,存在一个临界值 λ ,且个体最优决策函数为:若想法质量高于它,就会立即得到实施;否则继续搜寻。
另一方面,稳态时,相遇前的知识分布应是不变的,对于 z ∈[0, λ ],则有:
上式意味着,不变的知识分布应等于:①新想法中低于 λ 的条件概率乘以搜寻后仍未成熟的概率,加上②未得到实施的老想法在搜寻后仍未成熟的概率。
联立个体优化问题及稳态均衡条件,我们可以确定临界值 λ 与知识分布 H t ,模型的动态也就完全确定了。
作者发现,由于想法具有外部性,因此市场经济下,个体总是倾向于过早地实施想法,而不是进一步完善想法。
本模型在两方面启发了Lucas& Moll(2014)及Perla& Tonetti(2014)的工作:①考虑个体的优化问题,搜寻是有成本的,在此不仅有固定成本,也有机会成本,因此,个体必须执行最优搜寻策略(这里就是最简单的二元决策函数);②知识的外部性导致市场经济下搜寻强度低于最优水平。
有了上一部的原创性论文做基础,我们就能够理解处于研究前沿的经济学家们所做工作的目的,研究方法及他们的突破所在。目前,该领域论文如雨后春笋,一些发表或即将发表于顶尖的经济学杂志上,更多的还处于工作论文阶段。因此,很难对该领域给出一个完整的描述,我们只能根据文献的原创性,突破程度及模型框架的适用性,选取了相对重要的三篇文章进行综述。它们从不同的角度整合与扩展了基本模型的思想,为具体应用打下了基础。
作者们整合Kortum研发驱动与Lucas交流驱动的知识增长框架,在放松对初始分布和学习过程的假定下,仍然得到知识的渐进Frechet分布;此外,作者还利用该模型研究国际贸易对技术进步和扩散的影响,很好地拟合了历史现实,特别是东亚奇迹的产生。我们在此先给出理论框架,在4.1节综述它的国际贸易部分。
依旧考虑 s ∈[0,1]的部门/产品。类似Kortum (1997),假设知识分布于供给端的厂商(企业家)手中。每种产品有 m 个生产者,进行Bertrand竞争,因此只有生产率最高的厂商才进行生产。一个生产率为 q 的 s 类产品厂商生产函数如下:
其中, l ( s )为劳动投入, y ( s )是产出。
知识分布为
M
t
(
q
),表示
t
时期生产率水平小于等于
q
的厂商比例;总体的生产率分布为
(
q
),表示
t
时期
m
个厂商的生产率都不超过
q
的概率:
(
q
)=
M
t
(
q
)
m
。
现在,考虑知识分布的动态。我们假设,每一个厂商都能以Poisson抵达率
α
t
与另一个厂商相遇。但是,相遇后不一定能完全吸收对方的知识。确切地说,当一个生产率为
q
的厂商遇到一个生产率为
q′
的厂商时,如果
,那么前者只能吸收
的知识;否则不变。这里,新的知识有两部分组成:①另一个厂商的生产率的
q′
,这是从某个知识源分布(Source Distribution)
中抽取的
[3]
;②一个外生随机变量
z
,我们将它称作知识的先验分布。
上述过程说明,与更有知识的个体的交流更容易带来自身水平的提高,但是,提高与否、提高多少又是一个随机事件。其现实意义是:创新既需要自己不断进行试验,还要结合他人的实验结果不断改进。
注意到,若
β
=0,即无法进行学习时,本模型就退化为Kortum(1997)的设定;若
β
=1,
H
是退化分布,且
时,本模型就是Lucas(2009)或Alvarez(2008)的情况。
在上文设定下,经过简单运算可以得到,总体分布的运动满足:
上式说明,总体分布的演化既与先验知识分布有关,还和相遇对象的知识分布有关。
为了保证模型可解,作者提出如下假定。
假设1(Buera& Oberfield,2016):
①知识的先验分布有参数为
θ
的Pareto右尾,即
② β ∈[0,1);
③
其中,①放松了Kortum(1997)对先验分布假设,只假定有Pareto右尾,②说明学习的不完全性,③放松了Lucas(2009)对源分布的假设。
定义
,可以确定知识的演化路径如下。
命题1(Buera& Oberfield,2016):当假设1成立时,当
m
→∞极限情况下,知识前沿的演化满足
再定义
类似Lucas(2009),把它称作知识存量。那么上式还给出了知识的极限分布。
推论2(Buera& Oberfield,2016):当假设1成立时,且
极限情况下
。
也就是说,经济体的生产率分布是渐进Frechet的,其尺度参数服从下述微分方程:
特别地,在封闭条件下, G t ( q )= F t ( q ),知识存量满足:
其中,
x
d
x
是gamma函数。当
时,有均衡增长∫路径,其中
λ
t
的渐进增长率为
,人均GDP增长率为
。
Luttmer用另一种方式整合Kortum (1997)与Lucas(2009),具体地,他使用布朗运动作为随机技术冲击的来源,描绘技术的演化。
我们使用Achdou(2014)的框架重述Luttmer(2012a)的贡献。考虑一个由连续个体构成的经济体,每个个体由他的生产率水平(我们将它定义为“知识”)代表: z ∈ R + 。因此,整体经济可以由知识分布函数 G ( z , t )描述。 G 的演化过程如下:个体与经济中其他个体相遇,比较各自的知识,并学习先进的知识。相遇以Poisson强度 α 发生,从个体的视角看,相遇意味着从整体分布 G 中进行一次随机抽取。相遇后,知识为 z 的个体比较他的知识与对方的知识,取其大者,作为自己新的知识,即max{ z , z′ }。不仅如此,个体的生产率还随时间上下波动,我们用几何布朗运动来描述这个过程,即有:
注意到,如果 σ =0,即没有随机技术冲击,那么模型就退化为Lucas(2009);如果 α =0, W t ≥0,即没有相互学习,模型就回到了Luttmer(2007)的框架,类似Kortum (1997)。
给定上述结构,我们设 x =log z ,对应的分布函数为 F ,定义在( x , t )∈R×R + 上,稍加运算可知,演化路径满足:
边界条件如下:
其中, F 0 ( x )是初始生产率分布。Luttmer指出,上述偏微分方程是物理学,尤其是统计物理中广泛存在的Fisher-KPP类方程,它的理论性质得到了深入研究。特别地,该方程存在“行波解(Travelling Wave Solution)”,即解的形式满足:
换句话说,随着时间的演进,生产率分布形状不变,只是像波传导一样整体向右移动。
不仅如此,当初始分布是Dirac分布(只在一点有正测度)时,极限分布是一个参数为
的行波。此时,生产率
z
=
e
x
的平均增长率为
γ
。因此,我们可以说经济处于一个平均增长率为
γ
的均衡增长路径(Balanced Growth Path,BGP)上。
平均增长率
的解释也是非常自然的:
σ
代表自身研发的不确定性强度,即Kortum (1997)所说的研发/创新;
α
代表相遇的Poisson强度,即Lucas(2009)所说的人与人之间的交流,本质上是技术的扩散。当初始分布有界时,任何一个都无法独自保证均衡增长,但两者一起就能解释经济的可持续发展路径。
Luttmer(2012)还考虑了 x →∞的极限情况。此时,均衡增长路径上的Φ满足:
其中
。这意味着生产率
z
=
e
x
渐进地服从参数为
ζ
的Pareto分布。即个体生产率(在此,也等于个体收入)服从幂律:越小的
ζ
意味着越大的不平等,反映在分布函数上,右尾越厚。
注意到,平均增长率
γ
而不平等参数
这意味着增长与不平等之间存在着十分有趣的关系:提高研发的不确定性强度(意味着提高 σ ),在提高增长率的同时,还会提高不平等程度;但提高人与人相遇的概率,即加强技术扩散不仅能够提高生产率,还有利于降低不平等。因此,得到广泛讨论的“增长-不平等”权衡在此有着非平凡的解释,值得政策研究者的重视。
当个体可以自由选择搜寻强度时,会发生什么呢?Lucas& Moll(2014)应用偏微分方程理论的最新进展,尝试回答这个问题。
沿用2.2节的设定,假设搜寻是有成本的(特别地,时间成本),考虑个体的动态优化问题。具体地,每个个体每期都有一单位时间,可以用于生产,也可以用于搜寻知识。生产的产量与个体的知识水平线性相关。搜寻强度越大,与他人相遇的概率越大。我们假定与他人相遇的Poisson概率 α ( s )是搜寻强度 s 的严格增凹函数 [2] 。现在,产出是:
因此,个体的优化问题可以表示为:
其中, J t 是相遇概率为 α ( s t )的泊松过程。
求解这个动态随机优化问题,我们得到关于值函数 V 与密度函数 f 的一组偏微分方程:
哈密顿-雅可比-贝尔曼方程Hamilton-Jacobi-Bellman equation(HJB):
柯尔莫哥洛夫前向方程Kolmogorov Forward Equation(KF):
以及概率等式:
其中, s *是满足HJB的最优搜寻函数,初始条件 f ( x ,0)= f 0 ( x )。
这组方程所描述的经济系统与物理学中用于描述大量粒子相互作用的玻尔兹曼平均场理论类似(Boltzmann Mean Field Theory),Lasry & Lions(2006,2007,2010)的原创性工作给出了描述这类系统的一般方程,并称之为Mean Field Games。目前,该理论已经经济学,网络与信息科学,生态系统等领域得到应用。
HJB方程表示,资产在单位时间段内的预期收益由三部分组成:
①资产的瞬时变动
;
②由布朗运动带来的随机项
x
V
,应用Ito公式得到;
③瞬时回报与未来回报的最大值
s
∈ [0,1]∫
x
∞
。
第三项表明,个体必须做出如下权衡:一方面,增加搜寻强度将降低瞬时产出, s 越大,(1- s ) e x 越小;另一方面,搜寻强度越大,相遇的Poisson概率越高,越有可能提高知识水平。每一次相遇的期望收益与自身的知识水平负相关,而与整体的知识分布正相关。均衡时,搜寻的边际成本应当等于期望边际收益。
KF方程表示,单位时间内密度函数的变化有三个来源:
①布朗运动随机项
②给定知识水平的个体,搜寻并遇到更高生产率个体,从而离开给定知识水平的数量:等于该水平的密度函数
乘以相遇的Poisson抵达率
α
[
s
* (
x
,
t
)]再乘以遇到更高个体的概率
;
③低于给定知识水平的个体,搜寻并遇到给定知识水平的个体,从而成为该水平的个体的数量:等于低于该水平的个体得到相遇机会的概率
∫乘以遇到该水平个体的概率
f
(
x
,
t
)。
可惜的是,上述问题是否有解,解是否唯一,以及在什么条件下有均衡增长路径都是未知的。但是,Lucas& Moll(2014)证明,如果①不存在自身研发,即 σ =0;②初始分布有形状参数为 θ 的Pareto右尾时,那么,的确存在唯一的均衡增长路径,其增长率如下:
均衡增长路径上,值函数与密度函数都有行波解:
Lucas& Moll(2014)还利用值函数迭代与有限元算法给出了计算均衡路径以及增长率的数值方法。不仅如此,利用泛函优化方法,他们还证明中央计划者下经济增长率与不平等程度都要高于市场经济。这是因为该模型中,个体的知识是有部分外部性的(个体的知识除了能给自身带来产出收益外,还是他人的搜寻标的,但后者并没有给个体带来直接收益),因此,市场经济下,个体的搜寻强度要低于Pareto最优水平,不能实现最优的知识增长。
现在,我们可以把Idea Flow理论嵌入到一系列有趣的经济学场景中,获得新的洞见。此处,仅考察三个已有所建树的领域,国际贸易理论:贸易与增长;空间经济学:技术的空间扩散;劳动经济学:职业发展与收入分配动态。
新李嘉图贸易理论(以Eaton & Kortum 2002为代表)将生产率的绝对差距视为国家间贸易的主要驱动力,而Idea Flow理论则给出了生产率分布的动态演化路径,因此,将两者结合起来,考察贸易对于技术进步和经济增长的作用,既是理论发展的必然,也得到了现实的验证。
考虑一个Eaton& Kortum(2002)或Alvarez& Lucas(2007)模型:世界由 n 个国家组成,其中, i 国的劳动力为 L i ,该国代表性消费者效用函数:
1
ε
/(
ε
-1)
C
i
=[∫]
。
i
国的知识分布为
,贸易的冰山成本
。
由标准的EK模型可知: i 国对 j 国产品的支出份额满足:
其中, w j 是 j 国工资。
另一方面,劳动力市场出清条件如下:
联立(30)~(31),即可确定静态均衡。
现在,我们考虑尺度参数 λ =( λ 1 ,…, λ n )的动态演化。为此,考虑两种情况:向卖者学习(Learning from Sellers),即本国厂商能够从销售到该国的产品中学习知识;向生产者学习(Learning from Producers),即本国厂商只能从本国其他厂商处学习知识。
a.向卖者学习(Learning from Sellers)
此时,源分布为:
其中, S ij 表示 i 向 j 出口的产品种类集合。
在2.1节框架下,将上述源分布代入(14),可得Frechet分布尺度参数(即知识存量)的演化方程:
因此,一国知识存量的演化可以近似地看成该国贸易伙伴知识存量的加权平均,其中权数为支出份额。
上式表明,贸易通过两个途径影响一国的知识获取:其他国家厂商的知识通过产品贸易传播到本国;此外,贸易成本又筛选了能够进行贸易的厂商。贸易会引发更高强度的竞争,因此,可供学习借鉴的厂商必然是经过更加严格的筛选留下的。从封闭经济出发,贸易成本的不断降低意味着低生产率的本国厂商将越来越难以和高生产率的外商竞争,并最终被逐出市场。作为学习对象来说,后者显然比前者要好得多。
另一方面,更高的贸易成本往往意味着更加严苛的筛选条件:
从
j
国进口到
i
国的产品的平均生产率水平为
,因此,它们能够向
i
国提供的平均知识水平是
(即考虑了学习的不完全性)。给定
j
国的知识存量,
i
国对它的支出份额π
ij
越小,
i
国能够学到的知识水平越高。
上述机制也是Alvarez et al.(2013)重点关注的内容,只不过后者是在Lucas(2009)模型下进行的扩展。
b.向生产商学习(Learning from Producers)
我们假设贸易成本满足三角不等式:
。
那么,任何出口厂商也将在本国销售。源分布为:
同样代入(14),可知知识存量的演化满足:
因此,源分布是一国对本国产品的支出份额与本国知识存量 λ i 的函数。
可以看到,在封闭经济下,搜寻的源分布是本地厂商集合全体,其中含有生产率很低的企业。开放贸易后,后者被市场淘汰,仍在生产的本地厂商都是相对高生产率的。这提高了学习样本的质量,从而提升了知识存量的增长速度。
c.Sampson(2016)以及Perla et al.(2015)
我们考虑Learning from Producer的两个类似模型。Sampson(2016)构建了基于Idea Flow理论,没有规模效应(No Scale Effect)的内生增长模型,并将类似于上文的机制称作动态筛选(Dynamic Selection)效应。
进入者可以从在位者处不完美地学习知识,其生产率满足:
其中, x t 是 t 期在位者的平均生产率, ψ 是从一个先验分布函数 F ( ψ )中抽取的,与时间无关。
注意到,与Romer模型及Schumpeter模型不同,这里①进入者不再能享受技术前沿(Technology Frontier)的知识溢出,而只能享受整个经济技术分布的知识溢出,以平均生产率表示(在附录中作者证明上述设定与Lucas(2009)的交流模型得到的结论相同);②技术溢出有随机部分,这与Buera&Oberfield(2016)类似。
Melitz(2003)认为,贸易成本(包括固定成本及运输成本)对企业有筛选效应:只有生产率较高的企业才能够支付固定成本,承担运输成本,参与国际贸易。Sampson(2016)则更进一步,在Melitz模型中加入了动态的企业进入退出机制。此时,贸易不仅提高了生产率门槛,连生产率门槛本身都在不断提高,此即动态筛选效应。
Perla et al.(2015)在Perla& Tonetti(2014)基础上考虑类似的问题。与Sampson(2016)的进入退出机制不同,Perla& Tonetti(2014)假设厂商数量固定,但可以相互学习。经济的持续增长来自于位于零利润条件下(Zero Profit Condition)的厂商不断学习以改进生产率的努力,这种努力又反过来不断提高零利润条件。均衡时,零利润线的生产率水平以恒定值增长。Perla et al.(2015)进一步提出,经济开放使得零利润条件更加苛刻,提高了动态筛选的强度,促进了经济增长。
空间经济学,或称新经济地理学,向来重视地理或空间因素对于经济均衡的影响。近年来,计算机模拟的广泛应用、主流对异质性个体模型的认可,以及微观数据的大量出现让区域科学和空间理论得到了空前发展。作为异质性模型的一种,Idea Flow理论能够很好地解释区域间知识流动与技术扩散的典型事实,根据模型校准得到的数值结果也和真实数据十分相近。下面是两个例子。
Comin et al.(2012)研究了国家间技术扩散过程中地理位置的决定作用。实证研究发现,距离技术领导国家越远,技术扩散速度越慢。这种距离效应在发达国家之间,以及南北国家之间更加显著。为此,作者们提出一个简单的Idea Flow模型来解释上述现象,并通过实证研究确认了技术扩散的空间距离效应会随时间不断减弱的事实。在此仅把模型综述如下。
考虑均匀分布在区间[0,1]上测度为N的个体。时间是离散的, t =0,1,2……考虑一项新技术的出现:用 G (0, l , t )表示 t 时期,地点为 l 的个体中尚未掌握新技术比例。那么掌握该技术的比例为 G (1, l , t )=1- G (0, l , t )。
每一期个体与 α 个体相遇,并进行Lucas(2009)式交谈。个体更容易遇到与邻近的人相遇。因此,我们假设处于 l 处的个体遇到 r 处个体的概率比遇到 l 处个体低 e - δ | l - r | 。其中, δ 表示距离效应, δ 越大,说明距离效应越强,越难遇到更远位置的个体,技术扩散就越慢。
那么, t + h 期 r 处个体未掌握技术的条件概率满足:
令 h →0,则有:
现在,假设初始分布满足:
即区间[0, a ]的个体不完全掌握新技术,而区间( a ,1]的个体完全不掌握新技术,技术从前者向后者扩散。
由 g < l ,对于所有 l ,则有:
对于 a < l < l′ ,则有:
此外,因为 G (0, l ,0)是 l 的减函数,这意味着:
从而对于所有 t 及所有 l > a :
总之,①距离创新源头越近,未掌握者比例越低。②距离创新源头越近,未掌握者比例下降越快。最后,在极限情况下对于所有地区掌握新技术: G (1, l , t )=1。因此还有,③距离效应随着时间演进不断减弱。
Desmet& Rossi-Hansberg(2014,2015)更进一步,使用Rossi-Hansberg(2005)的空间贸易理论,将企业的创新决策(类似Kortum 1997)与技术的空间扩散(类似Lucas 2009,Comin et al.2012)结合起来,解释美国及印度的区域发展。具体地,考虑连续区间[0,1],离散时间。假设
是
r
处,
t
-1期,
i
行业所使用的技术。那么,按照Comin et al.(2012),
t
期,
l
处,
i
行业能够使用(但不一定使用)的技术为
。因此,在创新决策前,
t
期
l
处的技术水平为:
另一方面,企业可以选择进行创新:向
i
行业投入
的研发成本,有
的概率获得创新。创新意味着一次随机进步
z
i
依照Kortum (1997),服从Pareto分布:
因此,当期技术关于前一期技术及创新的条件期望为:
当期技术关于前一期技术的条件期望为:
与Kortum (1997)不同,作者假设虽然创新在时间维度上是i.i.d.的,但具有空间关联性:两个地区
l
和
l′
都创新时,设
s
(
l
,
l′
)表示实现值
z
i
(
l
)和
的相关系数。那么,
满足非负性,对称性,以及
和/或
。
Desmet& Rossi-Hansberg(2014)证明,上述技术的空间扩散机制与创新的空间关联性,能够将企业的动态创新决策问题简化为单期优化问题:企业只需要选择使得静态利润最大化的研发投入,而不用考虑其动态影响。这里的关键在于,扩散的连续性与创新的关联性可以保证,企业自身决策并不会影响下一期技术水平的期望值,因此也不会改变未来创新强度。
最后,再举一个劳动经济学的有趣应用为例。Caicedo et al.(2016)将Garicano(2000)及Garicano& Rossi-Hansberg(2004,2006)描绘的生产的科层结构(hierarchical structure)与Lucas(2009)结合起来,构建了一个知识驱动的分工与增长模型,解释美国收入Lorenz曲线变化及工作年限-工资收入的匹配特征。模型中,知识差异决定生产的科层式组织模式,进而决定工资差异;人与人之间的交流促进知识流动与经济增长,并推动收入差异的演化。
具体地,假设劳动力的技能分布函数为 F ( z ),其中, z 是个体的技能水平。个体每期有1 单位时间。生产过程被抽象为一个解决问题(problem-solving)的过程:个体花费单位时间可以从问题分布函数 G ( y )中抽取1个问题,如果 y < z ,那么他解决了这个问题,产出为 y ;否则产出为零。此外,个体还可以审阅人们提出(且没有得到解决)的问题,单位时间可以审阅 κ ≥1个问题。
显然,所有人各自为战不是最优的:解决不了的问题没有任何价值。事实上,最优的生产组织模式应当是科层制(hierarchical)的:
①低于某个临界值 z w 的个体将成为工人(worker),只提出问题,并解决自己力所能及的部分,把未解决的问题提交给上一级;
②技能高于 z w ,但低于另一个临界值 z e 的个体将成为管理者(manager,可以不止一层),审阅下一级提交的问题,解决自己知识范围内部分,将未解决提交给上一级;
③技能高于 z e 的个体成为企业家(entrepreneur),专门解决下一级提交的问题。
现在,考虑个体的职业生涯问题。刚入职时,个体获得一个随机的技能水平 z 。技能水平的演化满足Lucas(2009)交流模型。那么,随着工作年限的增加,个体收入的演化路径是随机的:有些人虽然初始技能较低,但运气足够好,不断遇到高水平个体可供学习,实现从工人到管理者再到企业家的职业发展;另一些人则一直没有遇到合适的学习样本,知识水平、职业地位及工资收入迟迟得不到提升。另一方面,当初始分布满足Frechet分布时,由Lucas(2009)知,所有时期分布都是Frechet,在均衡增长路径上,其尺度参数不断变大,对数工资的数学期望及方差也在变大,这与实证数据高度吻合。
Idea Flow理论将劳动经济学和产业组织理论中得到充分发展的搜寻模型嵌入到增长理论中,克服了前几代内生增长模型对知识假设的不现实性,在保证模型可解(tractable)基础上,又充分刻画了个体的异质性与学习的不完全性,为知识增长及扩散提供了微观基础,而且得到了大量经验研究的支持。
具体地,Idea Flow理论有如下优点。
第一,更加现实的微观基础。传统增长理论中,技术仅仅是一个抽象的参数;内生增长理论探究了技术进步的微观机制。但这些理论都缺乏微观基础,因此无法解释复杂的现实问题。Idea Flow理论从日常生活中得到启发,将知识增长抽象为一个搜寻过程,打通了理论建模和实证研究之间的壁垒,推进了人们对技术进步的认识。
第二,更加丰富的理论与现实内涵。Idea Flow理论中,个体间知识存量的差别是进行搜寻的必要条件,而搜寻则是知识增长与扩散的内在推动力。这种知识存量的异质性一方面与企业动态(Firm Dynamics)、资源错配(Misallocation)等研究呼应;另一方面也是研究收入分配与不平等动态演化等问题极好的起点。除此之外,作为异质性模型,Idea Flow理论的成功也启迪我们在其他领域引入异质性,建构新的模型解释其他经济现象。
Idea Flow理论为我们理解创新与技术扩散提供了新的洞见,日后势必成为相关领域经济学家建模工具箱的重要组成部分。不仅如此,它还指引我们探索教育,培训及学习的经济学意义。类似于Jovanovic (2014),Luttmer(2014)在Luttmer(2012a)基础上构建了一个竞争性的学生-教师配对市场,均衡时,学习能力较强的学生与生产率较高的老师匹配。个人的收入演化不仅与学习能力有关,还与发现新事物的运气有关;经济体的长期增长率则与学习能力最强的学生有关。因此,匹配质量的好坏不仅决定个人收入,而且还决定经济增长。笔者最近则利用Idea Flow理论构建了一个多重均衡模型,给出中等收入陷阱存在的可能性:发展中国家人均知识水平较低,因此人们普遍不愿意进行Lucas式的交流;反之,发达国家人均知识水平较高,交流的潜在收益很高,因此人们愿意相互交流。产品市场的开放可能会使得两者分工固化,发展中国家很难扭转均衡。这是因为虽然互联网等信息技术让国际知识交流更加频繁,但很多知识是必须当面交流的,人们还是从周围人中学到更多知识和技能。
当然,Idea Flow理论也有自身的缺点。
首先,过度繁杂的数学引起了一些经济学家的批评。例如,内生增长理论的奠基者之一,Lucas的学生Romer(2015)认为,增长理论目前过度数学化了(mathiness in the theory of economic growth)。很多论文的数学模型与文章正文联系并不紧密,且模型设定存在许多人为的,难以具体化的假设。Romer重点批评了Lucas& Moll(2014)中初始分布有Pareto厚尾的假设,认为它是极不符合现实的。
其次,Romer还认为,这些过度数学化的模型的严谨性也是值得怀疑的。它们可能只是利用数学外壳看起来严格,而非真正的严谨。以Lucas(2009)为例,Romer指出模型的证明有错误。此外,Romer还向Lucas& Moll指出了其工作论文中关于连续性证明的问题,然而后者并没有改正却直接发表了。
我们注意到,Idea Flow所依赖的搜寻,还是比较简单的McCall搜寻。标准的Diamond-Mortensen-Pissarides框架没有得到采用,更别说近年来以Moen(1997)、Burdett et al.(2001)、Menzio& Shi(2010a,2010b,2011)为代表的Directed Search及On-the-job Search理论。搜寻模型,与任何理论模型一样,其发展的内在逻辑都是更加精确地解释现实。例如,本文中的搜寻都是随机的,人们只能选择投入多少努力进行搜寻,却不能控制搜寻的范围;而Directed Search理论则认为,劳动者可以在价格信号的激励下,进入各个次级就业市场寻找工作,高薪往往意味着激烈竞争,因此存在价格与等待时间之间的权衡。反映在知识搜寻过程中,一个研究者在进行研究时,往往也需要确定研究领域:他必须权衡做出成果的预期时间与成果的潜在回报。上述权衡如何决定经济整体的研发与增长呢?这还有待进一步地研究。
无论是Kortum (1997)还是Lucas(2009),还是后来的改进版本,都还只是对现实世界初步的刻画,仍有一系列现实问题有待解答。例如,如何在Idea Flow理论中引入不完全的知识产权呢?如何解释专利市场的存在与运作呢?换句话说,思想的市场(market for ideas)究竟是什么,又应当是什么?这个问题自Coase(1974)提出后得到了广泛讨论,近来,Akcigit et al.(2016)的工作值得研究者重视:作者们基于随机创新构建了一个内生增长模型,论证专利市场存在的合理性与必要性。简单来说,投资研发的厂商获得的创新与它自身业务关联度是随机的,厂商会在专利市场上售出与自身业务关系不大的创新,买入密切相关的创新(如果自身未研发出所需的技术时)。因此,专利市场的有效性会通过影响专利在企业间的配置效率影响长期经济增长。
[1]Acemoglu D,Akcigit U,Bloom N,et al.Innovation,reallocation and growth [R].National Bureau of Economic Research,2013.
[2]Acemoglu D,Cao D.Innovation by entrants and incumbents[J].Journal of Economic Theory,2015,157:255-294.
[3]Achdou Y,Buera F J,Lasry J M,et al.Partial differential equation models in macroeconomics[J].Phil.Trans.R.Soc.A,2014,372(2028):20130397.
[4]Aghion P,Howitt P. A Model of Growth through Creative Destruction [J].Econometrica,1992,60(2),323-351.
[5]Akcigit U,Celik M A,Greenwood J.Buy,Keep,or Sell:Economic Growth and the Market for Ideas[J].Econometrica,2016,84(3):943-984.
[6]Alvarez F E,Buera F J,Lucas Jr R E.Models of idea flows[R].National Bureau of Economic Research,2008.
[7]Alvarez F E,Buera F J,Lucas Jr R E.Idea flows,economic growth and trade[R].National Bureau of Economic Research,2013.
[8]Benhabib J,Perla J,Tonetti C.Catch-up and fall-back through innovation and imitation[J].Journal of Economic Growth,2014,19(1):1-35.
[9]Buera F J,Oberfield E.The Global Diffusion of Ideas [R].National Bureau of Economic Research,2016.
[10]Caicedo S,Lucas Jr R E,Rossi-Hansberg E.Learning,Career Paths,and the Distribution of Wages[R].National Bureau of Economic Research,2016.
[11]Coase R H.The market for goods and the market for ideas [J].The American Economic Review,1974,64(2):384-391.
[12]Comin D A,Dmitriev M,Rossi Hansberg E.The spatial diffusion of technology[R].National Bureau of Economic Research,2012.
[13]Desmet K,Rossi-Hansberg E.Spatial development [J].The American Economic Review,2014,104(4):1211-1243.
[14]Eaton J,Kortum S.International technology diffusion:Theory and measurement[J].International Economic Review,1999,40(3):537-570.
[15]Eaton J,Kortum S.Technology,trade,and growth:A unified framework [J].European economic review,2001,45(4):742-755.
[16]Eaton J,Kortum S.Technology,geography,and trade[J].Econometrica,2002,70(5):1741-1779.
[17]Garicano L.Hierarchies and the Organization of Knowledge in Production [J].Journal of political economy,2000,108(5):874-904.
[18]Garicano L,Rossi-Hansberg E.Inequality and the Organization of Knowledge[J].The American Economic Review,2004,94(2):197-202.
[19]Garicano L,Rossi-Hansberg E.Organization and Inequality in a Knowledge Economy[J].The Quarterly journal of economics,2006,121(4):1383-1435.
[20]Grossman G M,Helpman E.Innovation and growth in the global economy [M].MIT press,1993.
[21]Jovanovic B,Rob R.The growth and diffusion of knowledge [J].The Review of Economic Studies,1989,56(4):569-582.
[22]Jovanovic B.Misallocation and growth[J].The American Economic Review,2014,104(4):1149-1171.
[23]Kortum S S.Research,patenting,and technological change [J].Econometrica:Journal of the Econometric Society,1997:1389-1419.
[24]Lasry J M,Lions P L,Guéant O.Application of Mean Field Games to Growth Theory[J].
[25]Lasry J M,Lions P L.Jeuxchamp moyen.i–le cas stationnaire[J].Comptes Rendus Mathématique,2006,343(9):619-625.
[26]Lasry J M,Lions P L.Mean field games [J].Japanese Journal of Mathematics,2007,2(1):229-260.
[27]Lucas Jr R E,Moll B.Knowledge Growth and the Allocation of Time[J].Journal of Political Economy,2014,122(1):1-51.
[28]Lucas Jr R E.Human Capital and Growth [J].The American Economic Review,2015,105(5):85-88.
[29]Lucas R E.Ideas and growth[J].Economica,2009,76(301):1-19.
[30]Lucas R E.On the mechanics of economic development [J].Journal of monetary economics,1988,22(1):3-42.
[31]Luttmer E G J.An Assignment Model of Knowledge Diffusion and Income Inequality[J].Federal Reserve Bank of Minneapolis Research Department Staff Report,2014,715.
[32]Luttmer E G J.Eventually,noise and imitation implies balanced growth [R].Minneapolis Federal Reserve Working Paper 699,2012.
[33]Luttmer E G J.Technology diffusion and growth[J].Journal of Economic Theory,2012,147(2):602-622.
[34]Melitz M J.The impact of trade on intra ‐ industry reallocations and aggregate industry productivity[J].Econometrica,2003,71(6):1695-1725.
[35]Menzio G,Shi S.Block recursive equilibria for stochastic models of search on the job[J].Journal of Economic Theory,2010,145(4):1453-1494.
[36]Menzio G,Shi S. Directed search on the job,heterogeneity,and aggregate fluctuations[J].The American Economic Review,2010,100(2):327-332.
[37]Menzio G,Shi S.Efficient Search on the Job and the Business Cycle[J].Journal of Political Economy,2011,119(3):468-510.
[38]Moen E R.Competitive search equilibrium [J].Journal of political Economy,1997,105(2):385-411.
[39]Perla J,Tonetti C.Equilibrium imitation and growth [J].Journal of Political Economy,2014,122(1):52-76.
[40]Perla J,Tonetti C, Waugh M E.Equilibrium technology diffusion,trade,and growth[R].National Bureau of Economic Research,2015.
[41]Romer P M.Endogenous Technological Change[J].Journal of Political Economy,1990,98:71-102.
[42]Romer P M. Mathiness in the theory of economic growth [J].The American Economic Review,2015,105(5):89-93.
[43]Sampson T.Dynamic Selection:An Idea Flows Theory of Entry,Trade,and Growth[J].The Quarterly Journal of Economics,2016,131(1):315-380.
[44]Zilibotti F,Knig M,Lorenz J.Innovation vs.imitation and the evolution of productivity distributions[J].Theoretical Economics,2015.
论文执行编辑:李 剑
论文接收日期:2016年9月28日
[1] 注意到,Kortum模型中, s 表示行业,而Lucas模型则表示个体。这是因为Kortum将知识的所有权归于企业,而Lucas则把它归于个体。本质上,两者是等价的,只是为了便于经济解释。
[2] 注意这里的 s 用来表示搜寻强度,而不是我们之前用来表示不同个体的。
[3] 封闭经济下,就是F t (q),开放经济下则不然,详见下文。