财新传媒

不断变化的美国创新结构:关于经济增长的一些告诫

来源于 《比较》 2019年第5期 出版日期 2019年10月01日
文丨阿希什·阿罗拉 沙伦·贝伦佐 安德烈亚·帕塔科尼 徐政奎

5.大型企业实验室和创新生态体系

  本节首先强调了美国生产率增长在20世纪先升后降,随后表明这个过程与大型企业实验室的兴衰轨迹基本吻合。

  笔者在本节中认为,大型企业实验室或许是健康的创新生态体系的重要组成部分(它们产生的作用往往没有得到认可)。尽管我们并不否认创新分工进一步细化时,由此产生的创新专业化会带来一定裨益,但我们也指出大型企业实验室的消亡会产生一定的社会代价。尽管大企业从内部研究中无利可图,纷纷撤出自己的研究力量,但这种变化或许对社会有百害而无一利。

  5.1大型企业实验室的原创发明成果与众不同

  有很多原因解释了为什么大型企业实验室的发明创造不同于大学和初创企业的成果。

  5.1.1企业实验室致力于通用技术

  由于企业实验室往往隶属于一体化的在位大企业,所以它们有强大的激励重点关注系统性创新或架构创新。卡普尔(Kapoor,2013)的研究结果与这个论断完全相符。他探究了半导体业的垂直分解,发现一体化的在位企业重新调整了自己的研究活动,更倾向于开展系统性创新(系统性创新需要各个生产阶段和参与者之间广泛开展协调和沟通),而较少关注自主创新(自主创新不需要生产阶段和参与者进行太多调整)。莱库奥纳·托拉斯(Lecuona Torras,2017)还发现大企业更可能利用通用技术引入手机方面的架构创新。有不少轶事证据(anecdotal evidence)表明,这种行为确实存在:譬如克劳德·香农(Claude Shannon)对信息理论开展的研究得到了贝尔实验室的支持,因为通信网络的效率提高必然使美国电话电报公司获得最多益处(Gertner,2013)。IBM认为领先别人掌握下一代革命性芯片设计,会使自己在行业中占尽先机,为此它研发出扫描电子显微镜,并进一步探索了电子局域化、非平衡超导和弹道电子运动,成就了纳米科学的里程碑式发展(Gomory,1985;Rosenberg,1994,第258页)。最后,近年来企业在机器学习类出版物上发表的论文数量激增,表明谷歌和脸书等大企业面向学界发表的研究或软件包更多(这些企业都掌握着科研成果商业化所需的互补性资产,如用户数据)。这是因为机器学习领域实现总体突破时,大企业获得的益处最多(Hartmann and Henkel,2019)。

  5.1.2企业实验室解决实际问题

  企业实验室的目标在于解决切实存在的具体问题。这种以具体任务为导向的模式会限制研究人员的自由度,但也降低了纯理论反思的风险,并加速了科学向商业应用转化的进程。此外,和那些要拼尽全力生存下来的小企业不同的是,大型实验室可以为研究人员提供资源,并允许他们有所懈怠,从而产生真正有开创性的研究。因此,企业实验室或许会将这两个世界的最大优势相结合。另一方面,它们的研究与实际问题息息相关,这样得到的研究成果很可能有重大的产业应用。不过另一方面,这种联系并不牢固,所以它们取得的成果更倾向于应用型研究,从而限制了它们的科研价值。安德鲁·奥德利茨科强调了贝尔实验室对商业必要性的重视:

  贝尔实验室与市场保持着联系,因此与现实存在的问题息息相关,这一点非常重要。这种联系并不紧密,所以实验室能够致力于研究很多长期问题。不过这种联系终究是存在的,因此它们开展的很多看似徒劳无功的研究是真正的创新性研究的核心所在,并不全然是白费力气的,而且目标更精确,也不会像大学研究那样受到惰性的困扰。(*15.这部分引用来源于Andrew Odlyzko写给《华尔街日报》的信件,可在http://www.dtc.umn.edu/odlyzko/misc/wsj-bell-labs-20120326查到。笔者访问该网址的日期为2019年2月18日。

  5.1.3企业实验室涵盖多个学科而且资源更丰富

  大企业实验室的发明成果可能与大学或初创企业的发明创造截然不同,这是因为大企业的财力更雄厚,而且可以将不同知识流和各种能力结合起来解决跨学科问题(Tether,1998;Pisano,2010)。譬如,如果贝尔实验室没有把卓尔不群的理论造诣和工程技能结合起来,就不可能创造出晶体管。自20世纪40年代初开始,普杜大学的物理化学家卡尔·拉克-霍洛维茨(Karl Lark-Horovitz)、通用电气和其他机构就在努力推动固体电子学方面的研究。然而,只有贝尔实验室的跨学科团队囊括了必不可少的物理学家、冶金学家和化学家,成功解决了晶体管开发过程中涉及的很多理论和实践问题。

  由于麻省理工学院的放射实验室曾在二战期间选择美国电话电报公司的西部电气公司制造雷达的逆电压整流器,所以该公司的冶金学家已经掌握了半导体净化技术和掺杂技术的第一手经验。后来贝尔实验室的冶金学家亨利·特雷尔(Henry Theurer)在1951年研发出区熔提纯法,在处理锗质结晶体时使其杂质能级达到百亿分之一。此外,也是贝尔实验室用戈登·蒂尔(Gordon Teal)的晶体提拉法制造出硅棒的正负接面。如果贝尔实验室的内部研究没有取得以上两项材料学成果,那么肖克利不可能发明晶体管(Gertner,2013)。

  同样,霍尔布鲁克等人(Holbrook et al.,2000)强调,正是研发与制造之间的跨部门协调帮助仙童半导体公司取得两项重大突破:平面工艺和集成电路。反之,我们有理由认为无生产线企业很难完成这些创新,这些企业专门从事集成电路的设计工作,尽量规避建造和运营生产设施产生的高昂成本。

  以人工智能(AI)研究为例,它清晰展现了大企业实验室的研究有别于大学/初创企业的研究。自2010年起,谷歌、IBM和脸书等大企业已经投入重金开展人工智能研究。哈特曼和汉克尔(Hartmann and Hankel,2019)近期的研究表明,2004年至2016年,企业在顶级人工智能期刊[如国际机器学习大会(International Conference on Machine Learning,ICML)]上发表论文的比重增长了两倍。企业作为先驱者,在深层神经网络(deep neural network,DNN)等专业领域开拓了研究工作。谷歌发表了许多具有里程碑意义的论文,如“Cat Paper”(Le et al.,2011)和“Google Translate Paper”(Wu et al.,2016)。它们证实了长短期记忆(Long-Short Term Memory,LSTM)等新算法对图像识别和语言翻译的有效性。尽管很多在谷歌参与这些项目的科学家也供职于大学[如斯坦福大学的吴恩达(Andrew Ng)和多伦多大学的杰弗里·辛顿(Geoffrey Hinton)],但出于以下三个原因,无论是大学还是风险资本支持的初创企业都不可能取得与谷歌相提并论的研究成果。(*16.Hinton是神经网络研究的先驱者,而且监督指导了Alexnet的实施过程(Hinton与脸书的Yann LeCunn和麦吉尔大学的Yoshua Bengio共同分享了2018年图灵奖)。Alexnet是2012年第一个使Imagenet大赛中的错误率下降到25%以下的算法。

  规模。2018年,谷歌雇用的人工智能研究人员达1700多人,而且收购了一系列专业研究人工智能的初创企业。它首先于2013年收购了杰弗里·辛顿的公司(即DNN research),随后于2014年收购了戴密斯·哈萨比斯(Demis Hassabis)的Deep Mind公司。谷歌等大企业还收集并维护了专有数据库,其规模远远超过了由大学创建并供公众使用的数据库。在机器学习领域,数据库较大时才能对算法进行实证验证,而且验证算法的工作很难通过分析完成。这意味着人工智能的前沿实证工作必然由拥有大量数据的企业来完成。孙晨等人(Sun et al.,2017)的研究表明,谷歌采用了JFT-300M数据库。这个数据库拥有3亿图像,且它们的标签超过3.75亿个(斯坦福大学的Imagenet数据库是对公众开放的大学数据库中规模最大的之一,它收集了100万个图像)。孙晨等人(2017)在实证层面展示了数据的规模不断扩大时,研究取得的成果也显著提升。从直觉判断,这一研究结果是合理的,但很难进行大规模验证。

  跨学科。对神经网络开展研究时需要一个跨学科团队。学科领域的专家(如机器翻译中的语言学家)对需要解决的问题提出定义并评估研究成果;统计学家设计算法,并对算法的误差范围和优化过程建立理论学说;计算机科学家在使用算法的过程中努力提高其效率。“谷歌翻译”(Google translate)这篇论文有31位合著者,其中不少都是各自领域里的翘楚,这完全在意料之中(Wu et al.,2016)。看起来在这个领域里,大学研究与企业研究渐行渐远是大势所趋:哈特曼和汉克尔(2019)研究了2011年至2018年五次顶尖机器学习会议上发表的论文。笔者采用马克斯(Marx,2019)的数据核查了这些论文平均合著者人数,发现大企业的研究成果平均由4.3个人共同执笔,而中小企业的研究成果平均由3.4个人共同执笔,前者比后者多出近一个人。(*17.这五个会议为Knowledge Discovery and Data Mining(KDD)、Association for the Advancement of Artificial Intelligence(AAAI)、International Conference on Machine Learning(ICML)、International Joint Conferences on Artificial Intelligence(IJCAI)和Conference on Neural Information Processing Systems(NIPS)。这里所说的“大企业”指微软、谷歌、IBM、雅虎、丰田、百度、NEC公司、脸书、Adobe公司和领英。Hartmann and Henkel(2019)称它们是人工智能领域里发表论文最多的公司。)在合著者不足11人的发表论文中,大企业发布的论文占到总量的10%(合著者不足11人的论文共有20989篇,其中有2168篇是由大企业发表的),不过在合著者超过11人的论文中,大企业发布的论文占到总量的28%(合著者超过11人的论文有79篇,其中有22篇是这些大企业发表的)。对高质量论文的研究表明,大企业与中小企业撰写论文的团队规模也表现出同样的差异。在机器学习会议上发表且引用次数排名前10%的文章中,企业发表的论文有4.4位合著者,而非企业机构发表的论文有3.6位合著者。对于引用次数排名前1%的发表论文来说,它们也表现出这个模式,即企业发表论文的合著者人数(平均每篇论文4.4位合著者)多于非企业机构发表论文的合著者人数(平均每篇论文3.6位合著者)。

  辅助设备。科学与工程学通力合作,也是“谷歌大脑”团队(Google Brain)具备的优势之一,而大学或风险资本支持的初创企业很难复制这一优势。为了执行Quoc Le写出的代码(Quoc Le是谷歌翻译项目的主导科学家之一),软件工程师将他写的代码转化为谷歌刚刚开发出来的Tensor Flow语言,而硬件工程师调试了谷歌专有的张量处理单元(Tensor Processing Unit,以下简称TPU)以排除故障,TPU是谷歌为神经网络的推理任务专门开发的。(*18.TPU是专门为深度神经网络设计的专用集成电路(Application Specific Integrated Circuit,ASIC)。第一代TPU于2015年用于谷歌数据中心,其运行速度是当时GPU(图像处理器)运行速度的26倍。https://cloud.google.com/blog/products/gcp/an-in-depth-look-at-googles-first-tensor-processing-unit-tpu)。谷歌持续改进这些芯片,在两年的时间里开发出四代TPU芯片。只有麻省理工学院(开发了深度学习芯片Eyeriss)、佐治亚理工大学、苏黎世联邦理工学院(开发了加速器Nullhop)和玛德拉斯印度理工学院等少数大学对这类“人工智能加速型”芯片展开了研究,但它们的产品尚未广泛面市。

  当大企业的研究(1)通用性更强、(2)与实际问题结合更紧密而且(3)跨越多个学科时,平均来说,它们的研究对发明家的价值高于大学研究对发明家的价值。如果的确如此,那么我们应该可以观察到,获得了专利的发明家更关注企业研究,而不是大学研究。

  有轶事证据表明,许多企业已经根据“谷歌大脑”团队发表的神经网络研究成果开展了后续研究。现在用AlexNet或LSTM检验自己的算法已经成为研究人员的惯例,而AlexNet和LSTM都是由谷歌不断完善的。我们发现大企业发表的机器学习论文被专利申请材料引用的频率高于其他机构/个人发表的机器学习论文:在2011年至2018年,大企业发表的论文在KDD(国际数据挖掘与知识发现大会)、AAAI(美国人工智能学会)、ICML(国际机器学习大会)、IJCAI(国际人工智能联合大会)和NIPS(神经信息系统处理大会)发表的论文中占12%,但它们被专利引用的次数占总量的32%。

  毕卡德(Bikard,2015)发现,对于同一项科学发现,企业发表的论文被引用的概率比大学发表的论文被引用的概率高出23%。我们还分别统计了1980年至2006年美国颁发的实用专利在文献描述部分引用企业发表的论文和大学发表的论文的情况,并对它们进行比较。我们的研究结果为毕卡德的预测补充了更宽泛的相关性证据。我们采用线性概率模型进行估算后发现,企业发表的论文被引用的可能性比大学发表的论文平均高出11%。我们控制了质量较差的大学、“应用类”期刊或科研质量的产业差异等因素产生影响的可能性,发现之前的研究结果仍然成立。图12.A形象地展现了这两类论文在引用可能性上的差异,而图12.B表明从专利的引用次数看,企业发表的论文相对于大学发表的论文一阶随机占优。

图12 专利引用大学发表论文与企业发表论文的情况

1924
注:本图的样本包括样本期(1980—2006年)内,科睿维安科学网和科技会议文献引文索引(Conference Proceedings Citation Index-Science)中收录的排名前100的美国大学发表的论文以及样本企业发表的论文。每篇论文被专利引用的情况用1980年至2014年每篇发表论文被美国授予的企业专利和非企业专利引用的总数衡量(包括内部引用和外部引用)。图A对比了每篇企业发表的论文被专利引用次数的中值与每篇大学发表的论文被专利引用次数的中值。图B分别展示了企业发表的论文和大学发表的论文被专利申请引用次数的累积分布。每篇论文被专利引用的次数用样本中第99个百分位的近似值表示。关于本图的分析来源于Arora et al.(2017)。

  5.1.4大型企业实验室或许会创造出重大的外部效益

  除了创造出其他机构/个人无法创造出来的发明创新以外,大型企业实验室还可能创造出重大的外部效益。一个众所周知的案例是施乐公司的帕洛阿尔托研究中心。它在个人计算机的硬件和软件设计方面创造出很多根本性发明,如带图形用户界面的现代个人计算机。然而,它本身并没有从这些成果中获得太多益处。相反,这些发明多半被其他企业进行了商业化开发,其中最知名的是苹果和微软。尽管施乐公司显然未能将其创造力十足的实验室给它带来的利益完全内部化(受这些科研成果影响的产业与施乐公司的核心业务没有关联时,这种情况表现得更加显著),但几乎不可否认的是这些发明产生了巨大的社会效益。现在苹果和微软的市值加起来已经超过1.6万亿美元。

  企业实验室可能产生的另外一类外部效益是分拆活动。克莱珀(Klepper,2015)系统地说明了分拆在美国创新生态体系中的重要性。他发现在很多高科技产业中(如早年间的汽车业、半导体业和激光业),分拆企业的表现都极为抢眼。阿格拉瓦尔(Agrawal et al.,2014)还发现,如果某个地区有众多获得专利的小规模实体与至少一家获得专利的大规模实体共存,那么当地的创新溢价极高。

  这项分析有一个出乎意料的含义,即领先企业及其实验室管理不当有时反而是好事。仙童半导体公司和德州仪器之间的比较很有启发性。德州仪器的管理能力远远强于仙童半导体公司,但分拆出来的企业也少了不少。硅谷是作为一个科技中心繁荣起来的,尽管毗邻德州仪器的达拉斯-沃斯堡地区的半导体企业集群也十分重要,但它们对经济发展的重要性却远远逊于硅谷。我们可以认为,在促进多元化和创新方面,分拆企业驱动的增长远远强于经营有方的仙童半导体公司。同样,妄图集中管理或指引创新活动可能事与愿违。施乐的各个分拆企业的情形正是如此。正如有学者(Chesbrough,2002,2003)表明的,核心问题并不在于施乐最初分配给分拆企业的股权,而是它管理这些分拆企业的方式——它强迫公司的研究人员重点开发与其现有业务最接近的应用,阻止他们开展实验研究。需要再次说明的是,看起来集中控制岛(即大型企业实验室)与挤满众多初创企业和分拆企业的交易市场共存时,最有利于快速推进实验研究和经济增长。

  [《比较》印刷版,点此订阅,随时起刊,免费快递。]

版面编辑:吴秋晗
财新微信