中色行业在线培训平台

全国咨询热线:4006037900

智能制造

您当前的位置:首页 > 智能制造 > 教材

许成钢:人工智能、工业革命与制度
2018-08-17 08:38:08 点击率:613 来源:

 

随着大数据和人工智能的发展,国内相关人士引发了一场关于是否可以重振计划经济的争论。许成钢的文章从大数据产生的制度基础、数据和机器学习的性质以及人类有限理性入手,对这一争论给出了否定的回答。首先,从制度角度来看,大数据来自市场,如果消灭了市场,不仅数据无从产生,还会严重损害激励机制,导致创新无法产生。其次,从大数据本身来看,有硬数据和软数据的区别,软数据是不可传递无法度量的,这就导致大数据不可能完备;从机器学习的角度看,有热识别和冷识别之分,而热识别是机器无法学习的。再次,人类的理性是有限的,因此人的认识和推理是片面的、不完备的,甚至可能是矛盾的,这就决定了,模仿人类进行推理和规划的机器人也不可能比自然人做得更好。由此看来,建立一个前所未有的新式计划经济是不可能的。本推送共计10500字,有删节,全文刊载于《比较》第95辑。财新网全文链接为:http://opinion.caixin.com/2018-06-04/101262161.html


2017年7月8日,国务院发布《新一代人工智能发展规划》。9月初,俄罗斯总统普京在谈及人工智能时表示,人工智能技术发展引发了“难以预测的巨大机遇和威胁”。“谁能成为这一领域的领先者,谁就是未来世界的统治者。”在普京的眼里,人工智能不仅是重大战略机遇,而且是俄罗斯存亡的关键。


迄今为止,在人类历史上,所有技术革命,所有创新性、革命性技术的产生和重大发展,都是从市场上产生出来的,都是以私有制为基础的企业家们创造出来的,都是市场优胜劣汰的最后结果。大力推动人工智能,这个大方向是非常正确的,但是我们要关心的是怎么做:是用计划的方法做吗?历史的教训和经济学的道理告诉我们,计划的方法做不出来。计划的方法充其量就是跟在市场的后面走,自己走不远。


此外,在关于人工智能和制度的辩论中,有一种重要观点:人工智能可能是新一代计划经济的技术基础。例如,人工智能很重要的一个应用是在金融领域。如果机器可以决定投资,那是否意味着部分计划经济?这涉及一个非常重要的基本问题:机器收集和处理的信息来源是什么?计划什么是有效率的?计划什么是低效率的?计划的界限在哪里?


下面我首先要解释,中国发展人工智能面临的最重要问题是制度,而不是一揽子技术问题。因为国民经济的整体状态的重要性超过一两项技术是不是全球领先。为了讨论这个问题,让我们先来看一些数据。


2016年麦肯锡做了一次调研,发现中国的劳动生产率仅为经合组织(OECD)国家平均值的15%—30%,也就是说中国的劳动生产率比发达国家低很多倍。这意味着中国普遍较为落后。这不是在最前沿的个别领域上领先能自动解决的问题。


以上我们看到的是劳动生产率低下。在比较完善的市场经济中,低劳动生产率伴随着低劳动力成本。但是,许多文献表明,中国的劳动力成本反常地高。经济学人智库的分析显示,2016 年中国单位劳动力成本高于美国和西欧。牛津经济研究院的调研结果表明,2016年中国劳动力成本仅比美国低4%。另一个计算方式是按照单位劳动生产率,也就是说,如果我们在中国和美国制造同样的产品,中国的劳动力成本比美国贵。


劳动力成本非常贵,是不是意味着中国的工人拿钱太多了呢?并非如此。中国的家庭收入只占中国GDP的三分之一略强,为世界最低之一。世界上大多数其他国家,家庭收入占本国GDP的比例在一半以上。换言之,中国的工人并没有拿钱太多。


劳动力这么贵,工人却没多拿钱,成本压在企业身上,企业也没拿到,因此是国家拿走了。政府的财政收入增长率连续二十多年超过GDP增长率,如今仍然如此。所以,政府收入占本国GDP的份额是世界最高之一,这导致劳动者和企业承担了巨大的制度成本。


此外,在中国,由于制度原因,最盈利的行业是银行、房地产,而不是与研发密切相关的行业。作为对比,在美国,最盈利的行业是与研发密切相关的行业。


因此,不解决制度问题,仅仅把力量集中在最前沿技术的所谓产业升级上,即便在个别产品个别行业得到产业升级的结果,也解决不了普遍的经济问题。而且,即便是专门讨论产业升级,在不解决制度问题的前提下,也只能解决个别产品问题。


工业革命的负面教训


一个流行的看法是,大数据和人工智能在引领下一轮工业革命。这一看法是有道理的。在人类历史上,国家之间拉开巨大的距离产生于工业革命。新一轮工业革命会进一步拉开国家之间的距离。


但是,工业革命的影响并非在所有方面都是正面的。我们也需要非常冷静地回顾过去历次工业革命带来的负面教训,这些教训都来自对新技术的滥用和高估。与过去的工业革命相关的最大负面教训,就是大规模的国有制和中央计划经济。这个想法最早产生于两次工业革命的过程。一些极左翼知识分子误认为人类有能力认识一切,误认为人类有能力掌控社会所有的方方面面,进而误认为人类有能力知道所有人的福利是什么,有能力安排所有人的福利,有能力帮助人类安排所有的技术变化和生产。因此,以私有制为基础的市场经济最终会也必须被以国有制为基础的中央计划取代。以国有制为基础的中央计划经济影响了全球三分之一的人口。虽然过去80年里,技术和市场的运作发生了翻天覆地的变化,哈耶克在20世纪三四十年代的相关讨论仍然有效。


与工业革命相伴随的对技术的滥用和误解还有另一个重大负面作用,那就是对环境的破坏。举两个例子:第一个例子是巨大的水利工程。人们以为自己有全部的能力规划河道、湖泊、陆地,可以通过建坝的方式建造前所未有的巨大人工湖,直到发生一系列灾难性后果,才意识到有大量事情是无法计划和规划的。二三十年前,国与国之间达成共识,对建造大坝极其谨慎,原则上不支持建造巨型大坝。任何大坝在建设之前,第一重要的是评价它们对环境的影响。


第二个例子是,碳排放导致全球变暖。这是过去历次工业革命、技术发展、经济发展完全没有意识到的问题。


现在大数据和人工智能来了,我们应当吸取以前的教训,关注滥用大数据、滥用人工智能带来的危险。当前,有一些科学家已经发出警告,但是他们大部分讨论的是基本的道德问题,机器人会不会残杀人类,我更想强调的是另外一类问题:技术与制度的关系,市场和计划之间的关系。


当人们误认为科学技术万能,误认为某种万能的技术可以取代甚至颠覆人类文明千年积累下来的制度和人们对制度的认识,灾难就会接踵而至。比如一些政府或者垄断性的大公司,试图利用他们掌握的大数据控制社会、取代市场,这不仅会从根本上阻碍技术进步,更可能给社会带来巨大灾难。


大数据、人工智能作为新兴工业革命的基础


在没有能力处理的情况下,大数据本身并没有太大的重要性,其重要性在于它是一部分人工智能发展的基础。除了中国、美国以及俄罗斯政府外,世界上几乎所有的发达国家也都高度关注人工智能的发展,其原因就是现在各国政府已经清楚地意识到,人工智能是一场全新的、目前处在起步阶段的第四次工业革命的基础或者核心部分。这场工业革命引发的后果包括无人工厂、无人服务,可能是前所未有的超高效率,同时也可能引发大量失业。


在前三次工业革命中,人类最重要的资源是原材料,是能源,也就是地球上的自然资源。随着人工智能的发展,大数据开始变成了一种基本资源。一大类的人工智能用数据训练机器。因此,有数据才有训练,才有智能;没有数据就没有训练,就没有智能。数据越多,量越大,资源也就越大。于是,大数据逐渐成为和原材料、能源并列的基本资源,但是这一资源本质上不同于其他的基本资源。在此之前的资源大多是天然的,而大数据是人造的,自然资源越用越少,数据却越用越多。


人造的资源就意味着这一资源的性质、质量和数量都取决于其被制造的环境,尤其是相关的制度安排。例如,在许多意见不能表达的制度下,大数据的性质就是这些表达的缺失。而在意见能自由表达的制度下,收集到的就是所有意见表达的数据。比如“大跃进”时期大饥荒产生的一个基本原因就是信息无法传递,这不是技术问题,而是制度问题。所以,大数据不仅受制度约束,更取决于制度


在人工智能中,所谓智能的核心部分是算法。早在20世纪50年代,科学家就开始了这方面的探索。“人工智能”这个词、算法和其他想法,甚至一些指导性意见是几个创始人在1956年的一次会议上确定下来的。其中,重要的奠基人之一是经济学家赫伯特·西蒙教授(1916—2001),1978年诺贝尔经济学奖得主,他既是经济学教授,也是计算机和心理学教授。确切地说,人工智能从诞生之日起,就是这三个领域的联合产物。


在各种算法当中,如今应用方面发展得最突出的,是所谓的人工神经模型。这种模型使机器可以在人的指导下学习,包括所谓的深度学习。人工智能另外一个普遍使用和探索的方法是统计算法。无论使用深度学习还是统计算法,都必须有大量的数据。这就是为什么大数据是人工智能的基础。


人工智能的第二个基础是计算能力。在过去的半个世纪里,计算速度和存储能力基本上每两年提高一倍。现在,超强的计算能力使得无论基于哪一种算法的人工智能,在某些领域里机器都可以超过人类,而且远远超过人类。


以上概括了为什么人工智能的基础是大数据。那么,大数据本身的技术基础是什么?这是一个关键问题,因为弄清楚大数据的技术基础,能帮助我们了解人工智能可以做什么、不可以做什么的界限。


大数据的核心是收集、传输、存储和处理所有可度量的数据。度量的技术基础是传感器(包括录音机、摄像机等)和移动设备。通过这些设备检测到具体数据,通过互联网、物联网传送和集中,形成大数据。这里,传感器的“可度量”是大数据的关键所在,它决定了人工智能可以做什么、不可以做什么。另一类大数据是利用历史上积累的大量文献,其中包括各个学科积累的文献,比如图书馆里的文字、图形、音频、视频记录,供机器学习分析。


所有可以通过传感器和移动设备度量的数据,都可以收集、传输和存储,但可度量是非常重要的技术条件。任何不可度量的对象,都无法变成数据,机器也就无法处理。


在应用方面,目前人们认为最有前途的是所谓深度学习,用大数据训练机器,让它产生识别、推理和规划的能力。实际上,从开始创造人工智能学科起,人工智能就包括规划。在英语里,规划和计划是同一个单词planning。从事工程的人和其他非经济学者,往往会把这两个概念混作一团,把规划的概念混作为计划经济。


人工智能就是用机器模仿人的推理和规划,在科学领域里,研究人的推理和规划的学科叫作决策理论(decision theory),它在很大程度上是经济学的一个部分。从这个角度讲,人工智能和经济学讨论的对象是相似的。但是,经济学讨论的是人的推理和规划,人工智能讨论的是让机器模仿人的推理和规划。


人工智能和大数据的科学技术基础


所谓深度学习是一种算法。这种算法从刚一产生就和经济学的决策理论紧密联系在一起。首先,设计者要为人工智能或者机器人规定其目标,在经济学和人工智能里都称之为目标函数,也就是机器人要干什么,“活”在世上图什么。从分析的角度看,在追求其自身的“目标”方面,机器人与经济学家讨论的自然人的行为相似,都是在一系列约束条件下,寻找并执行达到其目标最大化的途径。


为了认清人工智能,我们必须区分人的智能和人工智能。我们必须清楚地知道,关于人的智能,经济学家对此的认识极其有限。这本身就决定人工智能的界限。经济学家可以把人的目标抽象地写成某个函数,但并不真的知道人的真实具体目标是什么,什么因素影响其目标。比如,人的目标是为了愉快或者满意。但是否满意,多么满意,什么因素影响了满意的程度,这些只有每个人自己知道,经济学家不知道,任何计划者也不知道。因此,对于经济问题,人们通过市场可以找到使自己满意的安排。相反,在没有市场的计划经济里,由于无法得知人们的基本信息,也就无法设计出使人们满意的结果。因此,哈耶克的推理完全没有过时。对于任何能运作的机器人,设计者必须确切规定机器人的目标。表面上看人们对机器人的目标知道得很确切,实际上,这个“知道得很确切”本身就意味着机器人与自然人的基本差距。


此外,人的智能产生于人的生理和心理感知,以及人收集的信息。早在20世纪50年代,赫伯特·西蒙教授在讨论人工智能时,就提出了“识别”这个概念,它是今天人工智能的核心。早在那个时代,人们就已经把识别区分为“冷识别”和“热识别”,并有过激烈的辩论。所谓“冷识别”就是机器能够识别的,而所谓“热识别”是人带着感情的识别,是机器学不来的。另一对相关的基本概念是硬数据和软数据。所有可度量可传递的数据就是硬数据。和硬数据对立的是软数据,即无法用机器度量、无法传递的数据。当我们讨论人工智能是基于大数据训练出来的时候,必须要知道存在热识别问题和软数据问题。


另一个问题是,人的智能里有一个基本部分——直觉。直觉是基于人对硬数据和软数据、冷识别和热识别的综合,以及经济学家无法确切描述的目标而产生出来的一种高度抽象的、非逻辑的理解。它依赖的数据不但不可度量、不可传递,而且如爱因斯坦所述,直觉本身是无法描述的。


可见,人的智能和人工智能之间有一道鸿沟:人工智能的基础是人造的确切目标,依赖的是可度量、可描述、可传递的数据。但生物科学告诉我们,有一系列的人的生理感知是无法度量的,比如嗅觉、味觉、性欲,等等。在没有数据的领域,人工智能的界限清楚可见。


下面让我举一个简单的例子,嗅觉。酒是一个大产业,好的品酒师很贵。而且,可靠的品酒需要请一群品酒师。为什么?因为我们无法度量每个人的舌头对酒的感觉是什么。生物科学的原理告诉我们,嗅觉无法度量,即传感器做不出来。跟嗅觉的道理相似,气味也是无法度量的,也无法制造气味的传感器。此外,人的最基本欲望之一——性欲,在科学上,其程度也是不可度量的。所以,科学决定了人工智能或机器人只能是没有嗅觉、味觉,没有性欲的,也就是说,一定没有人的最基本的欲望和最基本的感觉。


除了上述的一部分直接的生理内容,还有大量的心理感觉,它们更复杂,而且都不能度量,比如喜爱、喜悦、厌烦、痛苦、抑郁、贪婪、野心,从好到坏,从有趣到无趣,等等。在生理和心理内容不能度量的情况下,机器人只能通过收集的数据,在某些方面模仿或推测人在一定场景下的偏好,这与人的真实偏好存在质的差别。


如上所述,在无法靠度量得到人类偏好的原始数据时,对人工智能的社会训练通常使用的方法是借助文字刻画某些方面的数据的内容,或者观察某个行为,比如把人们在各种情况下的行为录下来,然后用机器识别各种各样的人类行为。运用这样的方法,今天我们看到,在一些具体领域里,机器人呈现出令人吃惊的模仿和推测能力。但是这些“学习”来的模仿和推测是有局限的、静态的,学习的是过去。只要场景变化,这些模仿和推测都会失效。


总之,深度学习最终很难涉及人类智能的原始基本要素,因为人类大量的基本感知无法度量。而没有这些基本感知,机器就不可能通过学习产生和人相似的感觉。到目前为止,设计任何人工智能的机器设备或者机器人,第一重要的是它的目的是什么。由于上述原因,机器人的目的无法通过深度学习获得,而只能由设计它的人分配给它。这个目的在技术上被称为目标函数。


换言之,迄今为止机器人只能是由设计者为它设置有限范围的目标函数,而设置的目标函数必须定义很窄,而且限于短期和静态。经济学和社会科学告诉我们,人们在科学上无法确切描述人的普遍目标。因为人类无法确知面对不同事情不同场景时的目标变化。于是,人们无法为机器规定普遍的目标函数。同时,因为机器人没有人的基本感知。于是,人们也无法指导人工智能,通过学习产生与人相似的普遍的目标函数。总之,设计者分配给机器的目标函数不是人的普遍目标,也不能代替人的目标函数。人们可能会以为,人工智能或机器人可以读报纸,读杂志,读手机上的微信,并据此进行推测。但是,大数据和人工智能能够达到的水平是受到其依赖的科学原理限制的。哪怕是在一个完全自由、开放、安全的社会里,人类的文字表达和语言表达也只是人类复杂的方方面面感觉的一个部分。从文字、语言、图像的大数据里推断出来的内容,是片面的,有歧义的,依赖于特定场景的。


人工智能创始人、诺贝尔经济学奖得主西蒙当年提出了“有限理性”这个概念。这是至今影响经济学发展的最基本概念之一。“有限理性”承认人的认识和推理的片面性、不完备性,甚至自相矛盾。有限理性决定了机器人执行人分配给它的目标函数,不可能比自然人做得更好。


专业 专注 省心 放心