人工智能从何而来

2024-09-06

苹果公司在北京时间6月11日凌晨1点召开了2024年的全球开发者大会(WWDC),会上最大的亮点无疑是 Apple Intelligence 的推出。苹果公司在年初传出将暂停投入了10年之久的自动驾驶电动汽车的开发,而将精力转向人工智能领域,随着2024年 WWDC 的结束,这一传言终于得到证实。至此,全球头部科技公司均已涉足这一领域。

当大家都在讨论人工智能的时候,有一个问题似乎很少有人关注,即:人工智能从何而来?

人工智能的历史源远流长。在古代的神话传说中,技艺高超的工匠可以制作人造人,并为其赋予意识和想法。现代意义上的人工智能始于古典哲学家试图将人类的思维过程描述为对符号的机械操作。20世纪40年代,基于抽象数学推理的可编程电脑的发明使科学家开始严肃地探讨构造一个“智能”大脑的可能性。

但这个想法其实相当抽象。“智能”是主观的。比如一朵花随着太阳升起而绽放,我们会说它“智能”吗?答案可能因人而异。孩子可能会说“是”,植物很聪明,而成年人可能会说“不是”,这只是一种反应。越来越多的生物学家和神经学家大概会说“可能”,因为据研究植物能够表现出交流、学习、解决问题甚至记忆的能力。

1956年夏,麦卡锡、明斯基等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,首次提出“人工智能(Artificial Intelligence,简称AI)”这一概念,标志着人工智能学科的诞生。

当时,让机器变得智能的想法似乎在短短几年内就可以完全实现。艾伦·图灵的同名测试最初名为模仿游戏,于1950年制定。现在的图灵测试时长通常为5分钟,如果电脑能回答由人类测试者提出的一系列问题,且超过30%的回答让测试者认为是人类所答,则电脑通过图灵测试。1981年,美国哲学家约翰·塞尔开发了一个名为“中文房间”的思想实验,揭示了图灵测试的缺陷——如果房间外的人不知道人/机器如何得出答案,那么答案是对是错都无关紧要,因为这其中没有原创思想,因此便不存在“智能”。

然而,将智能定义为原创思维很快就会衍生出另一个问题。人们一直都有想法,但这些想法受到先前经验的强烈影响,那么这些想法是原创的吗?如果你深入研究,就会发现任何想法的基础都必须建立在坚实的、已知的东西之上。这不太可能完全原创。

用原创思维来定义“智能”意味着人工智能的概念可能从一开始就是有缺陷的。

1THE FIRST PART

解构人工智能

在20世纪70年代和80年代,人工智能系统的许多应用场景在很多方面与今天的应用相似。其中包括自动驾驶汽车和聊天机器人,但它建立在一段主要关注人工智能物理方面的研究基础上,使机械物体以某种程度的智能去运行。

随后行业的研究进入低谷。但90年代互联网的出现无疑激发了人们对自然语言处理的兴趣。一系列初创企业的涌现一度让人觉得一个新时代已经开始。同时它鼓励了新处理算法的开发,而廉价、功能强大的计算机的出现则推动了这一算法的发展。现在,人工智能已经成为一种服务。

一旦我们开始讨论提供服务,范围就会缩小。事实上,这种人工智能通常被称为狭义人工智能,因为它专注于一项特定任务。我们可以将其比作图灵测试或塞尔的中文房间。相比之下,通用人工智能是一种不需要知道任务是什么的系统,它会使用“智能”来解决问题并得出答案。目前,我们在服务行业使用专家系统来加速和自动化决策。这种人工智能深藏在数据中心里,具有极大的可扩展性。

相比之下,在小型设备的边缘部署人工智能仍是一个新兴领域。我们开始讨论芯片上的神经网络、嵌入在图像传感器中的机器学习、在微控制器上运行的推理引擎以及边缘处理。

人工智能通常被称为机器学习的超集,而机器学习本身又是深度学习的超集。从这个层面来看,技术与生物学之间的界限开始变得模糊。

2THE SECOND PART

人工智能词汇

人工智能理论界使用了许多术语,其中一些已经渗透到现实世界。其中一个比较知名的术语是“神经网络”,越来越多的半导体公司正在开发和销售嵌入某种神经网络的集成电路。

神经元是一种可以通过电信号刺激的细胞。由于细胞在生物学中以这种方式工作,因此它们在微电路中被模仿也就不足为奇了。当这些细胞中的几个相互连接时,它们就变成了一个电路,当许多这样的电路相互连接时,它们就变成了一个网络。生物神经元分为感觉神经元、运动神经元和中间神经元,后者为神经电路提供了基础。

在人工神经网络领域,有几种方法变得流行起来。最受欢迎的可能是卷积神经网络(Convolutional Neural Network, CNN),它可以以不同的效率水平映射到传统的微处理器架构。另一种是脉冲神经网络(Spiking Neural Network, SNN),它通常采用一种全新的处理架构,更接近于模拟生物世界。

如果我们认为 CNN 是“传统”方法,那么许多公司现在正在开发能够更高效地执行 CNN 的新型处理器也就不足为奇了。这些 NPU(神经处理单元)可以与其他传统架构(如 DSP 和 MCU)集成。其吸引力显而易见,因为它将神经网络以最小的干扰引入设计流程。

SNN 可以说是一种更具革命性的方法。加权在神经网络中被广泛使用。这可以比作手里拿着两个物体,试图判断哪一个重量最轻。你可能会放弃那个物体,选择“更重”的物体,然后将它与一个新物体进行比较。这个迭代过程很像冒泡排序程序,最终将根据选择标准返回结果,例如哪个物体重量最重。SNN 将时间元素引入其推理中,这就是为什么它们被视为更接近生物世界的原因,也可能是它们更难在微电路中实现的原因。

3THE THIRD PART

学会学习

人工智能的学习方式也在不断发展。一般来说,神经网络有三种学习方式:监督式、半监督式和无监督式。简单来说,它们之间的区别在于数据的呈现方式。如果所有数据都带有标签,则通常属于监督式学习系统;如果部分数据带有标签,则属于半监督式学习系统;如果所有数据均未带有标签,则属于无监督式学习系统。

强化学习通常被视为一种单独的方法,因为它使用奖励和惩罚的概念来改变行为,而不是简单地使用行为的正确或错误结果。

软件中广泛使用的流控制技术之一“If...Then”语句很好地映射到 AI 中使用的另一项技术:推理引擎。我们都根据过去的经验进行推断,这些经验可以是我们自己的行为,也可以是后天习得的行为。例如,我们小时候可能会被热水烫伤一两次,但我们很快就学会了不这样做。我们可以推断出所有的热水都会烫伤我们。但我们也可以从教过的课程而不是经验中推断。例如,我们不需要从树上掉下来才知道这可能会导致脚踝骨折。

机器使用推理引擎来实现 AI,而这些引擎通常需要使用大量资源进行训练。这种能够生成可使用更少资源部署的推理模型的能力是将 AI 置于物联网最前沿的举措背后的原因。

这些设备各有特色,也具有共同的特征。例如,物联网中的端点可能会具有某种形式的无线接口。例如,这可能是蓝牙、Wi-Fi 或 Zigbee。虽然一个端点可能是智能锁,另一个端点可能是智能恒温器,但它们可能都使用相同的无线接口,因此可以从共享开发该接口所需的工作中受益。

现在,人工智能模型也是如此。迁移学习将经过训练的模型中不同应用程序所共有的部分提取出来,并允许它们共享。这意味着,通过在智能恒温器中使用部分知识,可以最大程度地减少训练智能锁所需的工作量(时间、计算资源、数据集)。迁移学习与修剪相结合(精简模型以提供其需要关注的结果),意味着人工智能现在可以适应嵌入式处理器甚至微控制器。随着人工智能深入物联网,这将变得极为重要。

或许从我们的祖先时代就已经有了模糊的“人工智能”的概念,因为人类对于任何事物效率的提高一直有着无止境的追求。“人工智能从何而来?”似乎是一个非常抽象的问题,但这个问题重点并不是去解答这个问题,而是引发思考——“人工智能最终会去向何处?”

文章推荐

相关推荐