3. 浅谈人工智能重要概念 (2):机器学习, 以及其中的几个学习方法,和神经网络


这期节目中,叶老师和橙子深入探讨了人工智能的基本概念,特别是机器学习、GPT和神经网络。他们首先解释了节目的名字,这是一种双关语:“AI”是汉字“爱”的拼音,反映了他们对教育和学习的热爱。两位主持人讨论了机器学习,描述它是一种数据驱动的方法,计算机通过经验学习而无需明确编程。 她们强调机器学习是人工智能的一个子集,突出其在识别模式和基于数据进行预测中的作用。他们概述了机器学习的五个子领域:监督学习、无监督学习、半监督学习、强化学习和深度学习。
主持人讨论了深度学习和强化学习在自动驾驶汽车中的应用。深度学习有助于感知任务,如物体识别和障碍物检测,而强化学习优化决策和控制。
他们还提到了ChatGPT作为深度学习的一个例子,训练大量文本数据以理解和生成自然语言。讨论包括多层神经网络的解释,这些网络受人脑启发,通过互联层处理信息以解决复杂问题。
节目最后邀请听众反馈,并预告了下一期关于人工智能伦理的话题,什么是“好的”人工智能。



  • 叶老师,橙子Author for 4edu.ai
  • 14/11/2024
  • Education, AI
  • Podcast

第一季,第三集

主持人 叶老师 (Y):大家好,我是叶老师。 很高兴和大家有缘再次相聚叶老师AI教育, 爱教育这档节目。

主持人 橙子 (C): 大家好,我是橙子。非常欢迎大家继续收听我们的节目!哎, 对了,头两期节目播出后有朋友问我们节目的名字是怎么来的。

Y: 这个名字有一点点双关的意味吧:大家看,人工智能也就是所谓的AI是不是汉字爱的拼音?我们做这个节目的初衷是因为我们爱教育, 爱学习。我们看到AI给人类的发展带来的翻天覆地的影响。所以我们希望通过这档节目讲AI,和大家一起学习,一起进步。 在这一集中我们和大家继续聊聊另外几个有关人工智能的重要概念:Machine learning 机器学习;GPT和深度学习中的神经网络 (Multilayered Perceptron, 简称MLP)。

C: 好的,这几个概念是我们了解人工智能原理和发展的基础。让我们先从机器学习这个概念说起吧。我们一般情况下说的机器学习主要是是数据驱动,让计算机从经验中学习,而不需要完成某个任务而专门写一段程序。这里讲的经验其实就是数据了。它的核心思想是让算法找到数据中的模式或规律,并利用这些规律对未来进行预测,做出决定。

Y: 记得我们说过人工智能是人类希望达到的一个科学技术上的追求,一个目标。同时它也是一系列相关技术的总称。那么机器学习就是这诸多技术的一种。也就说机器学习不等于 AI, 也不大于AI。

C: 正是。应该说是机器学习是人工智能的一部分。机器学习的本质是通过大量的数据让机器自动学习模式 (pattern),这与传统的编程不同。程序员不需要手动指定规则,而是机器依靠算法从数据中提取规则。这就叫做自动化学习。无论是人工智能图像识别、语音识别还是推荐系统,所有这些技术背后的核心是数学模型和算法,它们从数据中提取特征并进行预测,这就是我们说的 算法驱动。随着时间推移,机器学习系统能够不断通过更多的数据和训练来提升性能。它们在特定任务上比人类做得更好,也就是持续优化。比如在图像识别和推荐领域 。

Y: 我听过什么监督学习,无监督学习,强化学习什么的,这些和机器学习是什么关系?

C:这些都是机器学习的子领域。机器学习主要有五个子领域:监督学习,无监督学习,半监督学习,强化学习 和深度学习。

Y: 你能简要的解释吗?

C: 监督学习(Supervised Learning):在这种方法中,模型在带有标签的数据上进行训练。也就是说,每个输入数据都有一个对应的正确输出。模型通过学习这些输入输出对未来进行预测。我举个例子,比如垃圾邮件的识别。你先把电子邮箱里的垃圾邮件都标注出来,然后让机器扫描你的邮箱。这就是告诉它,你认为什么是垃圾邮件。机器它自己就会总结出规律,哦,凡是发件人是这个人的都是垃圾邮件;或是标题这么写的都是垃圾邮件。这样它就学会了为你的邮件进行分类。
无监督学习(Unsupervised Learning):这种方法不需要带有标签的数据。模型尝试在数据中找到隐藏的模式或结构。,像是把一堆不同种类的水果分成苹果、香蕉和橙子。这在商业领域应用广泛,比如说亚马逊可以自动根据客户的购买行为,将客户分成不同的群体,以便进行个性化营销,那将大大提升效率。

Y:那么半监督学习(Semi-Supervised Learning) 是介于监督学习和无监督学习之间?

C: 是的。 这种方法结合了监督学习和无监督学习,使用少量带标签的数据和大量未带标签的数据进行训练。这样可以在减少标注成本的同时,仍然获得较好的模型性能。比如说:给文本分类,使用少量标注的新闻和大量未标注的文章,训练模型自动给文章分类,如体育、政治、娱乐等。还有图像识别:使用少量标注的图像和大量未标注的图像,训练模型识别图像中的物体。

Y:那么强化学习呢?

C: 强化学习(Reinforcement Learning):在这种方法中,模型通过与环境的交互来学习。它通过试错法获得正向与反乡的反馈(是一种奖罚体制),并根据这些反馈调整自己的策略。例如,像AlphaGo学习围棋,通过不断尝试和失败,逐步学会最佳策略。或者是机器人导航:训练机器人在复杂环境中找到最佳路径,通过试错法获得反馈, 以便优化路径选择。

Y: 你能稍微解释一下这个奖励或惩罚的反馈如何实施呢?

C: 就是类似打分机制:对了加分,错了扣分。然后根据分数高低来做选择。

Y: 这最后一种,深度学习,你觉得是不是比较值得我们具体介绍一下?

C: 好。深度学习(Deep Learning):这是机器学习的一个子领域,使用多层神经网络来处理复杂的数据和任务。深度学习在图像识别、语音识别和自然语言处理等领域表现出色


Y: 那橙子啊,我个人总是把强化学习和深度学习混淆起来。能请你给个具体的例子来解释一下两者的区别和应用吗?

C: 好的,让我来用无人驾驶车辆来具体解释一下。无人驾驶车辆的核心技术实际上结合了多种机器学习方法,其中深度学习和强化学习是非常重要的组成部分,但它们在不同的场景下发挥不同的作用。 深度学习在感知任务中表现非常出色,如物体识别、障碍物检测、车道线检测等。无人驾驶车辆通常使用深度神经网络来处理摄像头、激光雷达(LiDAR)、雷达和超声波传感器等获取数据。这些数据输入深度学习模型后,车辆可以识别行人、其他车辆、交通信号灯、道路标志等,进而对环境进行精确的感知。这里面具体还涉及到卷积神经网络,循环神经网络, 生成对抗网络等技术。

Y: 也就说深度学习获取人类司机感官部分所收集的信息,比如说视觉与听觉。那用强化学习实现哪些任务?

C: 强化学习更常用于无人驾驶车辆的决策控制部分。无人驾驶车辆不仅需要感知周围环境,还需要根据感知结果作出相应的决策,例如如何避障、如何调整速度、选择最佳路径等。强化学习可以帮助无人驾驶汽车来学习如何在复杂的交通场景下做出最优的决策。这是一种非常经典的强化学习用途。还有一种架构就是2者结合,叫深度强化学习(Deep Reinforcement Learning, DRL):是结合了深度学习和强化学习的混合技术。实际上,深度学习和强化学习往往是相辅相成的。深度学习可以帮助强化学习更好地表示复杂的状态空间,尤其是处理来自传感器的大量数据。而强化学习则可以利用深度学习的感知结果,在动态环境中做出更加智能的决策。

Y: 简单来说,无人驾驶车辆通常会使用深度学习来处理感知任务,而使用强化学习来优化驾驶决策和控制。因此,深度学习和强化学习在无人驾驶系统中都有广泛的应用,并在各自的领域中发挥关键作用。那么现在最火的人工智能技术,也就2022年11月份再次把人工智能带火的ChatGPT到底是哪一种方式的机器学习?

C: ChatGPT就是深度学习一个最好的例子:那之前提到: 深度学习(Deep Learning)使用多层神经网络来处理复杂的数据和任务。深度学习在图像识别、语音识别和自然语言处理等领域表现出色。具体来说,它使用大量的未标注文本数据进行预训练,学习语言的基本结构和语法。这使得模型能够理解和生成自然语言。然后在特定任务的数据上进行微调,例如回答,翻译或是文本生成。这一步使得模型在特定任务上表现更好。

Y: 你刚刚在讲深度学习概念时提到了多层神经网络。我很好奇这多层神经网络是怎么工作的。我相信很多我们的听众也很好奇。能不能描述一下?这个多层神经网络真的和人的大脑神经网络一样吗?

C: 多层神经网络是受人的脑神经网络启发而来的,但是远远比不上人脑的复杂。我们知道人的脑神经有很多的神经元节点,这些神经元相互传递信息。当神经元试图一遍又一遍地解决问题时,它会加强导致成功的连接,并削弱导致失败的连接。计算机的神经网络就用程序模拟了这个思路。有一个专业名词叫传感器。今年的诺贝尔物理奖的获奖人辛顿Geoffrey Hinton曾经写过一本书,就叫《传感器》。我们简单形象地说哈,一个传感器就相当于一个接受输入信号的神经元,很多的传感器在一起就像织了一张网,组成了一个网络。如果有几个这样的网络叠加在一起,就是多层神经网络。

Y:这些网络是怎么工作的? 

C:如果传感器不但有输入信号,而且有输出信号,那么它就可以把输出传递到下一层神经网络的传感器。输出信号可以理解为一个判断,一个结论,或是决策,再拿到下一层神经网络,再通过权衡第一层的结果,再做出判断或决策。这样就可以解决更为复杂和抽象的问题。大致的原理是这样的。

Y:我大概懂了。不知道收听我们节目的听众们还有什么疑问,或补充。也欢迎大家对我们批评指正。我们在节目的文本中给大家提供了来自IBM的对机器学习的解释。是英文版的。 其实IBM是人工智能的元老之一。他们的网站上有很多干货。也有中文版的网页。大家感兴趣的话,可以去看看。 今天我们就聊到这里。我们对什么是人工智能,它大概是怎么“智能”起来的应该有了一个大致的了解。下一期节目我们准备人工智能伦理的话题: 什么是“好的“人工智能。

C: 那最后简要得给大家汇报一下最近观察到的2个AI技术热点:1个是OpenAI开放了搜索功能,可以搜索网页了。又一个搜索引擎的有力竞争者出现啦。他们承诺很快会对免费的用户也开放。第二个让我注意到的是Google的NotebookLM。这个AI工具真是读书写作的好助手。你可以抛给它几篇Google文档,或是网页,甚至是音频或视频让它学习,然后叫它总结中心思想,写读后感,内容摘要等,很好用。不光如此它还有一个新功能,就是根据提供的资源,能自动生产一段播客的双人对话音频,我试了一下,语音对话非常自然流畅,可太好玩啦,如果大家有兴趣,我们可以拿一点时间来重点介绍一下。现阶段只能产生英文的音频。好啦,今天先到这里,大家下次节目见。

Source: 视频 | IBM

名人名言

AI is not about making machines replace humans; it's about making machines work together with humans to achieve better outcomes  - John Macarthy
“人工智能不是让机器取代人类,而是让机器与人类合作,实现更好的结果。”