人工智能基础名词理解
人工智能(Artificial Intelligence, AI)
人工智能是一个比较广泛的概念,这个概念实际上指的是让机器像人一样思考,其最早由计算机科学之父阿兰图灵在1950年的一篇《计算机器与智能》论文中写出“如果电脑能在5分钟能回答由人类测试者提出的一系列的问题,且超过30%回答让测试者误认为人类所答,则电脑通过测试”,这段话也直接启蒙式的开启了人工智能领域的研究。 而“人工智能”一词,第一次出现在1956年,达特茅斯大学召开的学术会议室,由人工智能之父约翰·麦卡锡首次提出。 通常人工智能被分为弱人工智能和强人工智能,前者可以让机器有一定程度的学习、理解和推理能力,后者则是由自适应能力,比如解决一些之前没有遇见过的问题,我们常在电影里看见的机器人就是一种强人工智能。
机器学习(Machine Learning, ML)
机器学习为人工智能的一个子领域,也可以理解为弱人工智能的一种实现,而机器学习做的事情是让机器取模拟和实现人类的学习行为,以获得新的技能和知识。 人工智能领域的先驱Arthur Samuel在1959年给出的机器学习定义为“不直接编程,却能赋予计算机提供能力的方法”,而美国工程院院士Tom Mitchell则给出了一个更明确的含义,指出“机器学习是通过某项人物的经验数据提高了在该人物上的能力”。
机器学习关注的是通过从数据中学习,并得到能够作出预测或决策的算法/模型(机器训练的产物),这里的特点是机器通过数据进行学习,而不是通过硬编码。
而如今机器学习已在多个领域得到了很好的应用,大致上可以将机器学习的分为几个研究方向:
- 模式识别
- 自然语言处理
- 数据挖掘
- 计算机视觉
- 语言识别
- 统计学习
算法/模型
机器学习中,算法和模型(两者意思一样)实际上指的是一个东西,这是因为在训练前需要根据自己需求找到一个合适的算法,这个算法此时是通用的、未做调整和以及初始化的一个工具,而通过训练,即数据驱动下的优化(数据的学习)、参数的调整后,这个算法则具备了特定任务执行的能力,常见的算法比如回归算法、SVM向量机、聚类算法、降维算法、决策树、朴素贝叶斯等。
而根据这些算法可以分为监督学习、无监督学习、半监督学习、强化学习,其中监督学习在日语中被称为“有老师的学习”,本质上是让机器学习带有“标准答案”的数据,然后再让机器学习做题,根据做题的结果对比标准答案,根据误差进行调整,经过多次反复,让机器的误差越来越小。 像上面这样在带有标签(答案)的数据上学习的过程被称为“训练”,而训练用到的数据被称为“训练集”,但也被叫做“数据集”,因为该数据集是被拿来训练的,所以被称为训练集,同样训练集在自然语言处理中被称为“语料库”,在训练集里面每一个数据被称为“样本”,在训练过程中反复针对误差作出的调整则被称为“调参”。
而训练出来的结果则为称为“模型”,模型其实也是算法,但为了区分,所以将机器学习的结果称为模型。模型可以用来针对训练集相似类型的问题去得到一个结论(值),这个过程则被称为"预测" 。
上述的步骤实际上就是针对一个算法,然后通过数据驱动的优化、不断的调整参数,具备了特定任务的执行能力后,而得到的一个模型,这个模型可以去执行特定的任务,比如识别这个是不是“猫”。
无监督学习在日语中被称为“没有老师的学习”,这就意味着数据不含标准答案,其作用是通过数据本身的结构或分布中来进行学习,典型的就是聚类,比如你给一只狗的照片和一只鸟的照片,虽然不能识别出这是鸟或狗,但无监督学习相关算法能做到这两张照片不是一类数据。
无监督学习算法并不是完整不需要数据驱动的优化,而是不依赖于有明确答案的数据指导,但仍然可以从数据中学习和调整参数来实现目标。
半监督学习是利用多个模型对同一个数据进行预测,如果这些结果多数一致,则可以将这个数据和结果放在一起作为新的训练集,由于半监督学习可以利用标注数据来丰富未标注数据,所以目前正是热门的研究。
之所以半监督学习这样热门是因为带有“标准答案”的数据集几乎都是由人工整理和标注,需要大量的人力、成本、时间,也被叫为“黄金数据(Gold Data)”,所以半监督学习则可以用少量的标注数据集来得到更多的标注数据集来减少其人工、成本、时间。
强化学习则是针对的是需要一系列彼此关联决策的问题,比如自动驾驶、电子竞技等,这类问题往往需要一边预测,一边跟着环境的反馈规划下一次决策。
人工神经网络(Artificial Neural Networks, ANN)
人工神经网络在1943年提出,人工神经网络通过模仿人脑的神经系统以及连接方式,所以人工神经网络更是一个框架或者计算模型,而人脑最基本单元的神经元在神经网络中被称为感知器(1958年),而通过很多的感知器进行组合,模仿组合成人脑的神经网络。
这里需要注意的是感知器实际上算法模型,但是是一个简单的线性分类器,但是无数个线性分类器就可以解决很复杂的任务。
深度学习(Deep Learning, DL)
深度学习是机器学习的一个子领域,主要包含了使用多层神经网络(DNN)类似的结构的机器学习方法,深度学习包含深度神经网络(DNN)、卷积神经网络(CNN)、递归神经网络(RNN)等。