LVSDRLVSDR08-22 01:57

解剖机器学习(Machine Learning)(科普版)

一、机器学习(ML)概述

2016年,机器学习(machine learning)成为流行词,那什么是ML呢?从算法的角度我暂时是算不出来的(我会请教我身边的智囊团的),因为这篇文稿的整理只为给中小学科普ML,让中小学能够明白机器是如何模拟他们自身的学习的即可。在科普前,我们就暂且高大上一把,把ML的概念呈献给大家,据说计算机是有能力进行学习的,而不是通过预先设定的准确的实现的代码。

这里咱们做个小解剖,从概念里可以做这样的理解:机器可以明白“0”和“1”是什么样子,再出现多个“0”或者类似“0”的实物,它不会将其认为“1”或者类似“1”的实物。因此,这就涉及到学习的概念,涉及两个内容:学习是什么?学习是怎样发生的?放在机器领域就是:机器的学习是什么?机器的学习是怎样发生的?又因为机器学习是模仿人类的学习的实质和机制,那么,ML的本质也依然是探究人的学习是什么,人的学习是怎样发生的,因此称其为人工智能的一个研究领域。

例1:

美国著名的教育心理学家桑代克做过许多动物学习的实验,并用以解释学习的实质与机制,提出了试误学说,这在机器学习的过程中一样适用。那么,我们可以这样理解机器学习的过程:

——2+3=?机器回答:10;——太大了;

——4+5=?机器回答:6:——太小了;

——2+7=?机器回答:9;——答对了

如此机器知道了2+7=9;那么再遇到其他的算式也是一样的,它会在试误中找到合适的答案!在一步步地调整自己学习的方式方法和路径的同时,优化计算的过程,保证尽可能少出错,当它能够完全一次性算出4+5=9;6+5=11等的时候,这时候它的模型拟合就是成功的,可以被投入使用了。

ML就是这样发生的。这也就是百度百科关于ML的定义的一个实例:机器学习(machine learning)是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

例2:

水果的种类繁多,苹果就有红富士,嘎啦,红玉,金冠等十多种知名的品种,但是,ML更多的是在适应并解决我们学习和生活中需要面对的问题,如何更好的解决。一般呢,我们只需要知道苹果是啥就可以!那么实际上呢,苹果有颜色,富士基本为红色,这时候机器呢就开始学习红色这一个特征;苹果是有圆形的,那么它就学习了圆形这样一个特征;苹果还是有皮、有瓤、有籽的,它依然一一学习了这些特征……这时候机器要认识什么是苹果,它得把这学到的所有特征给整合,也就是我们说的模型拟合了!拟合成功了之后,再给机器一大堆水果(数据)的时候,它就可以识别出苹果是什么了。

但是,存在这样的问题,如果从一开始就界定苹果是红颜色的,那么,再给一个青苹果的时候,机器会默认这不是苹果,那么这就是过拟合,也就是这个模型的构建关注到了本不是苹果最主要的特征,导致学习有误,也就是机器学习时关注到了噪点,影响了学习的结果和反馈!这时候就需要机器做及时的完善,将红色这一个特征,学习成苹果是有颜色的即可,这就更为接近了该有的分类。

另外,也会存在这样的情况,如果构建的模型,只认为苹果特征是圆的,有皮有瓤的,那么给机器一个桃子(圆的,有皮,有瓤),它也会认为这就是苹果!这时候就是机器对苹果特征的学习还不够,这就是欠拟合的结果和反馈了。因此,机器就还需要更多的学习来认识苹果这个事物,也就是机器需要不断的完善和组织自己的知识结构。当得以完善之后,再给于数量多、种类多的一堆水果的时候,机器就会很轻松的区分出苹果和其他水果。

二、机器学习的分类

参照已有的内容和智囊团的介绍,机器学习(ML)可以这样分类:监督学习和无监督学习。先来看看定义:

监督学习:计算机获得简单的输入给出期望的输出,过程是通过一个“训练模型”,学习通用的准则来从输入映射到输出。

无监督学习:没有给出标记用来学习算法,让它自己去发现输入的结构。无监督学习自己可以被当成一个目标或者一个实现结果的途径。

什么意思呢?大家要明确的是:监督学习和无监督学习都属于ML,因此上述的学习过程都是适用的,但是以下的区别还是需要大家明确:

? 有无“老师”监督

顾名思义,监督学习是有老师的学习,也就是老师告诉我:遇到了“子曰”“之乎者也”或者“唐诗宋词”等,都将其归置到古文中,因为符合已有的关于古文的标记,那么我看到了“不在沉默中爆发,就在沉默中灭亡”“教育即生活”等语词,我肯定会将其归置在古文之外。机器也是一样的,告诉他古文是咋样的,再来一篇文章,它也是可以区分出来的。

无监督的学习就是没有老师告诉我关于内容的标记。举个我们最常见得到的例子,书桌凌乱无比,我们准备进行整理,这时候书桌上的所有的东西就是数据,那么我们是怎么分类放置的,我们会取某几件将其归为一类,比如放进笔筒内的笔,放在书架上的书,摆在案边的本子等,这时候我们会发现因为每个人的个性特征不一样,我们的关于分类的摆放是不一样的,因此,当下次将各样文具购置回家之后,我们会按照自己的偏好将笔、书或者本子放在已分好类的位置处。那么,机器的学习也是一样的,比如购物的推荐就是这样的,因为每次我们在访问浏览器,进行检索的时候机器都在进行每个人的个人特征爱好的学习,可谓是检索过的内容,机器都知道。这时候,当你检索的时候,会自动为你提供个人的偏好选择。

由于增强学习(另一个类别)还在探索中,因此,姑且科普到这块,上述内容若有不合理的地方,请大家及时提出奥。

——致谢我的师父团——

官场书屋二维码

000
评论