银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版



    咨询(xún)热线(xiàn):021-80392549

    银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版 QQ在线 银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版 企业(yè)微信
    银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版
    银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版 资讯 > AI挖(wā)掘技术 > 正文(wén)

    常(cháng)见(jiàn)的机器学习算法

    2020/06/01天极(jí)网3641

    常见的机器学习算法(fǎ)

    诞生于1956年的人工智(zhì)能,由于受(shòu)到智(zhì)能算法、计算(suàn)速度、存储水平等(děng)因素的影响,在六十多年的发展过(guò)程中经(jīng)历了多次高潮和低谷。最近几年,得益于(yú)数据(jù)量(liàng)的上涨、运算力的(de)提升(shēng),特别是机器学习新算法(fǎ)的出现(xiàn),人工智能迎来了大(dà)爆(bào)发的时代。

    常(cháng)见的(de)机(jī)器(qì)学习(xí)算法

    提到机器(qì)学习这个词时,有些人(rén)首先想到的(de)可能是科幻电影(yǐng)里的(de)机器人。事实(shí)上,机器(qì)学习是一门多领(lǐng)域交叉学科,涉及概率论、统计学、算(suàn)法复杂度(dù)理论等多(duō)门学科。专门研究计算机如何模拟或实现人类(lèi)的学习行为,利用数据或以往的经验,以(yǐ)此(cǐ)优化(huà)计算机程序(xù)的性能(néng)标准(zhǔn)。

    根据(jù)学习任务(wù)的不同,我们可以(yǐ)将机器学习分为监督学习、非监督学习、强化学习三种类型,而每种类型(xíng)又对应着一些算(suàn)法。

    各种算法以及对应的任务类型

    接下(xià)来(lái)就简单介绍几种常用的机器学习算(suàn)法及其(qí)应用场(chǎng)景,通过本篇文章大家可以对机器(qì)学习的常用算法(fǎ)有个常识(shí)性的认识。

    一、监督学(xué)习(xí)

    (1)支持向量(liàng)机(Support Vector Machine,SVM):是一(yī)类按监督学习方式对(duì)数(shù)据进行二元分类的(de)广义线(xiàn)性分类(lèi)器,其决策边界是对学习样本求解的最大(dà)边(biān)距(jù)超平面(miàn)。例如,在纸上有两类线性可分的(de)点,支持向量(liàng)机会寻(xún)找一条直线将这两(liǎng)类点区分开来,并且与这些点的距离都尽可(kě)能远(yuǎn)。

    常见的机器学(xué)习算(suàn)法(fǎ)

    优点(diǎn):泛(fàn)化错误率低(dī),结果易解(jiě)释。

    缺点:对(duì)大(dà)规模训练(liàn)样本难(nán)以实施,解决多分(fèn)类问题存在(zài)困(kùn)难,对参数调(diào)节和核(hé)函数的(de)选择敏感。

    应用(yòng)场景:文本分类、人像识别、医学(xué)诊断等。

    (2)决策树(Decision Tree):是一(yī)个预测模型,代表的是对象属性与(yǔ)对象值(zhí)之间的一(yī)种映射关系。下图是如何在决策树中(zhōng)建模的(de)简单(dān)示例:

    常见的机器学习算(suàn)法(fǎ)

    优点(diǎn):易于理(lǐ)解和(hé)解(jiě)释,可以可视化分析,容易(yì)提取出规则;能(néng)够处理不相关的特征。

    缺点:对缺失数据处理比较(jiào)困难。

    应用场景(jǐng):在(zài)决策过程应用较(jiào)多。

    (3)朴素贝(bèi)叶斯分类(lèi)(Naive Bayesian classification):对于给(gěi)出的待分类项,求(qiú)解(jiě)此项出(chū)现(xiàn)的(de)条件下各(gè)个类别出(chū)现的概率,哪个最大,就认为(wéi)此待分(fèn)类(lèi)属于哪个类别(bié)。贝叶(yè)斯公(gōng)式为:p(A|B)= p(B|A)*p(A/p(B),其(qí)中P(A|B)表示后(hòu)验概率,P(B|A)是似然值(zhí),P(A)是(shì)类别的先验概率,P(B)代表(biǎo)预测器的先验(yàn)概率。

    优点:在数(shù)据较少的情况下仍(réng)然有效,可以(yǐ)处理多类别问题。

    缺点:对(duì)输入数据的准(zhǔn)备(bèi)方式较为(wéi)敏感。

    应用场景:文本(běn)分类、人脸(liǎn)识别、欺(qī)诈(zhà)检测。

    (4)k-近邻算(suàn)法(K-Nearest Neighbor,KNN):是一种基(jī)于实(shí)例(lì)的学习,采用测量(liàng)不同特征值(zhí)之间的距离方法进行分类。其基本(běn)思路是:给定一个训(xùn)练样本(běn)集,然后(hòu)输入(rù)没有标(biāo)签的(de)新数据,将新数(shù)据(jù)的每个特征与(yǔ)样本集中数(shù)据对应的(de)特征(zhēng)进(jìn)行比较,找(zhǎo)到最邻近的k个(通常(cháng)是(shì)不大于20的整数)实(shí)例,这k个(gè)实例的多数属于某个类,就把该输入实例分类到(dào)这个类(lèi)中。

    优点:简单、易于理解(jiě)、易于实现(xiàn),无需估计参(cān)数。此外,与朴(pǔ)素贝叶斯之类(lèi)的算法比,无数据输入假定、准确度高、对异(yì)常数据值不敏感。

    缺点:对于训(xùn)练数据依赖程度比较(jiào)大,并且缺少(shǎo)训练阶(jiē)段(duàn),无法应(yīng)对多(duō)样(yàng)本。

    应用(yòng)场景:字符识别、文本分(fèn)类、图像识(shí)别等领域(yù)。

    二(èr)、非监督(dū)学习

    (1)主(zhǔ)成分分(fèn)析(Principal Component Analysis,PCA):是一种统计(jì)方法。其主(zhǔ)要思想是将(jiāng)n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在(zài)原有n维特征的基础上重新构造出来的k维(wéi)特征。

    常见(jiàn)的(de)机器学习(xí)算法

    优点:降低数据(jù)的复杂性,识(shí)别最重要的(de)多个特征(zhēng)。

    缺点:主成分各个特征维度的含义具有(yǒu)一(yī)定的模糊性,不(bú)如(rú)原(yuán)始(shǐ)样本特征的(de)解释性(xìng)强;有可(kě)能(néng)损失有用的信息。

    应用场景:语音、图像、通信(xìn)的分析处理。

    (2)奇异值分解(Singular Value Decomposition,SVD):可以将一(yī)个比较复杂(zá)的矩阵用(yòng)更小更简单(dān)的几个(gè)子矩阵的(de)相(xiàng)乘(chéng)来表(biǎo)示,这些小矩阵描述(shù)的是矩阵的重要的特性。

    优(yōu)点:简化数据,去除噪声(shēng)点,提高算法的(de)结果。

    缺点:数据的(de)转换可能(néng)难以理解。

    应用场景:推荐系(xì)统、图(tú)片压缩等。

    (3)K-均值聚类(K-Means):是一种迭代求解的聚类分析算(suàn)法,采用距离作为相似性指标(biāo)。其工作流程是随机(jī)确(què)定K个(gè)对象作为初始的(de)聚类(lèi)中心,然(rán)后计(jì)算每个对象与各个种子聚类(lèi)中心之间(jiān)的距(jù)离(lí),把每个对象分配给距(jù)离它最(zuì)近的(de)聚类中心。

    常见的机器学(xué)习算(suàn)法

    优点(diǎn):算法(fǎ)简单容(róng)易(yì)实(shí)现。

    缺点:可(kě)能收敛(liǎn)到(dào)局部(bù)最小值,在(zài)大规模数据集(jí)上(shàng)收敛较慢(màn)。

    应用(yòng)场景:图像处理、数据(jù)分析以及市场研究(jiū)等。

    三、强(qiáng)化学习

    Q-learning:是一个基于值的强(qiáng)化(huà)学习算法,它根据动作值函数评估应该选(xuǎn)择哪(nǎ)个动作,这个函数(shù)决(jué)定了处于某一个特定状态(tài)以(yǐ)及在该状态下采取特定动作的奖励期望值。

    优点:可以接收更广的数据范围。

    缺点:缺(quē)乏(fá)通(tōng)用(yòng)性。

    应用场景:游戏(xì)开发。

    以上就(jiù)是(shì)文章的全(quán)部内容(róng),相信大(dà)家对常用的机(jī)器学习算法应该(gāi)有了(le)大致的了解(jiě)。

    现如今,我们越来越多地看到机器(qì)学习算法为人类带来的实际价值(zhí),如(rú)它们(men)提供(gòng)了关键的(de)洞(dòng)察力(lì)和信息来报(bào)告战略(luè)决(jué)策(cè)。可(kě)以(yǐ)肯定的是,随着(zhe)机器学习越来越流行,未来还将出现越来越多能(néng)很好(hǎo)地处理(lǐ)任务的算法。

    关键词: AI挖掘技术




    AI人工智能网声明:

    凡资讯来源(yuán)注(zhù)明(míng)为其他媒体来源的信息,均为转载自其他媒体,并不代表本网站赞(zàn)同(tóng)其观点,也不(bú)代表本网站对其真实(shí)性(xìng)负责。您(nín)若对该(gāi)文章内容有任何疑问或质疑(yí),请立即与网(wǎng)站(www.chaoyang.maanshan.liaocheng.jixi.ww38.viennacitytours.com)联系,本(běn)网站将迅速给(gěi)您回应并做处理。


    联系电话:021-31666777   新闻、技术文章投稿QQ:3267146135   投稿邮箱:syy@gongboshi.com

    工(gōng)博士人(rén)工智(zhì)能网
    银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版
    扫描二维码关(guān)注(zhù)微(wēi)信
    扫(sǎo)码反馈

    扫一扫,反馈当前页面

    咨询(xún)反馈
    扫码关注

    微信公众号

    返回(huí)顶部(bù)

    银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版

    银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版