1.介绍

在本教程中,我们将了解生成和鉴别的机器学习算法。金宝搏官网188be

首先,我们将学习生成和判别算法的定义。然后,我们将比较和对比算法来了解他们的优势和缺点。

2.生成算法

此类型的算法尝试模拟“如何填充数据集”。采样模型给出生成的合成数据点。

我们估计概率分布。正式地,生成模型估计有条件概率p(x | y = y)对于给定的目标y。例如,朴素贝叶斯算法模型p(x,y)然后将概率转换为条件概率p(y | x)通过应用贝叶斯规则。

一些流行的生成算法是:

  • 天真的贝父分类器
  • 生成的对抗网络
  • 高斯混合模型
  • 隐藏的马尔可夫模型
  • 概率无论免费语法

3.鉴别算法

鉴别算法专注于建模直接解决方案。例如,Logistic回归算法模拟决策边界。然后,它决定了基于它相对于决策边界的观察结果的结果。

鉴别算法估计后验概率。与生成算法不同,它们不会模拟潜在的概率分布。正式,我们模拟了目标的条件概率yp(y | x = x)鉴于观察X

一些流行的歧视性算法是:

  • k - 最近邻居(K-NN)
  • 物流回归
  • 支持矢量机器(SVMS)
  • 决策树
  • 随机森林
  • 人工神经网络(ANNS)

4.生成与歧视模型

让我们假设我们的任务是确定文本文档的语言。我们如何在机器学习的帮助下解决这项任务?

我们可以学习每种语言,然后确定语言。这就是生成模型的工作原理。

或者,我们可以在没有实际学习语言的情况下学习语言差异和语言的常见模式。这是歧视的方法。在这种情况下,我们不会说任何语言。

换句话说,歧视性算法侧重于如何区分案例。因此,他们专注于学习决策边界。另一方面,生成算法学习数据的基本属性以及如何从划痕生成它:

生成方法侧重于建模,而歧视性方法侧重于解决方案。因此,我们可以使用生成算法来生成新的数据点。判别算法不提供该目的。

仍然,鉴别性算法通常对分类任务进行更好的表现。那是因为他们专注于直接解决实际问题而不是首先解决更一般的问题。

然而,生成算法的真正强度在于它们在变量之间表达复杂关系的能力。换句话说,他们有解释力。结果,它们在NLP和医学中具有成功用例。

另一方面,判别算法感觉像黑匣子,没有能够以简单的方式表达他们的决策边界。变量之间的关系没有明确可解释。因此,我们无法轻易显示它。

此外,生成模式非常适合解决无监督的学习任务,以及监督学习任务,因为它们具有预测能力。判别模型需要标记的数据集,不能从上下文中推断。因此,生成模型在异常检测和监测区域中具有更全面的应用。

此外,生成算法与识别性算法快速收敛。因此,当我们有一个小型训练数据集时,我们更喜欢生成模型。

尽管生成型号会聚得更快,但它们会收敛到更高的渐近误差。相反,判别模型会聚到较小的渐近误差。因此,随着训练示例的数量增加,判别模型的错误率降低。

总结,生成和歧视性算法具有自己的优势和缺点:

QuickLatex.com呈现

结论

在本文中,我们已经了解了两种机器学习方法。金宝搏官网188be

生成模型涉及建模,而歧视模型直接关注找到解决方案。

生成型号具有解释性,更优雅。然而,鉴别性方法通常表现得更好。

像往常一样,我们需要根据手头的问题决定使用的算法。

来宾
0.注释
内联反馈
查看所有评论