机器学习概述

  1. 三者区别
  2. 名词解释

机器学习中这三种数据集合非常容易弄混,特别是验证集和测试集。

训练集
这个是最好理解的,用来训练模型内参数的数据集,Classfier直接根据训练集来调整自身获得更好的分类效果

验证集
用于在训练过程中检验模型的状态,收敛情况。验证集通常用于调整超参数,根据几组模型验证集上的表现决定哪组超参数拥有最好的性能。

同时验证集在训练过程中还可以用来监控模型是否发生过拟合,一般来说验证集表现稳定后,若继续训练,训练集表现还会继续上升,但是验证集会出现不升反降的情况,这样一般就发生了过拟合。所以验证集也用来判断何时停止训练

测试集
测试集用来评价模型泛化能力,即之前模型使用验证集确定了超参数,使用训练集调整了参数,最后使用一个从没有见过的数据集来判断这个模型是否Work。

三者区别

  • 训练集就像是课本,学生据课本里的内容来掌握知识
  • 验证集就像是作业,通过作业可以知道 不同学生学习情况、进步的速度快慢
  • 测试集就像是考试,考的题是平常都没有见过,考察学生举一反三的能力

名词解释

  • 卷积和多项式相乘(conv)
  • 卷积网络(convnet)
  • 训练循环(epoch)
  • 密集层(dense)
  • 张量(tensor)
    张量是现代机器学习的基础。它的核心是一个数据容器多数情况下,它包含数字,有时候它也包含字符串,但这种情况比较少。因此把它想象成一个数字的水桶。
    0维张量/标量 ,装在张量/容器水桶中的每个数字称为“标量”。标量是一个数字。你会问为什么不干脆叫它们一个数字呢?我不知道,也许数学家只是喜欢听起来酷?标量听起来确实比数字酷。

转载请注明来源。 欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。 可以在下面评论区评论,也可以邮件至 sharlot2050@foxmail.com。

文章标题:机器学习概述

字数:557

本文作者:夏来风

发布时间:2021-01-24, 22:27:01

原始链接:http://www.demo1024.com/blog/ai-ml/

版权声明: "署名-非商用-相同方式共享 4.0" 转载请保留原文链接及作者。