- 莫烦机器学习教程
- 有趣的机器学习
- 机器学习 (Machine Learning)
- 神经网络 (Neural Network)
- 卷积神经网络 CNN (Convolutional Neural Network)
- 循环神经网络 RNN (Recurrent Neural Network)
- LSTM RNN 循环神经网络 (LSTM)
- 自编码 (Autoencoder)
- 检验神经网络 (Evaluation)
- 特征标准化 (Feature Normalization)
- 选择好特征 (Good Features)
- 激励函数 (Activation Function)
- 过拟合 (Overfitting)
- 加速神经网络训练 (Speed Up Training)
- 处理不均衡数据 (Imbalanced data)
- 批标准化 (Batch Normalization)
- L1 / L2 正规化 (Regularization)
- 强化学习 (Reinforcement Learning)
- 强化学习方法汇总 (Reinforcement Learning)
- Q Leaning
- Sarsa
- Sarsa(lambda)
- DQN
- Policy Gradients
- Actor Critic
- Deep Deterministic Policy Gradient (DDPG)
- Asynchronous Advantage Actor-Critic (A3C)
- 强化学习教程
- Why?
- 课程要求
- 小例子
- Q-learning 算法更新
- Q-learning 思维决策
- Sarsa 算法更新
- Sarsa 思维决策
- Sarsa-lambda
- DQN 算法更新 (Tensorflow)
- DQN 神经网络 (Tensorflow)
- DQN 思维决策 (Tensorflow)
- OpenAI gym 环境库 (Tensorflow)
- Double DQN (Tensorflow)
- Prioritized Experience Replay (DQN) (Tensorflow)
- Dueling DQN (Tensorflow)
- Policy Gradients 算法更新 (Tensorflow)
- Policy Gradients 思维决策 (Tensorflow)
- Actor Critic (Tensorflow)
- Deep Deterministic Policy Gradient (DDPG) (Tensorflow)
- Asynchronous Advantage Actor-Critic (A3C) (Tensorflow)
- TensorFlow 教程
- 为什么选 Tensorflow
- 安装
- 神经网络在干嘛
- 处理结构
- 例子 2
- Session 会话控制
- Variable 变量
- Placeholder 传入值
- 激励函数 Activation Function
- 例子 3 添加层 def add_layer()
- 例子 3 建造神经网络
- 例子 3 结果可视化
- 优化器 optimizer
- Tensorboard 可视化好帮手 1
- Tensorboard 可视化好帮手 2
- Classification 分类学习
- Dropout 解决 overfitting
- CNN 卷积神经网络 1
- CNN 卷积神经网络 2
- CNN 卷积神经网络 3
- Saver 保存读取
- RNN 循环神经网络
- RNN LSTM 循环神经网络 (分类例子)
- RNN LSTM (回归例子)
- RNN LSTM (回归例子可视化)
- 自编码 Autoencoder (非监督学习)
- scope 命名方法
- Batch Normalization 批标准化
- PyTorch 教程
- Why?
- 安装
- Torch 或 Numpy
- 变量 (Variable)
- 激励函数 (Activation)
- 关系拟合 (回归)
- 区分类型 (分类)
- 快速搭建法
- 保存提取
- 批训练
- Optimizer 优化器
- CNN 卷积神经网络
- RNN 循环神经网络 (分类)
- RNN 循环神经网络 (回归)
- AutoEncoder (自编码/非监督学习)
- DQN 强化学习
- GAN (Generative Adversarial Nets 生成对抗网络)
- 为什么 Torch 是动态的
- GPU 加速运算
- Dropout 缓解过拟合
- Batch Normalization 批标准化
- Theano 教程
- Why?
- 安装
- 神经网络在做什么
- 基本用法
- Function 用法
- Shared 变量
- Activation function 激励函数
- 定义 Layer 类
- Regression 回归例子
- 可视化结果 回归例子
- Classification 分类学习
- Regularization 正规化
- Save 保存 提取
- 总结和更多
- Keras 教程
- Why?
- 安装
- 兼容 backend
- Regressor 回归
- Classifier 分类
- CNN 卷积神经网络
- RNN Classifier 循环神经网络
- RNN Regressor 循环神经网络
- Autoencoder 自编码
- Save & reload 保存提取
- Scikit learn 教程
- Why?
- 安装
- 选择学习方法
- 通用学习模式
- sklearn 强大数据库
- sklearn 常用属性与功能
- 正规化 Normalization
- 交叉验证 1 Cross-validation
- 交叉验证 2 Cross-validation
- 交叉验证 3 Cross-validation
- 保存模型
检验神经网络 (Evaluation)
作者: Morvan 编辑: Morvan
- 学习资料:
今天我们会来聊聊在做好了属于自己的神经网络之后,应该如何来评价自己的神经网络,从评价当中如何改进我们的神经网络. 其实评价神经网络的方法,和评价其他机器学习的方法大同小异. 我们首先说说为什么要评价,检验学习到的神经网络。
注: 本文不会涉及数学推导. 大家可以在很多其他地方找到优秀的数学推导文章。
在神经网络的训练当中,神经网络可能会因为各种各样的问题,出现学习的效率不高,或者是因为干扰太多,学到最后并没有很好的学到规律 . 而这其中的原因可能是多方面的,可能是数据问题,学习效率 等参数问题。
Training/Test data
为了检验,评价神经网络,避免和改善这些问题,我们通常会把收集到的数据分为训练数据 和 测试数据,一般用于训练的数据可以是所有数据的 70%, 剩下的 30%可以拿来测试学习结果.如果你想问为什么要分开成两批,那就想想我们读书时的日子,考试题和作业题大部分都是不一样的吧. 这也是同一个道理。
误差曲线
接着,对于神经网络的评价基本上是基于这 30%的测试数据. 想想期末考试虽然花的时间少,但是占得总成绩肯定要比你平时作业的分多吧. 所以说这 30%虽然少,但是很重要. 然后,我们就可以开始画图啦! 评价机器学习可以从误差这个值开始,随着训练时间的变长,优秀的神经网络能预测到更为精准的答案,预测误差也会越少 . 到最后能够提升的空间变小,曲线也趋于水平 . 班上的差生,从不及格到 80 分已经不容易啦,再往上冲刺 100 分,就变成了更难的事了. 机器学习也一样. 所以,如果你的机器学习的误差曲线是这样一条曲线,那就已经是很不错的学习成果啦。
准确度曲线
同样,除了误差曲线,我们可以看他的精确度曲线. 最好的精度是趋向于 100%精确. 比如在神经网络的分类问题中, 100 个样本中,我有 90 张样本分类正确,那就是说我的预测精确度是 90%. 不过,不知道大家有没有想过对于回归的问题呢? 怎样看预测值是连续数字的精确度? 这时,我们可以引用 R2 分数在测量回归问题的精度 . R2 给出的最大精度也是 100%, 所以分类和回归就都有的统一的精度标准. 除了这些评分标准,我们还有很多其他的标准,比如 F1 分数 , 用于测量不均衡数据的精度. 由于时间有限,我们会在今后的视频中继续详细讲解。
正规化
有时候,意外是猝不及防的,比如有时候我们明明每一道作业习题都会做,可是考试分数为什么总是比作业分数低许多? 原来,我们只复习了作业题,并没有深入,拓展研究作业反映出来的知识. 这件事情发生在机器学习中,我们就叫做过拟合. 我们在回到误差曲线,不过这时我们也把训练误差画出来. 红色的是训练误差,黑色的是测试误差. 训练时的误差比测试的误差小,神经网络虽然学习到了知识,但是对于平时作业太过依赖,到了考试的时候,却不能随机应变,没有成功的把作业的知识扩展开来. 在机器学习中,解决过拟合也有很多方法 , 比如 l1, l2 正规化, dropout 方法。
交叉验证
神经网络也有很多参数,我们怎么确定哪样的参数能够更有效的解决现有的问题呢? 这时,交叉验证 就是最好的途径了. 交叉验证不仅仅可以用于神经网络的调参,还能用于其他机器学习方法的调参. 同样是选择你想观看的误差值或者是精确度,不过横坐标不再是学习时间,而是你要测试的某一参数 (比如说神经网络层数) . 我们逐渐增加神经层,然后对于每一个不同层结构的神经网络求出最终的误差或精度,画在图中. 我们知道,神经层越多,计算机所需要消耗的时间和资源就越多,所以我们只需要找到那个能满足误差要求,有节约资源的层结构. 比如说误差在 0.005 一下都能接受 , 那我们就可以采用 30 层的神经网络结构 .
如果你觉得这篇文章或视频对你的学习很有帮助,请你也分享它,让它能再次帮助到更多的需要学习的人。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论