深度学习笔记

置顶

查看更多

机器学习笔记

置顶

查看更多

目标检测

目标检测是计算机视觉领域中一个新兴的应用方向,其任务是对输入图像进行分类的同时,检测图像中是否包含某些目标,并对他们准确定位并标识。

吴恩达 “项目检测” 课后作业


目标定位

定位分类问题不仅要求判断出图片中物体的种类,还要在图片中标记出它的具体位置,用边框(Bounding Box,或者称包围盒)把物体圈起来。一般来说,定位分类问题通常只有一个较大的对象位于图片中间位置;而在目标检测问题中,图片可以含有多个对象,甚至单张图片中会有多个不同分类的对象。

查看更多

CNN经典网络详解

LeNet-5

网络特点:

  • LeNet-5 针对灰度图像而训练,因此输入图片的通道数为 1。
  • 该模型总共包含了约 6 万个参数,远少于标准神经网络所需。
  • 典型的 LeNet-5 结构包含卷积层(CONV layer),池化层(POOL layer)和全连接层(FC layer),排列顺序一般为 CONV layer->POOL layer->CONV layer->POOL layer->FC layer->FC layer->OUTPUT layer。一个或多个卷积层后面跟着一个池化层的模式至今仍十分常用。
  • 当 LeNet-5模型被提出时,其池化层使用的是平均池化,而且各层激活函数一般选用 Sigmoid 和 tanh。现在,我们可以根据需要,做出改进,使用最大池化并选用 ReLU 作为激活函数。

查看更多

卷积操作详解(填充、步长、高维卷积、卷积公式)

对图像(不同的数据窗口数据)和滤波矩阵(一组固定的权重:因为每个神经元的多个权重固定,所以又可以看做一个恒定的滤波器filter)做内积(逐个元素相乘再求和)的操作就是所谓的『卷积』操作,也是卷积神经网络的名字来源。


填充

假设输入图片的大小为 n×n,而滤波器的大小为 f×f,则卷积后的输出图片大小为 (n−f+1)×(n−f+1)

这样就有两个问题:

  • 每次卷积运算后,输出图片的尺寸缩小
  • 原始图片的角落、边缘区像素点在输出中采用较少,输出图片丢失边缘位置的很多信息

为了解决这些问题,可以在进行卷积操作前,对原始图片在边界上进行填充(Padding),以增加矩阵的大小。通常将 0 作为填充值。

查看更多

吴恩达2017深度学习课后作业笔记

链接地址


课后作业目录

1_神经网络与深度学习
…………Week1 深度学习概论
……………………选择题
…………Week2 神经网络基础

查看更多

卷积网络的边缘检测

神经网络由浅层到深层,分别可以检测出图片的边缘特征、局部特征(例如眼睛、鼻子等),到后面的一层就可以根据前面检测的特征来识别整体面部轮廓。这些工作都是依托卷积神经网络来实现的。

卷积运算(Convolutional Operation)是卷积神经网络最基本的组成部分。我们以边缘检测为例,来解释卷积是怎样运算的。


边缘检测

图片最常做的边缘检测有两类:垂直边缘(Vertical Edges)检测和水平边缘(Horizontal Edges)检测。

Different-edges

查看更多

机器学习开发策略

吴大大结构化机器学习项目总结,完善中…

ML策略

假设你构建了一个喵咪分类器,训练之后准确率达到90%,但在测试集上还不够好。此时你可以想到的优化方法有哪些呢?总结后大致如下:

  • 收集更多的数据
  • 收集更多的多样化训练集,比如不同姿势的猫咪图片等
  • 用梯度下降法训练更长时间
  • 尝试Adam算法
  • 尝试更大的网路
  • 尝试小一点的网络
  • 尝试dropout随机失活算法
  • 加上L2正则项
  • 改善网络结构,如变更激活函数,变更隐藏层节点数量

优化的方法虽然很多,但如果方向错误,可能白费几个月时间。
那通过哪些策略可以减少错误发生的几率呢?怎么判断哪些方法可以尝试,哪些方法可以丢弃呢?

查看更多

机器学习(九):数据清洗和特征选择

持续更新中。。。

机器学习(八):隐马尔科夫模型

持续更新中。。。