这是学习深度学习很好的资料。目前市面上大部分都是TensorFlow的版本,但是Pytorch正在成为学术界的主流,对初学者有帮助
这是学习深度学习很好的资料。目前市面上大部分都是TensorFlow的版本,但是Pytorch正在成为学术界的主流,对初学者有帮助
模型过拟合与欠拟合 首先我们需要区分训练误差和泛化误差。一般来讲,前者指模型在训练数据集上表现出的误差,后者指模型在任意一个测试数据样本上表现出的误差的期望,并常常通过测试数据集上的误差来近似。...
机器翻译及相关技术;注意力机制与Seq2Seq模型;Transformer 1.机器翻译及相关技术 2.注意力机制与Seq2Seq模型 3.Transformer 一 机器翻译及相关技术 机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用...
过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸;循环神经网络进阶 1、过拟合和欠拟合 过拟合:模型的训练误差远小于它在测试数据集上的误差,我们称该现象为过拟合 欠拟合:模型训练误差无法降低. ...
Task04 1.机器翻译及相关技术 机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与...
Task03 错题 一.过拟合、欠拟合及解决方法 二.梯度消失、梯度爆炸 可以理解为在夏季的物品推荐系统与冬季相比,时间或者说季节发生了变化,导致了夏季推荐圣诞礼物的不合理的现象,这个现象是由于协变量时间发生了...
一、深度学习中的一些常见问题及解决方案 (1)欠拟合 欠拟合即模型无法得到较低的训练误差,导致欠拟合的主要原因是模型复杂度不够,特征维度过少,导致拟合的函数无法满足训练集,误差较大。 (2)过拟合 过拟合即...
节选自“ElitesAI·动手学深度学习PyTorch版” Task03:过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸;循环神经网络进阶(1天) Task04:机器翻译及相关技术;注意力机制与Seq2seq模型;Transformer(1天) Task...
直到2012年,Alex等人提出的AlexNet网络在ImageNet大赛上以远超第二名的成绩夺冠,卷积神经网络乃至深度学习重新引起了广泛的关注。AlexNet首次证明了学习到的特征可以超越⼿⼯设计的特征,从而⼀举
因为前面那种写法过于累赘,所以改变写作策略,笔记是写给自己看的,所以把自己比较懂的都不写了,每段大概就两三句话让自己回头看的时候能知道这里讲的是什么,学习资料里简短的易懂的可能还会直接贴原文,这样可以...
这本书含有丰富的例子,代码是现成的,希望大家喜欢
pytroch1.1.0安装教程(动手学习深度学习) 自用 python==3.7 通过浏览器下载两个文件 https://download.pytorch.org/whl/cu90/torch-1.1.0-cp37-cp37m-win_amd64.whl ...download.pytorch.org/whl/torchtext/ ...
动手学深度学习最全最新 动手学深度学习讲解清晰 伯克利大学教程
Task05 1.卷积神经网络基础 用一个边缘检测的例子来说明卷积过程: 给定的filter在输入图像上进行平移,每移动到一个位置上就把filter和input重合位置上的两个像素值相乘,再把该位置上所有的乘积加和,得到一个新...
一、卷积神经网络基础 1.互相关运算 举例二维互相关运算如下: 输入是一个二维输入数组和一个二维核(kernel)数组,输出也是一个二维数组,其中核数组通常称为卷积核或过滤器(filter)。 卷积核的尺寸通常小于输入...
(需要一定时间逐步补充以下内容,暂且用做打卡) 1. 模型选择、过拟合和欠拟合 训练误差和泛化误差 模型选择 验证数据集 K折交叉验证 过拟合和欠拟合 模型复杂度 权重衰减 L2 范数正则化 高维线性回归实验 ...
本文的主要内容有:机器翻译及相关技术;注意力机制与Seq2seq模型;Transformer。 一、机器翻译及相关技术 机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译...
深度学习基础 * 2.1 线性回归 * 2.2 线性回归的从零开始实现 * 2.3 线性回归的简洁实现 * 2.4 softmax回归 * 2.5 图像分类数据集(Fashion-MNIST) * 2.6 softmax回归的从零开始实现 * 2.7 softmax回归的...
参考伯禹学习平台《动手学深度学习》课程内容内容撰写的学习笔记 原文链接:https://www.boyuai.com/elites/course/cZu18YmweLv10OeV/video/whY-8BhPmsle8wyEEyTST 感谢伯禹平台,Datawhale,和鲸,AWS给我们提供的...
批量归一化(深度模型):利用小批量上的均值和标准差,不断调整神经网络中间输出,从而使整个神经网络在各层的中间输出的数值更稳定。 对全连接层做批量归一化 位置:全连接层中的仿射变换和激活函数之间。 对卷...
卷积神经网络基础;leNet;卷积神经网络进阶卷积神经网络基础二位互相关运算二维卷积层互相关运算与卷积运算特征图与感受野填充和步幅填充:在输入的高宽两侧填充元素,通常填充0。步幅:卷积核在输入数组上每次滑动...
1.卷积神经网络基础 卷积其实就是将许多部分的信息进行压缩,在过大维度矩阵的情况下,因为存在过多的信息 第一是为运算上带来了很多麻烦 第二是类似拿着显微镜看一幅画,难以捕捉其整体的信息。...
1.机器翻译及相关技术 1.1数据预处理 读取数据,处理数据中的编码问题,并将无效的字符串删除 分词,分词的目的就是将字符串转换成单词组成的列表。目前有很多现成的分词工具可以直接使用,也可以直接按照空格进行...
过拟合和欠拟合 测试数据集不可以用来调整模型参数,如果使用测试数据集调整模型参数,可能在测试数据集上发生一定程度的过拟合,此时将不能用测试误差来近似泛化误差。 过拟合是指训练误差达到一个较低的水平,而...
动手学深度学习-mxnet源代码
本节课主要内容为机器翻译及相关技术、注意力机制与Seq2seq模型、Transformer 一、机器翻译及相关技术 机器翻译:将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译。...