首页 > 高级卫生专业技术资格> 其他卫生技术类（高级）

网友您好，请在下方输入框内输入要搜索的题目：

请输入或粘贴题目内容搜题

搜题

拍照、语音搜题，请扫码进入小程序

题目内容（请给出正确答案）

[多选题]

假设在一个深度学习网络中批处理梯度下降花费了太多的时间来找到一个值的参数值，该值对于成本函数J(W[1],b[1],…,W[L],b[L])来说是很小的值。以下哪些方法可以帮助找到J值较小的参数值()

A.尝试使用Adam算法

B.尝试对权重进行更好的随机初始化

C.尝试调整学习率α

D.尝试mini-batch梯度下降

答案

查看答案

发布时间：2022-06-28

更多“假设在一个深度学习网络中批处理梯度下降花费了太多的时间来找到一个值的参数值，该值对于成”相关的问题

第1题

下面模型训练的一些常用技巧中，哪些说法是错误的（)？

A.如果训练样本量较大，可选用随机梯度下降(SGD)，它考虑历史梯度信息，更容易跳出局部极小值点

B.在高度非凸的深度网络优化过程，主要难点是鞍点

C.用无监督数据作分层预训练(Layer-wisePre-train)有助于解决梯度饱和问题

D.Sigmoid交叉熵损失函数适合于多标签学习，每一维彼此独立

点击查看答案

第2题

ResNet中引入shortcut的功能包括以下哪些（)？

A.减少了计算量

B.ResNet的梯度通过shortcut回到更早的层，缓解了网络因为深度增大导致的梯度消失

C.引入残差模块，简化了学习

D.改善了网络的特征获取能力

点击查看答案

第3题

对于卷积神经网络而言，减少梯度消失不适合采用以下哪些方法（)？

A.增大学习率

B.减少网络深度(隐层个数)

C.skipconnection

D.减少通道数

点击查看答案

第4题

关于深度学习模型训练，以下哪个说法是错误的（)？

A.网中网(NIN)结构用全连接的多层感知机去代替传统的卷积，提升了模型的计算性能，但计算量显著增加

B.网络层数越多，学习率可设置偏大，否则容易引起梯度消失

C.VGG只要很少的迭代次数就会收敛，这是因为小的过滤尺寸起到了隐式的正则化的作用

D.Bagging中每个训练集互不相关，而Boosting中训练集要在上一轮的结果上进行调整，所以不能并行计算

点击查看答案

第5题

深度学习是目前比较火热的人工智能技术，但是在做深度学习任务时常常会遇到各种各样的问题,以下会在深度学习任务中出现的问题有（)

A.梯度消失问题

B.过拟合问题

C.数据不平衡问题

D.梯度爆炸问题

点击查看答案

第6题

反向传播算法是深度学习神经网络中重要的算法，关于其算法步骤正确的是（)。

A.先反向传播计算出误差，再正向传播计算梯度

B.只有反向传播计算梯度

C.只有反向传播计算输出结果

D.先正向传播计算出误差，再反向传播计算梯度

点击查看答案

第7题

如果深度学习神经网络出现了梯度消失或梯度爆炸问题我们常用的解决方法为（)。

A.正则化

B.梯度剪切

C.随机欠采样

D.使用Relu激活函数

点击查看答案

第8题

下列哪一项在神经网络中引入了非线性（)

A.随机梯度下降

B.修正线性单元(ReLU)

C.卷积函数

D.以上都不正确

点击查看答案

第9题

从病例讨论中高效学习的方法不包括（)

A.深度思考有助于提出一个好问题，更有助于发现知识缺陷

B.结构化思维促进构建知识的关联，形成成体系的知识架构

C.从不同的视角认识分析病例的变化，有助于构建临床药学思维

D.专注于学习本专业临床常见用药，剔除非本专业的用药，以提高专注度

点击查看答案

第10题

Mllib中线性会馆算法中的参数numIterations表示（)。

A.要运行的迭代次数

B.梯度下降的步长

C.是否给数据加干扰特征或者偏差特征

D.Lasso和ridge的正规化参数

点击查看答案

第11题

Mllib中线性会馆算法中的参数intercept表示（)。

A.要运行的迭代次数

B.梯度下降的步长

C.是否给数据加干扰特征或者偏差特征

D.Lasso和ridge的正规化参数

点击查看答案

账号：尚未登录

登录没有账号？去注册

购买搜题卡

TOP