当前位置: 首页 > news >正文

新注册网站初学者毕业设计做网站

新注册网站,初学者毕业设计做网站,济南建设工程有限公司,全网源码免费下残差连接和层规范化 层规范化和批量规范化的目标相同,但层规范化是基于特征维度进行规范化。尽管批量规范化在计算机视觉中被广泛应用,但在自然语言处理任务中(输入通常是变长序列)批量规范化通常不如层规范化的效果好。 以下代…

残差连接和层规范化

层规范化和批量规范化的目标相同,但层规范化是基于特征维度进行规范化。尽管批量规范化在计算机视觉中被广泛应用,但在自然语言处理任务中(输入通常是变长序列)批量规范化通常不如层规范化的效果好。

以下代码对比不同维度的层规范化和批量规范化的效果。

ln = nn.LayerNorm(2)
bn = nn.BatchNorm1d(2)
X = torch.tensor([[1, 2], [2, 3]], dtype=torch.float32)
# 在训练模式下计算X的均值和方差
print('layer norm:', ln(X), '\nbatch norm:', bn(X))
layer norm: tensor([[-1.0000,  1.0000],[-1.0000,  1.0000]], grad_fn=<NativeLayerNormBackward0>)
batch norm: tensor([[-1.0000, -1.0000],[ 1.0000,  1.0000]], grad_fn=<NativeBatchNormBackward0>)

现在可以使用残差连接和层规范化来实现AddNorm类。暂退法也被作为正则化方法使用。

#@save
class AddNorm(nn.Module):"""残差连接后进行层规范化"""def __init__(self, normalized_shape, dropout, **kwargs):super(AddNorm, self).__init__(**kwargs)self.dropout = nn.Dropout(dropout)self.ln = nn.LayerNorm(normalized_shape)def forward(self, X, Y):return self.ln(self.dropout(Y) + X)

残差连接要求两个输入的形状相同,以便加法操作后输出张量的形状相同。 

add_norm = AddNorm([3, 4], 0.5)
add_norm.eval()
add_norm(torch.ones((2, 3, 4)), torch.ones((2, 3, 4))).shape

 torch.Size([2, 3, 4])

 

 

 

http://www.laogonggong.com/news/78798.html

相关文章:

  • 怎样可以快速增加网站的反链成品在线网站免费入口
  • 建设阅读网站的目的长春找工作哪个网站好
  • 集团网站建设招标中级经济师考试公告
  • 网站推广的方案设计怎么写用vs2005做网站 怎样搭配色彩
  • 家具公司网站模板下载找人做网站会给源代码吗
  • qq网页版登录官网登录入口网站云计算运维工程师
  • 网站建设项目报告总结报告网站开发需要考什么证
  • 旅游产业网站app建设的市场分析宁波网站搜索优化
  • 余干县建设局网站漳州网站建设公司首选
  • 那些网站做的非常好看室内设计联盟邀请码
  • 中山市建设局安全监督站网站wordpress柚子皮5.31
  • e福州app官方网站建设论坛网站大全
  • 小生意是做网站还是公众号合肥缶间网络科技有限公司
  • 网站开发asp软件有哪些wordpress自己添加menu
  • 响应式网站建设如何六安人社局网站
  • .net 网站自动登录南京网络营销培训
  • 门户网站模板 图片公众号运营策划
  • 南昌哪家网站开发公司好搭建一个网站
  • 建设部注册网站google下载安卓版下载
  • 外贸网站建站j做网站开发需要培训吗
  • html5酷炫网站python编程软件哪个好
  • 学做网站的学校四川智能网站建设制作
  • 苏州市做网站女生学建筑选择什么专业
  • 广东建立网站做网站需要钱吗
  • 建设工程质量监理协会网站什么网站可以找免费模板
  • 在dw上做网站首页导航栏网页设计个人介绍
  • 网站办公室网站建设公司推荐金石下拉网络
  • php直播网站开发360提交网站入口
  • 哈尔滨php网站开发公司专业的网站制作设计
  • 网站宣传方法有哪些做搜狗网站优