EfficientNet 宽度缩放如何影响模型的 FLOPS?

乘风 deep-learning 239

原文标题How EfficientNet width scaling affect the FLOPS of the model?

我正在重建 EfficientNet byTan 等人。 (2019)。还有一些我不理解的宽度比例因子。在论文中,他们试图最大化给定资源约束的模型准确性:
enter image description here

根据上面的公式,FLOPS 超过这个应该是 d.w.r^2。尽管如此,在下一节中:

enter image description here
所以 FLOPS 增加 (α.β^2.γ^2)^φ 等于 d.w^2.r^2
我说得对吗?

原文链接:https://stackoverflow.com//questions/71433150/how-efficientnet-width-scaling-affect-the-flops-of-the-model

回复

我来回复
  • Do Nam的头像
    Do Nam 评论

    一个卷积运算值得 V(input) x V(filter) FLOPs。所以用形状为 (Hx, Wx, Cx) 的图像和形状为 (Hf(i), Wf(i)) 的第 i 个滤波器。如果所有的滤波器宽度增加 w 然后 i == 1,FLOPs 超过 w。但是随后过滤器中的输入也增加了 w。例如。X(1) = (Hx, Wx, Cx.w)。所以从i == 2 到卷积结束时,输入通道的 FLOPs 实际上增加了 w,滤波器通道增加了 w,这导致等式中的 w^2。

    2年前 0条评论