EfficientNet 宽度缩放如何影响模型的 FLOPS？

乘风 2年前 deep-learning 239

原文标题 ：How EfficientNet width scaling affect the FLOPS of the model?

我正在重建 EfficientNet byTan 等人。（2019）。还有一些我不理解的宽度比例因子。在论文中，他们试图最大化给定资源约束的模型准确性：
enter image description here

根据上面的公式，FLOPS 超过这个应该是 d.w.r^2。尽管如此，在下一节中：

enter image description here
所以 FLOPS 增加 (α.β^2.γ^2)^φ 等于 d.w^2.r^2
我说得对吗？

我来回复

Do Nam 评论

一个卷积运算值得 V(input) x V(filter) FLOPs。所以用形状为 (Hx, Wx, Cx) 的图像和形状为 (Hf(i), Wf(i)) 的第 i 个滤波器。如果所有的滤波器宽度增加 w 然后 i == 1，FLOPs 超过 w。但是随后过滤器中的输入也增加了 w。例如。X(1) = (Hx, Wx, Cx.w)。所以从i == 2 到卷积结束时，输入通道的 FLOPs 实际上增加了 w，滤波器通道增加了 w，这导致等式中的 w^2。

2年前 0条评论