Tensorflow keras，使用MSE时没有梯度错误

扎眼的阳光 2年前 tensorflow 199

原文标题 ：Tensorflow keras, no gradients error when use MSE

我正在尝试 tensorflow“从头开始编写训练循环”中的代码，并自己进行了一些更改。我将损失函数从 SparseCategoricalCrossentropy 更改为 MeanSquaredError。我还通过添加新的 Lambda 层来进行损失计算来更改模型的架构。但是，我有没有为变量提供渐变的值错误。有什么方法可以使代码与 MSE 一起运行？

import numpy as np
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

inputs = keras.Input(shape=(784,), name="digits")
x1 = layers.Dense(64, activation="relu")(inputs)
x2 = layers.Dense(64, activation="relu")(x1)
outputs = layers.Dense(10, name="predictions")(x2)
final_outputs = layers.Lambda(lambda x: tf.math.argmax(x, axis = -1))(outputs)
model = keras.Model(inputs=inputs, outputs=final_outputs)

# Instantiate an optimizer.
optimizer = keras.optimizers.SGD(learning_rate=1e-3)
# Instantiate a loss function.
loss_fn = keras.losses.MeanSquaredError()

# Prepare the training dataset.
batch_size = 64
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()
x_train = np.reshape(x_train, (-1, 784))
x_test = np.reshape(x_test, (-1, 784))

# Reserve 10,000 samples for validation.
x_val = x_train[-10000:]
y_val = y_train[-10000:]
x_train = x_train[:-10000]
y_train = y_train[:-10000]

# Prepare the training dataset.
train_dataset = tf.data.Dataset.from_tensor_slices((x_train, y_train))
train_dataset = train_dataset.shuffle(buffer_size=1024).batch(batch_size)

# Prepare the validation dataset.
val_dataset = tf.data.Dataset.from_tensor_slices((x_val, y_val))
val_dataset = val_dataset.batch(batch_size)


epochs = 2
for epoch in range(epochs):
    print("\nStart of epoch %d" % (epoch,))

    for step, (x_batch_train, y_batch_train) in enumerate(train_dataset):
        with tf.GradientTape() as tape:
            logits = model(x_batch_train, training=True)

            loss_value = loss_fn(y_batch_train, logits)

        grads = tape.gradient(loss_value, model.trainable_weights)

        optimizer.apply_gradients(zip(grads, model.trainable_weights))

原文链接：https://stackoverflow.com//questions/71906950/tensorflow-keras-no-gradients-error-when-use-mse

我来回复

bui 评论
argmaxops 不可微。要使用整数标签和 MSE 损失，您需要将标签y_train和y_val转换为整数。
```
y_train = np.argmax(y_train, axis=-1)
y_val = np.argmax(y_val, axis=-1)
```
并调整输出层输出整数标签
```
outputs = layers.Dense(1, name="predictions")(x2)
```
2年前 0条评论

Tensorflow keras，使用MSE时没有梯度错误

回复

相关问题