Поиск…


замечания

Когда у вас есть огромная модель, полезно сформировать в вашем вычислительном графе некоторые группы тензоров, которые связаны друг с другом. Например, класс tf.GraphKeys содержит такие стандартные коллекции, как:

tf.GraphKeys.VARIABLES
tf.GraphKeys.TRAINABLE_VARIABLES
tf.GraphKeys.SUMMARIES

Создайте свою собственную коллекцию и используйте ее, чтобы собрать все свои потери.

Здесь мы создадим коллекцию для потерь вычислительного графика Neural Network.

Сначала создайте вычислительный граф следующим образом:

with tf.variable_scope("Layer"):
    W = tf.get_variable("weights", [m, k],
        initializer=tf.zeros_initializer([m, k], dtype=tf.float32))
    b1 = tf.get_variable("bias", [k],
        initializer = tf.zeros_initializer([k], dtype=tf.float32))
    z = tf.sigmoid((tf.matmul(input, W) + b1))
    
    with tf.variable_scope("Softmax"):
        U = tf.get_variable("weights", [k, r],
            initializer=tf.zeros_initializer([k,r], dtype=tf.float32))
        b2 = tf.get_variable("bias", [r],
            initializer=tf.zeros_initializer([r], dtype=tf.float32))
    out = tf.matmul(z, U) + b2
cross_entropy = tf.reduce_mean(
    tf.nn.sparse_softmax_cross_entropy_with_logits(out, labels))

Чтобы создать новую коллекцию, вы можете просто начать вызов tf.add_to_collection() - первый вызов создаст коллекцию.

tf.add_to_collection("my_losses", 
    self.config.l2 * (tf.add_n([tf.reduce_sum(U ** 2), tf.reduce_sum(W ** 2)])))
tf.add_to_collection("my_losses", cross_entropy)

И, наконец, вы можете получить тензоры из своей коллекции:

loss = sum(tf.get_collection("my_losses"))

Обратите внимание, что tf.get_collection() возвращает копию коллекции или пустой список, если коллекция не существует. Кроме того, он НЕ создает коллекцию, если она не существует. Для этого вы можете использовать tf.get_collection_ref() который возвращает ссылку на коллекцию и фактически создает пустую, если она еще не существует.

Сбор переменных из вложенных областей

Ниже представлен один скрытый слой Multilayer Perceptron (MLP), в котором используется вложенное определение переменных.

def weight_variable(shape):
    return tf.get_variable(name="weights", shape=shape,
                           initializer=tf.zeros_initializer(dtype=tf.float32))

def bias_variable(shape):
    return tf.get_variable(name="biases", shape=shape,
                           initializer=tf.zeros_initializer(dtype=tf.float32))

def fc_layer(input, in_dim, out_dim, layer_name):
    with tf.variable_scope(layer_name):
        W = weight_variable([in_dim, out_dim])
        b = bias_variable([out_dim])
        linear = tf.matmul(input, W) + b
        output = tf.sigmoid(linear)

with tf.variable_scope("MLP"):
    x = tf.placeholder(dtype=tf.float32, shape=[None, 1], name="x")
    y = tf.placeholder(dtype=tf.float32, shape=[None, 1], name="y")
    fc1 = fc_layer(x, 1, 8, "fc1")
    fc2 = fc_layer(fc1, 8, 1, "fc2")

mse_loss = tf.reduce_mean(tf.reduce_sum(tf.square(fc2 - y), axis=1))

MLP использует верхнее имя сферы уровня MLP и имеет два слоя с соответствующими именами области видимости fc1 и fc2 . Каждый слой также имеет свои собственные переменные weights и biases .

Переменные можно собирать так:

trainable_var_key = tf.GraphKeys.TRAINABLE_VARIABLES
all_vars = tf.get_collection(key=trainable_var_key, scope="MLP")
fc1_vars = tf.get_collection(key=trainable_var_key, scope="MLP/fc1")
fc2_vars = tf.get_collection(key=trainable_var_key, scope="MLP/fc2")
fc1_weight_vars = tf.get_collection(key=trainable_var_key, scope="MLP/fc1/weights")
fc1_bias_vars = tf.get_collection(key=trainable_var_key, scope="MLP/fc1/biases")

Значения переменных могут быть собраны с помощью команды sess.run() . Например, если мы хотели бы получить значения fc1_weight_vars после обучения, мы могли бы сделать следующее:

sess = tf.Session()
# add code to initialize variables
# add code to train the network
# add code to create test data x_test and y_test

fc1_weight_vals = sess.run(fc1, feed_dict={x: x_test, y: y_test})
print(fc1_weight_vals)  # This should be an ndarray with ndim=2 and shape=[1, 8]


Modified text is an extract of the original Stack Overflow Documentation
Лицензировано согласно CC BY-SA 3.0
Не связан с Stack Overflow