Ricerca…


Creazione di un LSTM bidirezionale

import tensorflow as tf

dims, layers = 32, 2
# Creating the forward and backwards cells
lstm_fw_cell = tf.nn.rnn_cell.BasicLSTMCell(dims, forget_bias=1.0)
lstm_bw_cell = tf.nn.rnn_cell.BasicLSTMCell(dims, forget_bias=1.0)
# Pass lstm_fw_cell / lstm_bw_cell directly to tf.nn.bidrectional_rnn
# if only a single layer is needed
lstm_fw_multicell = tf.nn.rnn_cell.MultiRNNCell([lstm_fw_cell]*layers)
lstm_bw_multicell = tf.nn.rnn_cell.MultiRNNCell([lstm_bw_cell]*layers)

# tf.nn.bidirectional_rnn takes a list of tensors with shape 
# [batch_size x cell_fw.state_size], so separate the input into discrete
# timesteps.
_X = tf.unpack(state_below, axis=1)
# state_fw and state_bw are the final states of the forwards/backwards LSTM, respectively
outputs, state_fw, state_bw = tf.nn.bidirectional_rnn(lstm_fw_multicell, lstm_bw_multicell, _X, dtype='float32')

parametri

  • state_below è un tensore 3D con le seguenti dimensioni: [ batch_size , maximum sequence index, dims ]. Questo deriva da un'operazione precedente, come la ricerca di una parola incorporata.
  • dims è il numero di unità nascoste.
  • layers possono essere regolati sopra 1 per creare una rete LSTM sovrapposta .

Gli appunti

  • tf.unpack potrebbe non essere in grado di determinare la dimensione di un dato asse (usare l'argomento nums se questo è il caso).
  • Potrebbe essere utile aggiungere un peso aggiuntivo + moltiplicazione di bias al di sotto dell'LSTM (ad es. tf.matmul(state_below, U) + b .


Modified text is an extract of the original Stack Overflow Documentation
Autorizzato sotto CC BY-SA 3.0
Non affiliato con Stack Overflow