Flux.jl/src/backend/tensorflow/model.jl

type Model
  model::Any
  session::Session
  params::Dict{Flux.Param,Tensor}
  inputs::Vector{Tensor}
  output::Any
  gradients::Vector{Tensor}
end

ismultioutput(m::Model) = !isa(m.output, Tensor)

function tf(model)
  sess = Session(Graph())
  input = placeholder(Float32)
  params, output = tograph(model, input)
  run(sess, initialize_all_variables())
  Model(model, sess, params,
        [input], output,
        [gradients(output, input)])
end

batchone(x) = Batch((x,))
batchone(x::Batch) = x

function batch(xs)
  dims = ndims(xs)-1
  T = Array{eltype(xs),dims}
  B = Array{eltype(xs),dims+1}
  Batch{T,B}(xs)
end

function (m::Model)(args::Batch...)
  @assert length(args) == length(m.inputs)
  output = run(m.session, m.output, Dict(zip(m.inputs, args)))
  ismultioutput(m) ? (batch.(output)...,) : batch(output)
end

function (m::Model)(args...)
  output = m(map(batchone, args)...)
  ismultioutput(m) ? map(first, output) : first(output)
end

function Flux.back!(m::Model, Δ, args...)
  @assert length(args) == length(m.inputs)
  # TODO: keyword arguments to `gradients`
  run(m.session, m.gradients[1], Dict(zip(m.inputs, args)))
end

function Flux.update!(m::Model)
  error("update! is not yet supported on TensorFlow models")
end

import Juno: info

function Flux.train!(m::Model, train, test=[]; epoch = 1, η = 0.1,
                     loss = (y, y′) -> reduce_sum((y - y′).^2)/2,
                     opt = TensorFlow.train.GradientDescentOptimizer(η))
  i = 0
  Y = placeholder(Float32)
  Loss = loss(m.outputs[1], Y)
  minimize_op = TensorFlow.train.minimize(opt, Loss)
  for e in 1:epoch
    info("Epoch $e\n")
    @progress for (x, y) in train
      y, cur_loss, _ = run(m.session, vcat(m.outputs[1], Loss, minimize_op),
                           Dict(m.inputs[1]=>batchone(x), Y=>batchone(y)))
      if i % 5000 == 0
        @show y
        @show accuracy(m, test)
      end
      i += 1
    end
  end
end
-												tf reorg

											
										
										
											2016-10-26 13:25:10 +00:00
+								type Model
-												handle state on julia side

											
										
										
											2016-10-28 20:17:48 +00:00
+								  model::Any
-												tf reorg

											
										
										
											2016-10-26 13:25:10 +00:00
+								  session::Session
-												better handling for reused params

											
										
										
											2016-10-28 15:06:56 +00:00
+								  params::Dict{Flux.Param,Tensor}
-												tf reorg

											
										
										
											2016-10-26 13:25:10 +00:00
+								  inputs::Vector{Tensor}
-												handle state on julia side

											
										
										
											2016-10-28 20:17:48 +00:00
+								  output::Any
-												tf.model refactor

											
										
										
											2016-10-28 14:13:58 +00:00
+								  gradients::Vector{Tensor}
-												tf reorg

											
										
										
											2016-10-26 13:25:10 +00:00
+								end
-												handling of multiple outputs

											
										
										
											2016-10-28 19:50:27 +00:00
+								ismultioutput(m::Model) = !isa(m.output, Tensor)
-												tf reorg

											
										
										
											2016-10-26 13:25:10 +00:00
+								function tf(model)
-												put this back

											
										
										
											2016-10-28 15:26:06 +00:00
+								  sess = Session(Graph())
-												tf reorg

											
										
										
											2016-10-26 13:25:10 +00:00
+								  input = placeholder(Float32)
-												better handling for reused params

											
										
										
											2016-10-28 15:06:56 +00:00
+								  params, output = tograph(model, input)
-												tf reorg

											
										
										
											2016-10-26 13:25:10 +00:00
+								  run(sess, initialize_all_variables())
-												better handling for reused params

											
										
										
											2016-10-28 15:06:56 +00:00
+								  Model(model, sess, params,
-												handling of multiple outputs

											
										
										
											2016-10-28 19:50:27 +00:00
+								        [input], output,
-												better handling for reused params

											
										
										
											2016-10-28 15:06:56 +00:00
+								        [gradients(output, input)])
-												tf reorg

											
										
										
											2016-10-26 13:25:10 +00:00
+								end
-												use batching api

											
										
										
											2016-10-28 16:00:31 +00:00
+								batchone(x) = Batch((x,))
-												don't rebatch batches

											
										
										
											2016-10-29 23:20:15 +00:00
+								batchone(x::Batch) = x
-												use batching api

											
										
										
											2016-10-28 16:00:31 +00:00
 								function batch(xs)
 								  dims = ndims(xs)-1
 								  T = Array{eltype(xs),dims}
 								  B = Array{eltype(xs),dims+1}
 								  Batch{T,B}(xs)
 								end
-												tf reorg

											
										
										
											2016-10-26 13:25:10 +00:00
 								function (m::Model)(args::Batch...)
 								  @assert length(args) == length(m.inputs)
-												handling of multiple outputs

											
										
										
											2016-10-28 19:50:27 +00:00
+								  output = run(m.session, m.output, Dict(zip(m.inputs, args)))
 								  ismultioutput(m) ? (batch.(output)...,) : batch(output)
-												tf reorg

											
										
										
											2016-10-26 13:25:10 +00:00
+								end
-												handling of multiple outputs

											
										
										
											2016-10-28 19:50:27 +00:00
+								function (m::Model)(args...)
 								  output = m(map(batchone, args)...)
 								  ismultioutput(m) ? map(first, output) : first(output)
 								end
-												tf reorg

											
										
										
											2016-10-26 13:25:10 +00:00
 								function Flux.back!(m::Model, Δ, args...)
 								  @assert length(args) == length(m.inputs)
 								  # TODO: keyword arguments to `gradients`
-												tf.model refactor

											
										
										
											2016-10-28 14:13:58 +00:00
+								  run(m.session, m.gradients[1], Dict(zip(m.inputs, args)))
-												tf reorg

											
										
										
											2016-10-26 13:25:10 +00:00
+								end
 								function Flux.update!(m::Model)
 								  error("update! is not yet supported on TensorFlow models")
 								end
 								import Juno: info
 								function Flux.train!(m::Model, train, test=[]; epoch = 1, η = 0.1,
 								                     loss = (y, y′) -> reduce_sum((y - y′).^2)/2,
 								                     opt = TensorFlow.train.GradientDescentOptimizer(η))
 								  i = 0
 								  Y = placeholder(Float32)
-												tf.model refactor

											
										
										
											2016-10-28 14:13:58 +00:00
+								  Loss = loss(m.outputs[1], Y)
-												tf reorg

											
										
										
											2016-10-26 13:25:10 +00:00
+								  minimize_op = TensorFlow.train.minimize(opt, Loss)
 								  for e in 1:epoch
 								    info("Epoch $e\n")
 								    @progress for (x, y) in train
-												tf.model refactor

											
										
										
											2016-10-28 14:13:58 +00:00
+								      y, cur_loss, _ = run(m.session, vcat(m.outputs[1], Loss, minimize_op),
-												use batching api

											
										
										
											2016-10-28 16:00:31 +00:00
+								                           Dict(m.inputs[1]=>batchone(x), Y=>batchone(y)))
-												tf reorg

											
										
										
											2016-10-26 13:25:10 +00:00
+								      if i % 5000 == 0
 								        @show y
 								        @show accuracy(m, test)
 								      end
 								      i += 1
 								    end
 								  end
 								end