Flux.jl

Commit Graph

Author	SHA1	Message	Date
Troels Arnfred Bojesen	2b80573248	Fix Glorot initialization, add He initialization Should fix #442 . Adds He weight initialization as a bonus :-)	2019-11-19 18:16:29 +09:00
bors[bot]	8638bcdcd7	Merge #936 936: Avoid unnecessary conversion r=MikeInnes a=baggepinnen This initialization works for both cpu and gpu Co-authored-by: Fredrik Bagge Carlson <baggepinnen@gmail.com>	2019-11-19 09:05:23 +00:00
Fredrik Bagge Carlson	2da22f31f0	Avoid unnecessary conversion This initialization works for both cpu and gpu	2019-11-19 16:31:04 +08:00
Fredrik Bagge Carlson	df7ffb0ef8	Fix AMSGrad on GPU The previous initialization created a CPU array. Now, the same type of array as `x` is created.	2019-11-19 16:27:44 +08:00
Dhairya Gandhi	eb41715d26	define manual rules	2019-11-19 13:30:33 +05:30
Troels Arnfred Bojesen	4530ac65c7	Fix Glorot initialization, add He initialization Should fix the issue reported at https://github.com/FluxML/Flux.jl/issues/442 . Adds He weight initialization as a bonus :-)	2019-11-19 16:50:40 +09:00
Mike J Innes	967cc1c175	Merge pull request #927 from heliosdrm/patch-1 Extend docs about `train!`	2019-11-18 12:22:16 +00:00
dsweber2	dea29532ef	Merge branch 'master' into activations	2019-11-15 17:19:43 -08:00
Helios De Rosario	a0e3729679	Update docs/src/training/training.md Co-Authored-By: Mike J Innes <mike.j.innes@gmail.com>	2019-11-15 21:17:45 +01:00
dsweber2	20eb840882	keeping activations separate	2019-11-15 12:03:08 -08:00
bors[bot]	7eb6a0c98c	Merge #932 932: Travis: test on 1.0 r=MikeInnes a=MikeInnes Co-authored-by: Mike J Innes <mike.j.innes@gmail.com> Co-authored-by: Mike Innes <mike.j.innes@gmail.com>	2019-11-15 16:21:30 +00:00
Mike Innes	e24215ca98	guard test on 1.0	2019-11-15 15:59:42 +00:00
Mike J Innes	665e441919	pkg up	2019-11-15 12:12:28 +00:00
Mike J Innes	9d6f6fdaa3	Merge pull request #926 from janEbert/bc-cuda-fix Fix binarycrossentropy on CuArrays	2019-11-15 13:05:52 +01:00
Mike J Innes	2471596cdb	test on 1.0	2019-11-15 11:50:13 +00:00
dsweber2	89afa20410	Merge branch 'activations' of github.com:dsweber2/Flux.jl into activations	2019-11-14 14:09:27 -08:00
dsweber2	58c794702d	simpler test	2019-11-14 14:05:53 -08:00
dsweber2	0fe3ac4e77	bring activations into function call	2019-11-14 13:40:52 -08:00
dsweber2	db92b0e3ce	super simple test	2019-11-14 13:40:52 -08:00
dsweber2	6475f6a43e	recursive way of doing activations	2019-11-14 13:40:52 -08:00
dsweber2	99679f7e16	deal with empty Chain	2019-11-14 13:40:52 -08:00
dsweber2	d0202a2945	adding the extra commits broke the accumulate version	2019-11-14 13:40:52 -08:00
dsweber2	cdaaca8cfa	make activations zygote friendly	2019-11-14 13:40:29 -08:00
Helios De Rosario	ba4e3be0d3	explanations about params in `train!`	2019-11-14 16:22:31 +01:00
Helios De Rosario	074eb47246	Update training.md	2019-11-12 23:29:38 +01:00
Dhairya Gandhi	e89b8eba77	fixes	2019-11-13 01:12:26 +05:30
Helios De Rosario	7e1ffd6507	Extend docs about `train!` Related to #921: explain why it is not needed to pass the model as argument.	2019-11-08 21:39:00 +01:00
DrChainsaw	453ecd1f24	Merge remote-tracking branch 'upstream/master' into samepad	2019-11-08 18:49:47 +01:00
janEbert	a00d8d94ec	Add test for CUDA binarycrossentropy	2019-11-08 17:28:54 +01:00
janEbert	3dceef427f	Fix binarycrossentropy on CuArrays	2019-11-08 16:48:11 +01:00
Dhairya Gandhi	a4a987f0b0	hook into bcasting	2019-11-07 16:53:41 +05:30
Tim Besard	9d05afaccc	Merge pull request #922 from FluxML/tb/backward Restore Julia 1.0 compatibility.	2019-11-06 20:15:31 +01:00
Tim Besard	8a0745faab	Restore Julia 1.0 compatibility.	2019-11-06 18:53:45 +01:00
bors[bot]	84d4ab083d	Merge #920 920: use release versions of packages r=MikeInnes a=MikeInnes bors r+ Co-authored-by: Mike J Innes <mike.j.innes@gmail.com>	2019-11-06 12:23:44 +00:00
Mike J Innes	61078f3ef0	use release versions of packages	2019-11-06 12:23:12 +00:00
Tim Besard	08804a06d2	Merge pull request #916 from FluxML/tb/runtime_use_cuda Check for CUDA availability at run time.	2019-11-06 09:46:39 +01:00
Tim Besard	c9f369de86	Update packages.	2019-11-06 07:53:20 +01:00
Tim Besard	6e8f8c1f46	Use latest GPU CI templates.	2019-11-04 16:41:57 +01:00
Tim Besard	916d3dabbd	Bump Julia version.	2019-11-04 15:51:33 +01:00
Tim Besard	33d276cdb7	Fix GPU-less tests.	2019-11-04 15:51:33 +01:00
Tim Besard	dbcdf4d1bd	Bump GPU packages.	2019-11-04 15:51:33 +01:00
Tim Besard	a82b76cf24	Conditionally include the CUDNN glue code.	2019-11-04 15:27:11 +01:00
Tim Besard	39ab740fb7	Check for CUDA availability at run time.	2019-11-02 11:18:06 +01:00
bors[bot]	7104fd9332	Merge #907 907: Change `gate` function to `view` instead of copy r=MikeInnes a=janEbert This speeds up code with large inputs by quite a lot. I only added it to the function accepting an `AbstractVector` as input as copying matrices may be faster than viewing them due to caching (they are sliced per row so will the data will not necessarily have a low stride). Co-authored-by: janEbert <janpublicebert@posteo.net>	2019-10-24 11:06:41 +00:00
janEbert	7b41bc4ab5	Change `gate` function to `view` instead of copy Only for vector input as copying a matrix may be more efficient due to caching. A matrix is sliced per row, meaning the view will not be aligned.	2019-10-24 12:45:22 +02:00
Dhairya Gandhi	7c90fb469d	use array to define Zeros	2019-10-23 20:02:15 +05:30
bors[bot]	645aa04464	Merge #898 898: Fix problem in crossentropy breaking GPU compilation r=MikeInnes a=kshyatt Trying to run this simple example ``` using Flux, CuArrays using Flux: crossentropy model = Chain( Dense(728, 128, σ), LSTM(128, 256), LSTM(256, 128), Dense(128, 10), softmax) \|> gpu data = [rand(728) for i in 1:100]; out = [rand(10) for i in 1:100]; loss(x, y) = crossentropy(model(x), y); Flux.train!(loss, params(model), zip(gpu.(data), gpu.(out)), ADAM()) ``` Old version of `crossentropy`: ``` ERROR: GPU compilation of #23(CuArrays.CuKernelState, CUDAnative.CuDeviceArray{Float32,1,CUDAnative.AS.Global}, Base.Broadcast.Broadcasted{Nothing,Tuple{Base.OneTo{Int64}},typeof(),Tuple{Base.Broadcast.Extruded{Array{Float32,1},Tuple{Bool},Tuple{Int64}},Base.Broadcast.Broadcasted{Base.Broadcast.ArrayStyle{CuArray},Nothing,typeof(conj),Tuple{Base.Broadcast.Extruded{CUDAnative.CuDeviceArray{Float32,1,CUDAnative.AS.Global},Tuple{Bool},Tuple{Int64}}}}}}) failed KernelError: passing and using non-bitstype argument Argument 4 to your kernel function is of type Base.Broadcast.Broadcasted{Nothing,Tuple{Base.OneTo{Int64}},typeof(),Tuple{Base.Broadcast.Extruded{Array{Float32,1},Tuple{Bool},Tuple{Int64}},Base.Broadcast.Broadcasted{Base.Broadcast.ArrayStyle{CuArray},Nothing,typeof(conj),Tuple{Base.Broadcast.Extruded{CUDAnative.CuDeviceArray{Float32,1,CUDAnative.AS.Global},Tuple{Bool},Tuple{Int64}}}}}}. That type is not isbits, and such arguments are only allowed when they are unused by the kernel. .args is of type Tuple{Base.Broadcast.Extruded{Array{Float32,1},Tuple{Bool},Tuple{Int64}},Base.Broadcast.Broadcasted{Base.Broadcast.ArrayStyle{CuArray},Nothing,typeof(conj),Tuple{Base.Broadcast.Extruded{CUDAnative.CuDeviceArray{Float32,1,CUDAnative.AS.Global},Tuple{Bool},Tuple{Int64}}}}} which is not isbits. .1 is of type Base.Broadcast.Extruded{Array{Float32,1},Tuple{Bool},Tuple{Int64}} which is not isbits. .x is of type Array{Float32,1} which is not isbits. Stacktrace: [1] check_invocation(::CUDAnative.CompilerJob, ::LLVM.Function) at /mnt/home/khyatt/.julia/dev/CUDAnative/src/compiler/validation.jl:70 [2] macro expansion at /mnt/home/khyatt/.julia/dev/CUDAnative/src/compiler/driver.jl:187 [inlined] [3] macro expansion at /mnt/home/khyatt/.julia/packages/TimerOutputs/7zSea/src/TimerOutput.jl:216 [inlined] [4] #codegen#136(::Bool, ::Bool, ::Bool, ::Bool, ::Bool, ::typeof(CUDAnative.codegen), ::Symbol, ::CUDAnative.CompilerJob) at /mnt/home/khyatt/.julia/dev/CUDAnative/src/compiler/driver.jl:186 [5] #codegen at ./none:0 [inlined] [6] #compile#135(::Bool, ::Bool, ::Bool, ::Bool, ::Bool, ::typeof(CUDAnative.compile), ::Symbol, ::CUDAnative.CompilerJob) at /mnt/home/khyatt/.julia/dev/CUDAnative/src/compiler/driver.jl:47 [7] #compile#134 at ./none:0 [inlined] [8] #compile at ./none:0 [inlined] (repeats 2 times) [9] macro expansion at /mnt/home/khyatt/.julia/dev/CUDAnative/src/execution.jl:389 [inlined] [10] #cufunction#176(::Nothing, ::Base.Iterators.Pairs{Union{},Union{},Tuple{},NamedTuple{(),Tuple{}}}, ::typeof(CUDAnative.cufunction), ::GPUArrays.var"#23#24", ::Type{Tuple{CuArrays.CuKernelState,CUDAnative.CuDeviceArray{Float32,1,CUDAnative.AS.Global},Base.Broadcast.Broadcasted{Nothing,Tuple{Base.OneTo{Int64}},typeof(),Tuple{Base.Broadcast.Extruded{Array{Float32,1},Tuple{Bool},Tuple{Int64}},Base.Broadcast.Broadcasted{Base.Broadcast.ArrayStyle{CuArray},Nothing,typeof(conj),Tuple{Base.Broadcast.Extruded{CUDAnative.CuDeviceArray{Float32,1,CUDAnative.AS.Global},Tuple{Bool},Tuple{Int64}}}}}}}}) at /mnt/home/khyatt/.julia/dev/CUDAnative/src/execution.jl:357 [11] cufunction(::Function, ::Type) at /mnt/home/khyatt/.julia/dev/CUDAnative/src/execution.jl:357 [12] macro expansion at /mnt/home/khyatt/.julia/dev/CUDAnative/src/execution.jl:174 [inlined] [13] macro expansion at ./gcutils.jl:91 [inlined] [14] macro expansion at /mnt/home/khyatt/.julia/dev/CUDAnative/src/execution.jl:171 [inlined] [15] _gpu_call(::CuArrays.CuArrayBackend, ::Function, ::CuArray{Float32,1}, ::Tuple{CuArray{Float32,1},Base.Broadcast.Broadcasted{Nothing,Tuple{Base.OneTo{Int64}},typeof(),Tuple{Base.Broadcast.Extruded{Array{Float32,1},Tuple{Bool},Tuple{Int64}},Base.Broadcast.Broadcasted{Base.Broadcast.ArrayStyle{CuArray},Nothing,typeof(conj),Tuple{Base.Broadcast.Extruded{CuArray{Float32,1},Tuple{Bool},Tuple{Int64}}}}}}}, ::Tuple{Tuple{Int64},Tuple{Int64}}) at /mnt/home/khyatt/.julia/dev/CuArrays/src/gpuarray_interface.jl:60 [16] gpu_call at /mnt/home/khyatt/.julia/dev/GPUArrays/src/abstract_gpu_interface.jl:151 [inlined] [17] gpu_call at /mnt/home/khyatt/.julia/dev/GPUArrays/src/abstract_gpu_interface.jl:128 [inlined] [18] copyto! at /mnt/home/khyatt/.julia/dev/GPUArrays/src/broadcast.jl:48 [inlined] [19] copyto! at ./broadcast.jl:863 [inlined] [20] copy at ./broadcast.jl:839 [inlined] [21] materialize at ./broadcast.jl:819 [inlined] [22] (::Zygote.var"#1310#1311"{CuArray{Float32,1},CuArray{Float32,1}})(::Array{Float32,1}) at /mnt/home/khyatt/.julia/dev/Zygote/src/lib/broadcast.jl:68 ``` New version: ``` julia> Flux.train!(loss, params(model), zip(gpu.(data), gpu.(out)), ADAM()) julia> # everyone finished happily and went on with their lives ``` Co-authored-by: Katharine Hyatt <khyatt@flatironinstitute.org>	2019-10-23 14:31:53 +00:00
Katharine Hyatt	8913c9c741	Make the vector of weights test pass on GPU	2019-10-23 09:53:09 -04:00
Katharine Hyatt	f7ce717aaa	Add tests	2019-10-23 09:22:22 -04:00
Katharine Hyatt	e0c1c0e057	Fix problem in crossentropy breaking GPU compilation	2019-10-22 14:00:57 -04:00

... 5 6 7 8 9 ...

2623 Commits All Branches Search

2623 Commits

All Branches