Skip to content

Sporadic cudnn/convolution test failures #725

@maleadt

Description

@maleadt

For example: https://buildkite.com/julialang/cuda-dot-jl/builds/968#93c70c29-8c56-466d-b31f-c15b5c4a65b6

The failed comparison:

Float32[11.339898 -0.35388422 … -7.7320366 -2.0372493; 0.5171652 6.98606 … 3.625992 0.3606677; … ; -9.337527 -0.4385929 … -0.64571404 3.9338949; 0.101695895 5.5190907 … -4.3475685 4.563487] 
Float32[-8.411543 1.8871636 … 4.951878 2.7781992; -0.23128414 -4.977843 … -2.2405014 -1.0332452; … ; 5.2111654 -5.9086237 … -8.254432 -2.6942174; -6.5529013 -0.50722265 … -9.206887 -9.598008] 
Float32[-1.6625764 8.651685 … 1.7940903 0.66811204; 3.4547272 -0.50751054 … 8.584299 -7.924706; … ; 1.3431497 -0.9462663 … 4.18754 -9.402357; 10.6235895 0.16038725 … -4.0804334 -2.2619858] 
Float32[-3.5070534 -10.729431 … -5.116676 0.07223022; -1.1512243 -3.9527044 … -0.3750069 -0.8288319; … ; -10.928001 -4.0239186 … -3.5830576 5.979162; -15.044505 6.4413824 … -3.9082098 10.073008] 
Float32[2.2557168 3.4730556 … 14.446819 3.9426515; 2.093703 10.0018835 … 0.6170838 3.8267064; … ; -0.7535105 -3.3166182 … 6.767151 -6.547782; 1.9609634 -1.9800158 … 9.211072 9.225448] 
Float32[-10.500388 -10.639041 … -8.234325 -9.571053; -6.0109186 0.68985677 … -3.269639 2.5057364; … ; -0.5645257 -5.4851894 … 3.207436 6.2571173; 3.6976657 0.78052115 … -7.2735963 -5.4585905] 
Float32[-12.282933 -5.8298993 … 6.5901723 -8.0629225; -4.5100265 7.1448364 … -9.869208 -3.397947; … ; -6.022368 1.8941798 … -1.4661267 8.301998; 1.3205339 9.675554 … 7.059723 3.29212] 
Float32[3.5465102 4.6437807 … -3.3740168 -7.524283; 3.4188838 -1.7698078 … 9.001716 4.050767; … ; 1.0820111 4.962797 … 0.8179325 -11.103408; 4.108812 -3.8109338 … -1.9185336 -5.115817] 
Float32[-1.0308669 -3.125521 … 8.702576 -3.4893954; -5.392028 -1.5024531 … -11.045694 5.366046; … ; -3.8732483 -6.105731 … 12.94564 4.690816; 2.3938022 3.942337 … -9.809627 1.3426454] 
Float32[-1.4626034 2.5595913 … -1.9670656 6.0024447; 8.564247 -1.0000148 … -4.654773 -4.868887; … ; -0.2185952 2.8668485 … -17.018162 -6.6957855; -3.7243886 -6.5969763 … -2.436799 -8.443428] 
Float32[-13.363389 -6.2885346 … 0.73612255 -5.259095; 15.318377 -3.9310389 … 7.770155 -1.9279139; … ; -2.285467 -3.0098808 … -5.6914015 5.2188597; 5.895041 -15.136935 … 5.8277507 -12.661768] 
Float32[1.5873765 9.462805 … -3.631779 0.81165874; 0.25209653 -5.1471214 … -6.5175776 -2.815481; … ; 7.669592 0.88133085 … -3.2477484 -0.97609794; -4.4345603 -5.8064327 … 0.5163051 5.663567] 
Float32[7.7663336 -0.51701593 … 9.043473 0.7726512; 4.446763 0.08444798 … 4.876623 1.6694326; … ; -7.0494223 2.9762216 … 0.81327534 9.576384; 4.7767763 -12.290512 … -3.427613 -5.423974] 
Float32[-3.4994054 -6.9185987 … 2.087229 -5.8122; -0.89573777 -2.3741922 … -5.81844 6.4371805; … ; 2.978869 1.5207782 … -2.6192136 3.8913846; -5.6063857 1.0591991 … -3.9058766 4.0126796] 
Float32[-0.35167167 4.223628 … -1.8557506 1.8335615; 1.748302 -7.696812 … -7.374843 3.1636536; … ; 2.4781594 -10.38644 … -3.313611 5.485118; 4.7394867 13.607738 … -3.6534462 0.16832009] 
Float32[1.1288794 -9.963065 … -6.94676 -5.674263; -2.3580742 2.2461686 … 0.32166493 -5.263524; … ; -2.6695936 7.412922 … -0.5336609 6.5138025; -6.144022 -1.0293213 … -3.5078764 -1.2475352]
Float32[11.339903 0.0 … 0.0 0.0; 0.51716113 6.986063 … 3.6259923 0.36066985; … ; 0.0 0.0 … 0.0 3.9338973; 0.10169387 5.5190845 … 0.0 4.563491]
Float32[0.0 1.8871601 … 4.9518867 2.7781963; 0.0 0.0 … 0.0 0.0; … ; 5.211176 0.0 … 0.0 0.0; 0.0 0.0 … 0.0 0.0]
Float32[0.0 8.651692 … 1.7940888 0.6681142; 3.4547334 0.0 … 8.584289 0.0; … ; 1.3431506 0.0 … 4.187529 0.0; 10.623588 0.16038755 … 0.0 0.0]
Float32[0.0 0.0 … 0.0 0.072229505; 0.0 0.0 … 0.0 0.0; … ; 0.0 0.0 … 0.0 5.979165; 0.0 6.4413757 … 0.0 10.073009]
Float32[2.2557414 3.4730494 … 14.446819 3.942652; 2.0936968 10.001884 … 0.6170825 3.8267062; … ; 0.0 0.0 … 6.767151 0.0; 1.9609501 0.0 … 9.211074 9.225449]
Float32[0.0 0.0 … 0.0 0.0; 0.0 0.68985546 … 0.0 2.5057378; … ; 0.0 0.0 … 3.207428 6.257118; 3.6976624 0.78052354 … 0.0 0.0]
Float32[0.0 0.0 … 6.5901685 0.0; 0.0 7.1448345 … 0.0 0.0; … ; 0.0 1.8941854 … 0.0 8.302006; 1.3205338 9.675554 … 7.0597215 3.2921138]
Float32[3.5465317 4.6437883 … 0.0 0.0; 3.418889 0.0 … 9.001716 4.050769; … ; 1.0820035 4.9627867 … 0.8179501 0.0; 4.1088295 0.0 … 0.0 0.0]
Float32[0.0 0.0 … 8.70258 0.0; 0.0 0.0 … 0.0 5.366045; … ; 0.0 0.0 … 12.945637 4.6908035; 2.3938 3.942341 … 0.0 1.3426487]
Float32[0.0 2.559598 … 0.0 6.0024376; 8.564245 0.0 … 0.0 0.0; … ; 0.0 2.8668516 … 0.0 0.0; 0.0 0.0 … 0.0 0.0]
Float32[0.0 0.0 … 0.73613024 0.0; 15.3183775 0.0 … 7.770169 0.0; … ; 0.0 0.0 … 0.0 5.2188725; 5.895043 0.0 … 5.827754 0.0]
Float32[1.587366 9.4628 … 0.0 0.8116602; 0.252097 0.0 … 0.0 0.0; … ; 7.669587 0.88133657 … 0.0 0.0; 0.0 0.0 … 0.5163039 5.6635704]
Float32[7.766321 0.0 … 9.043472 0.7726433; 4.446766 0.08445144 … 4.876629 1.6694307; … ; 0.0 2.9762156 … 0.81328607 9.576385; 4.7767687 0.0 … 0.0 0.0]
Float32[0.0 0.0 … 2.0872164 0.0; 0.0 0.0 … 0.0 6.4371824; … ; 2.97888 1.520792 … 0.0 3.8913813; 0.0 1.059197 … 0.0 4.012678]
Float32[0.0 4.223618 … 0.0 1.8335633; 1.7482939 0.0 … 0.0 3.1636562; … ; 2.478148 0.0 … 0.0 5.4851203; 4.739488 13.607737 … 0.0 0.16831973]
Float32[1.1289243 0.0 … 0.0 0.0; 0.0 2.2461672 … 0.32166946 0.0; … ; 0.0 7.412915 … 0.0 6.51381; 0.0 0.0 … 0.0 0.0]

So negative numbers have/should become zero. A clamping issue?

Metadata

Metadata

Assignees

Labels

bugSomething isn't working

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions