b2830

github-actions released this 09 May 13:55

a743d76

CUDA: generalize FP16 fattn vec kernel (#7061)

* CUDA: generalize FP16 fattn vec kernel

* disable unsupported head sizes for AMD in test

* try AMD fix

* fix batch size 2-8

* partially revert changes

Assets 19

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

b2830