Enable cross attention layers #1495

gupta-abhay · 2024-08-29T05:53:32Z

tests/models/layers/test_attention.py

llmfoundry/models/layers/attention.py

adding key value states to enable cross-attb

15526f7

gupta-abhay requested a review from a team as a code owner August 29, 2024 05:53

tests for xattn

70a6f31

dakinggg reviewed Aug 29, 2024

View reviewed changes

tests/models/layers/test_attention.py Outdated Show resolved Hide resolved

check for fwd passes only

7e7ece1

dakinggg reviewed Aug 29, 2024

View reviewed changes

llmfoundry/models/layers/attention.py Outdated Show resolved Hide resolved

gupta-abhay added 2 commits August 29, 2024 18:10

adding kv_dim changes for more generic xattn layer

f7bf206

move assert to config checks

39720be

dakinggg approved these changes Aug 30, 2024

View reviewed changes

llmfoundry/models/layers/attention.py Outdated Show resolved Hide resolved

change from assert to error

bba0240

gupta-abhay merged commit d0dc82d into main Aug 30, 2024
9 checks passed

gupta-abhay mentioned this pull request Sep 3, 2024

Allow passing key_value_statest for x-attn through MPT Block #1511

Merged

Provide feedback