Sparse is Enough in Scaling Transformers
Sparse is Enough in Scaling Transformers
Autor
Kaiser Lukasz
Gajewski Wojciech
Chowdhery Aakanksha
Mohiuddin Afroz
Jaszczur Sebastian
Kanerva Jonni
Data publikacji
Dyscyplina PBN
informatyka
Licencja otwartego dostępu
Dostęp zamknięty