FP8训练新范式:减少40%显存占用,训练速度提高1.4倍
- 2025-03-07 10:30:00
- 刘大牛 转自文章
- 251


论文标题:COAT: Compressing Optimizer States and Activation for memory efficient FP8 Training
论文链接:https://arxiv.org/abs/2410.19313
开源代码:https://github.com/NVlabs/COAT









发表评论
文章分类
联系我们
联系人: | 透明七彩巨人 |
---|---|
Email: | weok168@gmail.com |