首页
技术日记
编程
旅游
数码
登录
标签
多头
MLA——一文通透DeepSeek V2中的多头潜在注意力MLA:改进MHA,从而压缩KV缓存,提高推理速度(含让任何LLM都能用上MLA的方法)
前言 成就本文有以下三个因素 24年5.17日,我在我司一课程「大模型与多模态论文100篇」里问道:大家希望我们还讲哪些论文 一学员朋友小栗说:幻方旗下公司深度求索于24
都能
多头
通透
一文
缓存
admin
4月前
68
0