avatar
文章
9
标签
4
分类
3

首页
时间轴
标签
分类
友链
关于
闲庭品趣
首页
时间轴
标签
分类
友链
关于

分析大模型中的参数量,计算量和KV cache

发表于2024-04-29|更新于2024-04-29
|阅读量:
文章作者: Dingchao Ren
文章链接: https://lovefamily-ren-wang.com/2024/04/29/%E5%88%86%E6%9E%90%E5%A4%A7%E6%A8%A1%E5%9E%8B%E4%B8%AD%E7%9A%84%E5%8F%82%E6%95%B0%E9%87%8F%EF%BC%8C%E8%AE%A1%E7%AE%97%E9%87%8F%E5%92%8CKV-cache/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 闲庭品趣!
上一篇
MultiHeadAttention 代码实现
cover of next post
下一篇
LLaMA 大语言模型
avatar
Dingchao Ren
请走慢一点,给自己一点喘息
文章
9
标签
4
分类
3
Follow Me
公告
rendingchao@icloud.com
最新文章
LLM 八股
LLM 八股2024-05-16
MHA, MQA, GQA
MHA, MQA, GQA2024-05-15
MultiHeadAttention 代码实现2024-05-08
分析大模型中的参数量,计算量和KV cache2024-04-29
LLaMA 大语言模型
LLaMA 大语言模型2024-04-27
©2020 - 2024 By Dingchao Ren
框架 Hexo|主题 Butterfly