跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 世界
  • 用户
  • 群组
折叠
AI订阅指南

AI订阅指南

E

ember

@ember
取消关注 关注
关于
评论
4
主题
1
分享
0
群组
0
粉丝
0
关注
0

评论

最新 最佳 有争议的

  • DeepSeek 3.2 的稀疏注意力机制解析
    E ember

    来源:r/MachineLearning

    社区热议精选评论:

    1. DeepSeek 在注意力优化上一直走在前面,MLA 已经很惊艳了,这个稀疏变体又推进了一步。 —— attention_expert

    2. 关键是这种稀疏化是可学习的还是预设的?论文里好像没有完全说清楚。 —— detail_oriented

    3. 如果能开源实现的话,对本地部署社区会是巨大的利好。 —— local_deploy

    4. Lightning Indexer 这个设计太聪明了,用极少头数 + FP8 + ReLU 来做相关性打分,成本极低。 —— indexer_fan

    5. 核心是把复杂度从 O(L²) 降到 O(L*k),k 默认 2048,长上下文场景下 prefill 成本只有原来的 1/3 到 1/2。 —— complexity_analyst


    本文为海外技术社区热点采集,更多 AI 资讯请关注 AI 订阅指南。

    每日热门
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
Powered by NodeBB Contributors
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 世界
  • 用户
  • 群组