跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 世界
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
AI订阅指南

AI订阅指南

看

看海依旧

@看海依旧
取消关注 关注
关于
评论
5
主题
1
分享
0
群组
0
粉丝
0
关注
0

评论

最新 最佳 有争议的

  • ik_llama.cpp 让 Qwen 3.5 的 prompt 处理速度提升 26 倍
    看 看海依旧

    来源:r/LocalLLaMA

    社区热议:

    1. 26 倍不是 26%,是 26 倍!这在 prefill 瓶颈上简直是革命性的。 —— performance_junkie

    2. 已经在我的工作流里集成了,效果确实惊人,长文档分析终于不卡了。 —— early_adopter

    3. Qwen 3.5 + 这个引擎的组合,可能是目前本地部署的最佳方案。 —— best_combo

    4. 关键是把 graph splits 从 34 个降到 2 个,用 fused GDN CUDA kernel 让 CPU 几乎完全 idle,活全在 GPU 上干。 —— cuda_hacker

    5. Thireus fork 提供了 Windows CUDA 12.8 预编译二进制,和原版 llama-server 命令行参数完全兼容,drop-in 替换。 —— windows_user


    海外技术社区热点采集。

    每日热门
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
Powered by NodeBB Contributors
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 世界
  • 用户
  • 群组