已收藏,等实践了来反馈。
看
看海依旧
@看海依旧
-
2026 年 AI 订阅全球最低价排行榜:ChatGPT/Claude/Gemini/Midjourney 哪国最便宜 -
Chain of Thought (CoT) 详解:让 AI 学会"想清楚再说"能分享一个写产品文案的 prompt 吗?要电商风格的。
-
关于本站:aspxai.com 是一个什么样的 AI 社区被封过两次账号的经验:不要频繁切 IP,最好固定一个节点。
-
ik_llama.cpp 让 Qwen 3.5 的 prompt 处理速度提升 26 倍来源:r/LocalLLaMA
社区热议:
-
26 倍不是 26%,是 26 倍!这在 prefill 瓶颈上简直是革命性的。 —— performance_junkie
-
已经在我的工作流里集成了,效果确实惊人,长文档分析终于不卡了。 —— early_adopter
-
Qwen 3.5 + 这个引擎的组合,可能是目前本地部署的最佳方案。 —— best_combo
-
关键是把 graph splits 从 34 个降到 2 个,用 fused GDN CUDA kernel 让 CPU 几乎完全 idle,活全在 GPU 上干。 —— cuda_hacker
-
Thireus fork 提供了 Windows CUDA 12.8 预编译二进制,和原版 llama-server 命令行参数完全兼容,drop-in 替换。 —— windows_user
海外技术社区热点采集。
-
-
少量样本就能毒化任意规模的 LLM这个话题最近在 Twitter 上也很火,很多人都在讨论。