@kidultff · 2026年4月22日 llama.cpp多GPU推理速度实测记录(张量并行祛魅记) 26.4.28更新: 2*2080Ti 22G vllm跑Qwen3.6 27B速度可以达到47tokens/s,上下文256K拉满,比llama.cpp快了接近两倍,双卡功率限制170w,利用率均为100%。实测Agent效果和Qwen3.6 35B差不多,Coding效果比Qwen3.6 35B显著优秀,视觉效果比Qwen3. ...
@kidultff · 2026年4月5日 TrueNAS云备份接入阿里云OSS踩坑记录 如果你配置完阿里云OSS(正确填写endpoint、bucket名)后,报错: [EFAULT] 20xx/xx/xx xx:xx:xx ERROR : : error listing: SecondLevelDomainForbidden: Please use virtual hosted style to access. status code: 403, request id: xxxxx ...