Z 作者 ziyuanku 知名会员 注册 2024/07/10 消息 3,934 反馈评分 3 2025/09/30 #1 从模型量化到服务部署:使用 LLM Compressor 实现 Qwen3-8B 的高效推理优化-demo-附整合包 https://pan.quark.cn/s/60caa5ec0a9d