视频分享链接
复制
复制链接即可与朋友一起分享视频哦!
分享
点赞
收藏
要发弹幕,请先
登录
或
注册
哦!
发送
Erwan Gallen & Eldar Kurtic:使用 vLLM 扩展大模型推理——多加速器部署与量化模型服务
13 · 发布于 2025-06-10 21:25:01
这家伙很懒,一点都不写~
GOSIM 全球开源创新汇
1006粉丝
关注
0条评论
还能输入
1000
个字符
取消回复
发表评论
评论
0条评论