Tag: 大模型推理
All the articles with the tag "大模型推理".
-
OSDI24-ServerlessLLM: Low-Latency Serverless Inference for Large Language Models
OSDI 2024 论文阅读笔记:ServerlessLLM — 面向大语言模型的低延迟 Serverless 推理系统。
All the articles with the tag "大模型推理".
OSDI 2024 论文阅读笔记:ServerlessLLM — 面向大语言模型的低延迟 Serverless 推理系统。