Tag: 论文阅读
All the articles with the tag "论文阅读".
-
ICCV2025-Learning to Inference Adaptively for Multimodal Large Language Models
由威斯康星大学麦迪逊分校(University of Wisconsin-Madison)、普渡大学(Purdue University)、香港大学(The …
-
SOSP25-Robust LLM Training Infrastracture at ByteDance
由香港大学和字节seed联合发布的LLM Traing的可靠性研究,详细介绍了用于支持**大规模 GPU 集群**稳定运行的管理系统 **ByteRobust…
-
OSDI18-Ray A Distributed Framework for Emerging AI Applications
OSDI 2018 论文阅读笔记:Ray — 面向新兴 AI 应用的分布式计算框架。
-
OSDI24-ServerlessLLM: Low-Latency Serverless Inference for Large Language Models
OSDI 2024 论文阅读笔记:ServerlessLLM — 面向大语言模型的低延迟 Serverless 推理系统。
-
SOSP24-Tiered Memory Management: Access Latency is the Key!
SOSP 2024 论文阅读笔记:Colloid — 分层内存管理中基于访问延迟的热页面负载均衡机制。