Posts
All the articles I've posted.
-
ICCV2025-Learning to Inference Adaptively for Multimodal Large Language Models
由威斯康星大学麦迪逊分校(University of Wisconsin-Madison)、普渡大学(Purdue University)、香港大学(The …
-
ISOCC20-Efficient TSV Fault Detection Scheme For High Bandwidth Memory Using Pattern Analysis#
高带宽内存(High Bandwidth Memory,HBM)的通道可以通过 128 个数据硅通孔(Through-Silicon Via,TSV)和 16…
-
SOSP25-Robust LLM Training Infrastracture at ByteDance
由香港大学和字节seed联合发布的LLM Traing的可靠性研究,详细介绍了用于支持**大规模 GPU 集群**稳定运行的管理系统 **ByteRobust…
-
API Agent: Embedding, MCP, Skills
Updated:基于 Gemini API Cookbook 的 Agent 实操笔记,梳理 Embedding、Function Calling、MCP、Skills 与编排层关系。
-
CMU-15213-MallocLab
CMU 15-213 课程 Malloc Lab 实验记录,从隐式空闲链表到显式空闲链表实现动态内存分配器,最终得分 85/100。
-
CMU-15213-ShellLab
CMU 15-213 课程 Shell Lab 实验记录,实现带作业控制的 Unix Shell,涉及进程控制、信号处理与并发。
-
Ascend C 算子开发 Part5 PyTorch 算子调用与阶段总结
Ascend C 算子开发第五部分,介绍 PTA 适配框架(torch-npu)与 PyTorch 算子集成方式,并对全系列进行阶段性总结。
-
OSDI18-Ray A Distributed Framework for Emerging AI Applications
OSDI 2018 论文阅读笔记:Ray — 面向新兴 AI 应用的分布式计算框架。