Posts
All the articles I've posted.
-
OSDI24-ServerlessLLM: Low-Latency Serverless Inference for Large Language Models
OSDI 2024 论文阅读笔记:ServerlessLLM — 面向大语言模型的低延迟 Serverless 推理系统。
-
CMU-15213-CacheLab
CMU 15-213 课程 Cache Lab 实验记录,实现缓存模拟器与矩阵转置优化,深入理解缓存命中率与分块策略。
-
Ascend C 算子开发 Part4 算子调用与测试
Ascend C 算子开发第四部分,讲解自定义算子的两种调用方式及对应测试方法。
-
Ascend C 算子开发 Part3 算子交付件与算子工程
Ascend C 算子开发第三部分,介绍 HOST/DEVICE 交付件结构、编译工作流与算子工程组织方式。
-
CMU-15213-ArchitectureLab
CMU 15-213 课程 Architecture Lab 实验记录,基于 Y86-64 指令集实现流水线处理器的设计与优化。
-
Ascend C 算子开发 Part2 Tiling 计算与调试
Ascend C 算子开发第二部分,深入讲解 Tiling 计算模式、数据切分策略与算子调试方法。
-
CMU-15213-AttackLab
CMU 15-213 课程 Attack Lab 实验记录,涉及缓冲区溢出攻击、ROP 等系统安全技术。
-
CMU-15213-BombLab
CMU 15-213 课程 Bomb Lab 实验笔记,通过反汇编与 GDB 调试破解六个关卡。