Archives
All the articles I've archived.
-
ICCV2025-Learning to Inference Adaptively for Multimodal Large Language Models
由威斯康星大学麦迪逊分校(University of Wisconsin-Madison)、普渡大学(Purdue University)、香港大学(The …
-
ISOCC20-Efficient TSV Fault Detection Scheme For High Bandwidth Memory Using Pattern Analysis#
高带宽内存(High Bandwidth Memory,HBM)的通道可以通过 128 个数据硅通孔(Through-Silicon Via,TSV)和 16…
-
SOSP25-Robust LLM Training Infrastracture at ByteDance
由香港大学和字节seed联合发布的LLM Traing的可靠性研究,详细介绍了用于支持**大规模 GPU 集群**稳定运行的管理系统 **ByteRobust…
-
API Agent: Embedding, MCP, Skills
Updated:基于 Gemini API Cookbook 的 Agent 实操笔记,梳理 Embedding、Function Calling、MCP、Skills 与编排层关系。
-
CMU-15213-MallocLab
CMU 15-213 课程 Malloc Lab 实验记录,从隐式空闲链表到显式空闲链表实现动态内存分配器,最终得分 85/100。
-
CMU-15213-ShellLab
CMU 15-213 课程 Shell Lab 实验记录,实现带作业控制的 Unix Shell,涉及进程控制、信号处理与并发。
-
Ascend C 算子开发 Part5 PyTorch 算子调用与阶段总结
Ascend C 算子开发第五部分,介绍 PTA 适配框架(torch-npu)与 PyTorch 算子集成方式,并对全系列进行阶段性总结。
-
OSDI18-Ray A Distributed Framework for Emerging AI Applications
OSDI 2018 论文阅读笔记:Ray — 面向新兴 AI 应用的分布式计算框架。
-
OSDI24-ServerlessLLM: Low-Latency Serverless Inference for Large Language Models
OSDI 2024 论文阅读笔记:ServerlessLLM — 面向大语言模型的低延迟 Serverless 推理系统。
-
CMU-15213-CacheLab
CMU 15-213 课程 Cache Lab 实验记录,实现缓存模拟器与矩阵转置优化,深入理解缓存命中率与分块策略。
-
Ascend C 算子开发 Part4 算子调用与测试
Ascend C 算子开发第四部分,讲解自定义算子的两种调用方式及对应测试方法。
-
Ascend C 算子开发 Part3 算子交付件与算子工程
Ascend C 算子开发第三部分,介绍 HOST/DEVICE 交付件结构、编译工作流与算子工程组织方式。
-
CMU-15213-ArchitectureLab
CMU 15-213 课程 Architecture Lab 实验记录,基于 Y86-64 指令集实现流水线处理器的设计与优化。
-
Ascend C 算子开发 Part2 Tiling 计算与调试
Ascend C 算子开发第二部分,深入讲解 Tiling 计算模式、数据切分策略与算子调试方法。
-
CMU-15213-AttackLab
CMU 15-213 课程 Attack Lab 实验记录,涉及缓冲区溢出攻击、ROP 等系统安全技术。
-
CMU-15213-BombLab
CMU 15-213 课程 Bomb Lab 实验笔记,通过反汇编与 GDB 调试破解六个关卡。
-
Ascend C 算子开发 Part1 基本概念
华为 Ascend C 算子开发系列第一部分,介绍 CANN 架构、Ascend C 编程模型及基本概念。
-
SOSP24-Tiered Memory Management: Access Latency is the Key!
SOSP 2024 论文阅读笔记:Colloid — 分层内存管理中基于访问延迟的热页面负载均衡机制。
-
使用OneDrive的三年经验与不得不知的警告
三年 OneDrive 使用经验总结与重要警告,包括文件同步陷阱、数据丢失风险及最佳实践。
-
PGStudy-EA and GA
研究生课程学习笔记:进化算法(EA)与遗传算法(GA)的核心概念,覆盖表示法、亲本选择、重组变异与生存选择,并以 TSP 问题为例实践。
-
PGStudy-群体人工智能Part1-PSO
群体人工智能研究笔记第一部分:粒子群优化算法 (PSO) 的原理、数学模型与应用。
-
算法数论基础
算法竞赛中常用的数论基础知识总结,包括快速幂、GCD、素数筛、欧拉函数等核心算法。