Deepcity
RSS Feed你好!我是 Deepcity,一名计算机科学学习者与开发者。
我对系统软件、分布式系统、AI 基础设施和算法有浓厚兴趣。 这里是我的学习笔记与论文阅读记录,涵盖 CMU 15-213 实验、OSDI/SOSP 论文解读、Ascend C 算子开发等内容。
🔬 研究兴趣
系统与体系结构
操作系统、异构内存管理、分层存储优化
分布式系统
分布式计算框架 (Ray)、Serverless 推理
AI 基础设施
LLM 推理优化、Ascend C 算子开发
算法与数学
数论、群体智能优化算法 (PSO)
📄 最近发布
-
CMU-15213-MallocLab
CMU 15-213 课程 Malloc Lab 实验记录,从隐式空闲链表到显式空闲链表实现动态内存分配器,最终得分 85/100。
-
CMU-15213-ShellLab
CMU 15-213 课程 Shell Lab 实验记录,实现带作业控制的 Unix Shell,涉及进程控制、信号处理与并发。
-
Ascend C 算子开发 Part5 PyTorch 算子调用与阶段总结
Ascend C 算子开发第五部分,介绍 PTA 适配框架(torch-npu)与 PyTorch 算子集成方式,并对全系列进行阶段性总结。
-
OSDI18-Ray A Distributed Framework for Emerging AI Applications
OSDI 2018 论文阅读笔记:Ray — 面向新兴 AI 应用的分布式计算框架。
-
OSDI24-ServerlessLLM: Low-Latency Serverless Inference for Large Language Models
OSDI 2024 论文阅读笔记:ServerlessLLM — 面向大语言模型的低延迟 Serverless 推理系统。