Skip to content

大模型系统与工程

课程信息

课程规划

第一周:课程介绍

第三周:

小作业1发布

8个人一组,每个人审稿一篇论文,每组审稿全部的8篇论文。 (可以少于8人一组,但需审稿8篇论文) 此次组队和参与项目无关。

审稿的论文列表见审稿论文列表

审稿的要求见 Assignment 1: 论文审稿

审稿模板已附于作业提交网址

阅读论文发布

抽取同学汇报+论文介绍

王梓博,周宇航介绍研究内容

基于内存池优化的LLM推理系统(汇报人:王梓博)📊 Slides1 📊 Slides2

面向Ascend芯片的大规模模型训练性能剖析与系统优化 (汇报人:周宇航) 📊 Slides1 📊 Slides2

论文列表

研究内容和项目

  1. 大模型在通信中的应用(彭于波)
  2. 基于内存池优化的LLM推理系统(王梓博)
  3. 大模型训练与推理性能优化(周宇航)
  4. 基于大型语言模型的现实世界系统中的安全(徐闽泽)
  5. 近似最邻近搜索在大模型中的应用(陈力峥)

学术诚信

本课程严格遵守学术诚信原则,学术不端行为,如抄袭公开发表的论文,将直接挂科。

其他相关课程

可以看stanford的网课cs336