做有意思的事
基本信息
- 中国-上海
- GitHub: Chi-Shan0707
我目前是复旦大学数学科学学院信息与计算科学-人工智能双学位在读。同时一直在坚持自学计算机各领域中有意思的内容。
希望能找到自己真正想交叉,想研究的东西。
我想让这个社会变得更好。
我的仓库
- 以下项目主要由我独立完成,AI 在部分环节作为辅助工具使用;这些工作并非依托实验室或课题组开展。换言之,它们代表了我在缺乏正式科研平台支持的情况下,主动探索、持续学习与独立实现的结果。
TinyLoRA-GRPO-Coder
我独立复现并开源了《Learning to Reason in 13 Parameters》中 TinyLoRA + GRPO 的核心方法,并将其从数学推理任务迁移到可验证的竞赛编程代码生成。项目以 Qwen2.5-Coder-3B 为基础,在极少可训练参数的设定下,通过真实的 compile-and-run 奖励进行强化学习,而不是依赖静态启发式。我从数据处理、训练流程、多卡适配、奖励设计到评测与验证完整打通了整个 pipeline;这个项目让我系统训练了“从论文到可运行系统”的全流程能力。KaggleCompetitions
数个kaggle repo link比赛,广泛了解并使用了各种机器学习工具。Hone My C Plus Plus
对于高级算法和mc++的一些探索会在Hone My C Plus Plus中microgpt.cpp
一个简易的gpt,用300行代码实现。Baseball
一个CNN+ResNet18,学好球坏球判断的模型。- Sample Java
带随机数的算法的精髓在于看似随机,但是每次随机选择都能选的不是很差,是sample的艺术。同时在这我初步浅尝了java,故名曰 Sample Java。 - DeepLearning, GenerativeModel, ReinforcementLearning
这三个仓库是我的学习记录,涵盖了从理论推导到代码复现的过程。
- 以下项目为我合作完成。
- NAD Next 一个面向大模型神经元激活与推理过程的分析框架。项目涵盖激活缓存构建、selector 评估、token-level 统计与可视化。我们希望可以通过COT, Activation, Ensemble方法,去判断一个problem中的run各自的好坏程度。谁会更“对”一些?谁会更“错”?我在该项目中主要贡献是算法构建与方法设计。
注:该项目目前处于持续开发(WIP)阶段。受现实条件影响,部分内容暂无法立即开源到 GitHub,因此当前公开仓库尚不完整;后续将在条件允许时持续补充并更新完整版本。
- NAD Next 一个面向大模型神经元激活与推理过程的分析框架。项目涵盖激活缓存构建、selector 评估、token-level 统计与可视化。我们希望可以通过COT, Activation, Ensemble方法,去判断一个problem中的run各自的好坏程度。谁会更“对”一些?谁会更“错”?我在该项目中主要贡献是算法构建与方法设计。
社区服务与参与
除个人项目外,我也在参与一些社区导向的开源工作。
- FDUGuideBook/nav-site 我持续贡献维护FDUGuideBOOK复旦导航站。
技术栈与工具
| 领域 | 技能 |
|---|---|
| 语言 | |
| IDE | |
| 操作系统 | |
| 其他 |
所行之路
复旦大学数学科学学院
