做有意思的事

English

基本信息

中国-上海
GitHub: Chi-Shan0707

我目前是复旦大学数学科学学院信息与计算科学-人工智能双学位在读。同时一直在坚持自学计算机各领域中有意思的内容。
希望能找到自己真正想交叉，想研究的东西。
我想让这个社会变得更好。

我的仓库

以下项目主要由我独立完成，AI 在部分环节作为辅助工具使用；这些工作并非依托实验室或课题组开展。换言之，它们代表了我在缺乏正式科研平台支持的情况下，主动探索、持续学习与独立实现的结果。
1. TinyLoRA-GRPO-Coder
  我独立复现并开源了《Learning to Reason in 13 Parameters》中 TinyLoRA + GRPO 的核心方法，并将其从数学推理任务迁移到可验证的竞赛编程代码生成。项目以 Qwen2.5-Coder-3B 为基础，在极少可训练参数的设定下，通过真实的 compile-and-run 奖励进行强化学习，而不是依赖静态启发式。我从数据处理、训练流程、多卡适配、奖励设计到评测与验证完整打通了整个 pipeline；这个项目让我系统训练了“从论文到可运行系统”的全流程能力。
2. KaggleCompetitions
  数个kaggle repo link比赛，广泛了解并使用了各种机器学习工具。
3. Hone My C Plus Plus
  对于高级算法和mc++的一些探索会在Hone My C Plus Plus中
4. microgpt.cpp
  一个简易的gpt，用300行代码实现。
5. Baseball
  一个CNN+ResNet18，学好球坏球判断的模型。
6. Sample Java
  带随机数的算法的精髓在于看似随机，但是每次随机选择都能选的不是很差，是sample的艺术。同时在这我初步浅尝了java，故名曰 Sample Java。
7. DeepLearning, GenerativeModel, ReinforcementLearning
  这三个仓库是我的学习记录，涵盖了从理论推导到代码复现的过程。
以下项目为我合作完成。
1. NAD Next 一个面向大模型神经元激活与推理过程的分析框架。项目涵盖激活缓存构建、selector 评估、token-level 统计与可视化。我们希望可以通过COT, Activation, Ensemble方法，去判断一个problem中的run各自的好坏程度。谁会更“对”一些？谁会更“错”？我在该项目中主要贡献是算法构建与方法设计。
  注：该项目目前处于持续开发（WIP）阶段。受现实条件影响，部分内容暂无法立即开源到 GitHub，因此当前公开仓库尚不完整；后续将在条件允许时持续补充并更新完整版本。

社区服务与参与

除个人项目外，我也在参与一些社区导向的开源工作。

FDUGuideBook/nav-site 我持续贡献维护FDUGuideBOOK复旦导航站。

技术栈与工具

领域	技能
语言	Python Node.js C++ C Java Lean 4 ε-N language, ε-δ language
IDE	VS Code 📕Draftbooks
操作系统	Windows Linux
其他	Markdown LaTeX Redstone