做有意思的事

English

基本信息


我目前是复旦大学数学科学学院信息与计算科学-人工智能双学位在读。同时一直在坚持自学计算机各领域中有意思的内容。
希望能找到自己真正想交叉,想研究的东西。
我想让这个社会变得更好。

我的仓库

  • 以下项目主要由我独立完成,AI 在部分环节作为辅助工具使用;这些工作并非依托实验室或课题组开展。换言之,它们代表了我在缺乏正式科研平台支持的情况下,主动探索、持续学习与独立实现的结果。
    1. TinyLoRA-GRPO-Coder
      我独立复现并开源了《Learning to Reason in 13 Parameters》中 TinyLoRA + GRPO 的核心方法,并将其从数学推理任务迁移到可验证的竞赛编程代码生成。项目以 Qwen2.5-Coder-3B 为基础,在极少可训练参数的设定下,通过真实的 compile-and-run 奖励进行强化学习,而不是依赖静态启发式。我从数据处理、训练流程、多卡适配、奖励设计到评测与验证完整打通了整个 pipeline;这个项目让我系统训练了“从论文到可运行系统”的全流程能力。

    2. KaggleCompetitions
      数个kaggle repo link比赛,广泛了解并使用了各种机器学习工具。

    3. Hone My C Plus Plus
      对于高级算法和mc++的一些探索会在Hone My C Plus Plus

    4. microgpt.cpp
      一个简易的gpt,用300行代码实现。

    5. Baseball
      一个CNN+ResNet18,学好球坏球判断的模型。

    6. Sample Java
      带随机数的算法的精髓在于看似随机,但是每次随机选择都能选的不是很差,是sample的艺术。同时在这我初步浅尝了java,故名曰 Sample Java。
    7. DeepLearning, GenerativeModel, ReinforcementLearning
      这三个仓库是我的学习记录,涵盖了从理论推导到代码复现的过程。
  • 以下项目为我合作完成。
    1. NAD Next 一个面向大模型神经元激活与推理过程的分析框架。项目涵盖激活缓存构建、selector 评估、token-level 统计与可视化。我们希望可以通过COT, Activation, Ensemble方法,去判断一个problem中的run各自的好坏程度。谁会更“对”一些?谁会更“错”?我在该项目中主要贡献是算法构建与方法设计。

      注:该项目目前处于持续开发(WIP)阶段。受现实条件影响,部分内容暂无法立即开源到 GitHub,因此当前公开仓库尚不完整;后续将在条件允许时持续补充并更新完整版本。


社区服务与参与

除个人项目外,我也在参与一些社区导向的开源工作。

  1. FDUGuideBook/nav-site 我持续贡献维护FDUGuideBOOK复旦导航站。

技术栈与工具

领域技能
语言 Python   Node.js   C++   C   Java   Lean 4   ε-N language, ε-δ language
IDE VS Code   📕Draftbooks
操作系统 Windows   Linux
其他 Markdown   LaTeX   Redstone

所行之路

复旦大学数学科学学院

云来山更佳,云去山如画;山因云晦明,云共山高下。