Do interesting things

English

Basic Info


我目前就读于复旦大学数学科学学院,修读信息与计算科学及人工智能双学位。
同时,我一直在积极自学计算机科学领域的各种有趣课题。
我在探索自己真正想要从事和研究的交叉方向。
做对人类有益的事。

My research interests

目前,我正在探索大模型与序列决策(sequential decision-making)中“智能涌现”的数理基础。更具体地说,面对关于 AI 信任的探讨,我不满足于模糊的哲学思辨,而是希望建立在数理解释性(mathematical interpretability)的根基之上,并通过强化学习(Reinforcement Learning)相关方法去进一步深入。
我的motivation,参见 plan 页面。

我乐于构建小而完整的研究系统、撰写技术笔记,将模糊的想法转化为可运行的成果。


code-not-text

手工设计的 CoT 表面特征存在跨领域局限性;预测数学正确率达到 0.958 的同一组 CoT 特征,在代码领域只是噪声(0.434)。 查看 demo 这里~

概述 通过五个手工设计的特征(token 置信度、轨迹连续性、反思次数、新颖性、神经元宽度),仅从推理轨迹本身即可预测答案正确性。在 31,040 次运行、覆盖三个领域的数据上:
*数学 (AIME, HMMT) AoA 0.958 — 仅需轨迹前 10% 即可达到信号*
*科学 (GPQA) AoA 0.799 — 置信度起主要作用,而非结构*
*编程 (LiveCodeBench) AoA 0.434 — 低于 token 置信度基线*
这不是特征工程问题。我扫描了 83 个以上的编程领域标量特征、添加了 SSL 预训练、非线性 MLP、去结(de-knotting)以及编程专用运行判别器——全部失败。这些特征在数学领域度量的是推理质量,在编程领域却仅能度量文本流畅度:这是一个测量不变性失效问题。正确性存在于运行时(runtime)中,而非文本中。

TinyLoRA-GRPO-Coder

面向代码生成的低参数微调与强化学习。

概述 对 [Learning to Reason in 13 Parameters](https://arxiv.org/abs/2602.04118) 中的 TinyLoRA + GRPO 进行独立开源复现与适配,从数学推理迁移至可验证的竞技编程代码生成。基于 Qwen2.5-Coder-3B,仅使用极少共享可训练参数,采用真实编译运行奖励而非静态启发式。我独立完成了从数据处理、训练、多 GPU 配置、奖励设计、评估到验证的全流程,显著提升了我将论文转化为可运行研究系统的能力。

microgpt.cpp

从第一性原理出发,用 C++ 实现的极简 GPT

概述 从第一性原理出发,用 C++ 实现的极简 GPT,旨在不依赖高层框架的情况下理解模型内部机制。

SVDomain

一个面向思维链分析的领域条件低秩框架。

概述 SVDomain 是一个领域条件低秩框架,从 token 级别的置信度与不确定性统计、轨迹摘要和可用性指标构建特征视图,并通过轻量线性读出学习共享潜基。 - 标准流程:StandardScaler → TruncatedSVD → LogisticRegression - 下游任务:EarlyStop、Best-of-N 桥接、RL 检查点排序。 - 重点:低秩结构何时变得具有预测性、基如何在不同锚点间迁移,以及同一个低秩对象如何同时支持预测与解释。 该仓库包含论文式技术文档以及可复现实验与分析的代码。

该项目为合作完成。合作者提供了元级原始数据基础;我提出了框架,设计并完成了实验,进行了验证。


Service and Community Involvement

除了个人项目之外,我也参与面向社区的公益性开源工作。

  1. github-unflag-playbook-cn
    查看 网站 这里 ~~~
    面向中国大陆开发者的 GitHub 账号 flagged / hidden 自救手册与案例档案,系统整理申诉流程与案例。
  2. FDUGuideBook/nav-site
    访问 网站 这里
    持续为复旦社区贡献导航网站。

Tech stack and tools

DomainSkills
Language Python   Node.js   C++   C   Java   Lean 4   ε-N language, ε-δ language
IDE VS Code   📕Draftbooks
OS Windows   Linux
Other Markdown   LaTeX   Redstone

Education

School of Mathematical Sciences, Fudan University

云来山更佳,云去山如画;
山因云晦明,云山共高下。