研究

在研 · 过往 · 讲座与客座讲席

在研项目

在研项目仅列出研究方向与合作者;在研期间不公开具体内容。

符号计算 × ML 机理

南京大学 KRistal 课题组 · 导师:赵一铮 副教授 · 2025 年 10 月 - 至今 · 论文投稿中

AI4Math:数学研究协作平台

微软亚洲研究院 (MSRA) · 导师:周子昱 · 2026 年 3 月 - 至今

基于推理的强化学习 Web Agent

慕尼黑大学 (LMU Munich) · 导师:Dr. Yao Zhang · 2025 年 11 月 - 至今

面向智能体的形式方法 × 世界模型

独立研究 · 合作:Dr. Yao Zhang(LMU Munich)· 2026 年 - 至今

智能体 Harness 机理分析

慕尼黑大学 (LMU Munich) · 导师:Dr. Yao Zhang · 2026 年 - 至今

量子玻色编码 × 注意力机制

独立研究 · 合作:Prof. Yuan Liu(NC State)· 2026 年 - 至今

面向偏好对齐的推理增强奖励模型

独立研究 · 导师:Dr. Zhen Han · 2025 年 7 月 - 至今 · 论文撰写中

过往研究经历

基于 LLM 与 Lean4 的交互式定理证明

UIUC ScaleML Lab · 导师:Prof. Tong Zhang · 2025 年 4 - 6 月

  • 问题:LLM 能给出看似合理的证明步骤但缺乏形式化验证,限制了其在数学推理上的可靠性
  • 方法:构建了一个集成 Lean4 与 LLM 的原型,在 MiniF2F 上进行交互式定理证明;带证明状态序列化与闭环精化的双向 (LLM ↔ Lean4) 流水线
  • 成果:可运行原型 + 对常见失败模式(上下文违规、无效步骤建议)的分析,反馈到接口设计

HarmonyOS 智能体基准评测系统

华为 2012 实验室 · 主管:桂剑锋 · 2025 年 7 - 9 月

  • 问题:需要对移动 OS 智能体在多样任务下的推理与适应性进行系统性评测
  • 贡献:共同搭建 IntelliOS-agent 流水线的基准评测基础设施;将 HDC 调试工具与基于 LLM 的推理模块集成,并将 Python 依赖移植到 HarmonyOS
  • 成果:已在华为内部 IntelliOS 项目中部署用于智能体评测

面向机器学习的量子内存架构

北卡罗来纳州立大学 QUEST Lab · 导师:Prof. Yuan Liu · 2024 年 7 - 11 月

  • 问题:用于 ML 工作负载的量子计算硬件缺乏针对量子-经典混合执行优化的内存架构
  • 方法:探索专门面向量子机器学习算法的量子内存设计
  • 贡献:提出了面向量子系统上 ML 工作负载的优化计算架构;合作撰写了一篇论文(后由其他合作者继续推进)

机器学习模型中的对抗性后门

南京大学 COSEC 课题组 · 导师:张源 教授、仲盛 教授 · 2023 年 7 月 - 2024 年 12 月

  • 问题:理解并防御神经网络训练流水线中的后门攻击
  • 贡献:提出了新颖的后门注入利用机制;设计了恶意训练场景下的攻击实验
  • 影响:该工作贡献于课题组在 ML 鲁棒性与可信性方向上的更广泛研究

讲座与客座讲席

讲座

  • 用 GRPO 做强化学习:从 PPO 到组相对策略优化 · NJU AIA,2026 年
  • 从零用 NumPy 搭建神经网络 · NJU AIA,2025 年
  • 从零用 NumPy 搭建神经网络 · NJU AIA,2023 年

客座讲席

  • Lean4 与交互式定理证明 · 离散数学,南京大学 · 2026 年 1 月
  • 网络安全 / 攻防技术 · 南京大学 · 2025 年 12 月