👤 导师介绍
Daodao 老师
Research Scientist
10+ 篇
顶会一作 / 共一
5+ 篇
指导学生中稿
🎓
教育背景:新加坡 Top 2 博士,国内 Top 高校本科
🔬
研究方向:LLM / VLM · 模型推理 / 安全 / 多语言 · 多 Agent 系统 · 模型自我演化 · 医疗 / 图片编辑
💼
工业经验:现任 硅谷大厂 Research Scientist;曾主导国内大厂大模型基模与后训练
🏆
学术成就:近三年一作 / 共一在 NeurIPS, ICML, ICLR, ACL, EMNLP, NAACL 发表 10+ 篇;担任 TPAMI, COLM, AAAI, IJCAI 等顶会 / 顶刊审稿人
🎯 招生方向
LLM 推理
VLM
RL 训练
模型安全
多语言
模型对齐
多 Agent
Agent 训练
自我演化
医疗 AI
图片编辑
📋 开放课题 · 5 个即取即跑
1
SFT × RL 交替训练范式与工具使用能力
探索交替使用 SFT(Supervised Fine-Tuning) 与 RL(Reinforcement Learning) 的训练范式,提升 LLM 的工具(tool)使用能力,并研究其在训练中避免 / 走出 "entropy 陷阱" 的机制与方法。
2
多语言场景下的工具使用能力与对齐增强
系统研究大模型在多语言场景下的工具使用能力,探索面向特定语言与任务的 对齐(alignment) 与 增强(augmentation) 策略,以提升跨语言工具调用的鲁棒性与泛化能力。
3
重复数据对模型训练的影响与能力诱导
研究 重复数据(duplicate/repeated data) 对模型训练效果与能力形成的影响;探讨能否通过"相同数据"诱导模型习得不同能力,以及其背后的条件与可控因素。
4
RL 对模型推理长度的可控调节
研究使用 强化学习 对模型 推理长度(reasoning length) 进行可控调节的方法,在保证任务性能的前提下,实现更稳定、可预测的长度控制与计算开销管理。
5
模型社会性与自我意识的产生机制
探索模型 社会性(sociality) 与 自我意识(self-awareness) 等表征 / 行为的产生机制,研究其形成条件、评测方法与潜在影响因素。
🎯 目标刊物
目标刊物 / 会议
🔧
没有心仪的课题?导师可针对性定制
以上 5 个课题都不切中你的方向?Daodao 老师可根据你的背景与兴趣定制专属课题,配套参考文献、创新路线与代码骨架。
🚀 Plan 已就绪 · 即取即跑
不必从头想 idea,顶会级课题框架 + 代码骨架已搭建完毕。
有强推进力的硕博同学,欢迎私信咨询。
有强推进力的硕博同学,欢迎私信咨询。
📩 私信咨询 · 限 2 名