Daodao 老师 · LLM/VLM 顶会课题招生

👤 导师介绍

Daodao 老师 Research Scientist

10+ 篇

顶会一作 / 共一

5+ 篇

指导学生中稿

🎓

教育背景：新加坡 Top 2 博士，国内 Top 高校本科

🔬

研究方向：LLM / VLM · 模型推理 / 安全 / 多语言 · 多 Agent 系统 · 模型自我演化 · 医疗 / 图片编辑

💼

工业经验：现任硅谷大厂 Research Scientist；曾主导国内大厂大模型基模与后训练

🏆

学术成就：近三年一作 / 共一在 NeurIPS, ICML, ICLR, ACL, EMNLP, NAACL 发表 10+ 篇；担任 TPAMI, COLM, AAAI, IJCAI 等顶会 / 顶刊审稿人

🎯 招生方向 LLM 推理 VLM RL 训练模型安全多语言模型对齐多 Agent Agent 训练自我演化医疗 AI 图片编辑

📋 开放课题 · 5 个即取即跑

SFT × RL 交替训练范式与工具使用能力

探索交替使用 SFT（Supervised Fine-Tuning） 与 RL（Reinforcement Learning） 的训练范式，提升 LLM 的工具（tool）使用能力，并研究其在训练中避免 / 走出 "entropy 陷阱" 的机制与方法。

多语言场景下的工具使用能力与对齐增强

系统研究大模型在多语言场景下的工具使用能力，探索面向特定语言与任务的 对齐（alignment） 与 增强（augmentation） 策略，以提升跨语言工具调用的鲁棒性与泛化能力。

重复数据对模型训练的影响与能力诱导

研究 重复数据（duplicate/repeated data） 对模型训练效果与能力形成的影响；探讨能否通过"相同数据"诱导模型习得不同能力，以及其背后的条件与可控因素。

RL 对模型推理长度的可控调节

研究使用 强化学习 对模型 推理长度（reasoning length） 进行可控调节的方法，在保证任务性能的前提下，实现更稳定、可预测的长度控制与计算开销管理。

模型社会性与自我意识的产生机制

探索模型 社会性（sociality） 与 自我意识（self-awareness） 等表征 / 行为的产生机制，研究其形成条件、评测方法与潜在影响因素。

🎯 目标刊物

目标刊物 / 会议

AAAI MM EMNLP NAACL IJCAI COLM

🔧

没有心仪的课题？导师可针对性定制

以上 5 个课题都不切中你的方向？Daodao 老师可根据你的背景与兴趣定制专属课题，配套参考文献、创新路线与代码骨架。

🚀 Plan 已就绪 · 即取即跑

不必从头想 idea，顶会级课题框架 + 代码骨架已搭建完毕。
有强推进力的硕博同学，欢迎私信咨询。

📩 私信咨询 · 限 2 名

Daodao 老师 · 顶会课题