研究

Resonances AI Lab

我們公開發表 AI 研究成果。

論文

研究論文

Causally Efficient Reasoning via Group Relative Policy Optimization

Resonances AI Lab

Causal ReasoningRLHF
即將發表
筆記

研究筆記

研究筆記與文章正在準備中。

方向

研究方向

01

Causal Reasoning

提升模型對因果關係的推理能力。

02

RLHF

基於人類回饋的強化學習,用於對齊。

03

LLM Training Efficiency

讓大型模型訓練更快、更便宜。

04

AI Alignment

確保 AI 系統符合人類價值觀。