研究
Resonances AI Lab
我們公開發表 AI 研究成果。
論文
研究論文
Causally Efficient Reasoning via Group Relative Policy Optimization
Resonances AI Lab
Causal ReasoningRLHF
筆記
研究筆記
研究筆記與文章正在準備中。
方向
研究方向
01
Causal Reasoning
提升模型對因果關係的推理能力。
02
RLHF
基於人類回饋的強化學習,用於對齊。
03
LLM Training Efficiency
讓大型模型訓練更快、更便宜。
04
AI Alignment
確保 AI 系統符合人類價值觀。