4 14 8

ZiYi Yang

AALF

https://github.com/yangzy39

yangzy39

AI & ML interests

None yet

Recent Activity

authored a paper 11 days ago

ThinkSwitcher: When to Think Hard, When to Think Fast

authored a paper 11 days ago

Mutual-Taught for Co-adapting Policy and Reward Models

authored a paper 11 days ago

FuseRL: Dense Preference Optimization for Heterogeneous Model Fusion

View all activity

Organizations

Articles 2

Article

FuseO1-Preview: System-II Reasoning Fusion of LLMs

Article

FuseChat-3.0: Preference Optimization for Implicit Model Fusion

View all Articles

Papers 7

models 7

ZiYi Yang

AI & ML interests

Recent Activity

Organizations

Articles 2

FuseO1-Preview: System-II Reasoning Fusion of LLMs

FuseChat-3.0: Preference Optimization for Implicit Model Fusion

Papers 7

models 7

AALF/FuseR1-QwQ-R1-TinyR1-32B

AALF/FuseR1-QwQ-R1-LightR1-32B

AALF/FuseR1-QwQ-R1-32B

AALF/FuseR1-QwQ-R1-LightR1-TinyR1-32B

AALF/gemma-2-27b-it-SimPO-37K

AALF/gemma-2-27b-it-SimPO-37K-100steps

AALF/llama-3-8b-Instruct-simpo-beta10-gamma3-lr1e-6

datasets 1

AALF/ultrafeedback_wrpo

ZiYi Yang

AI & ML interests

Recent Activity

Organizations

Articles 2

FuseO1-Preview: System-II Reasoning Fusion of LLMs

FuseChat-3.0: Preference Optimization for Implicit Model Fusion

Papers 7

models 7 Sort: Recently updated

datasets 1

models 7