9 18 9

Yuchen Yan

yanyc

AI & ML interests

None yet

Recent Activity

upvoted a paper 19 days ago

Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models

commented on a paper 20 days ago

Cooper: Co-Optimizing Policy and Reward Models in Reinforcement Learning for Large Language Models

commented on a paper 21 days ago

Test-Time Reinforcement Learning for GUI Grounding via Region Consistency

View all activity

Organizations

upvoted a paper 19 days ago

Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models

Paper • 2508.09138 • Published 21 days ago • 36

commented a paper 20 days ago

Cooper: Co-Optimizing Policy and Reward Models in Reinforcement Learning for Large Language Models

Paper • 2508.05613 • Published 26 days ago • 17 •

commented a paper 21 days ago

Test-Time Reinforcement Learning for GUI Grounding via Region Consistency

Paper • 2508.05615 • Published 26 days ago • 21 •

liked 2 models 21 days ago

inclusionAI/Ling-lite-1.5-2507

Text Generation • 17B • Updated 23 days ago • 465 • 71

inclusionAI/Ring-lite-2507

17B • Updated 28 days ago • 158 • 51

liked a dataset 22 days ago

wangzx1210/OmniEAR

Viewer • Updated 25 days ago • 30.2k • 427 • 10

authored 3 papers 22 days ago

Cooper: Co-Optimizing Policy and Reward Models in Reinforcement Learning for Large Language Models

Paper • 2508.05613 • Published 26 days ago • 17

OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks

Paper • 2508.05614 • Published 26 days ago • 19

Test-Time Reinforcement Learning for GUI Grounding via Region Consistency

Paper • 2508.05615 • Published 26 days ago • 21

upvoted 2 papers 22 days ago

Cooper: Co-Optimizing Policy and Reward Models in Reinforcement Learning for Large Language Models

Paper • 2508.05613 • Published 26 days ago • 17

Test-Time Reinforcement Learning for GUI Grounding via Region Consistency

Paper • 2508.05615 • Published 26 days ago • 21

upvoted a paper 23 days ago

OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks

Paper • 2508.05614 • Published 26 days ago • 19

liked a model 28 days ago

openai/gpt-oss-120b

Text Generation • 120B • Updated 7 days ago • 2.56M • • 3.7k

liked a dataset about 1 month ago

jiangjin/LogicPro

Viewer • Updated Jul 29 • 422k • 199 • 6

upvoted a paper about 1 month ago

MathFimer: Enhancing Mathematical Reasoning by Expanding Reasoning Steps through Fill-in-the-Middle Task

Paper • 2502.11684 • Published Feb 17 • 2

authored 2 papers about 1 month ago

LAPO: Internalizing Reasoning Efficiency via Length-Adaptive Policy Optimization

Paper • 2507.15758 • Published Jul 21 • 34

Hierarchical Budget Policy Optimization for Adaptive Reasoning

Paper • 2507.15844 • Published Jul 21 • 16

upvoted 3 papers about 1 month ago

Hierarchical Budget Policy Optimization for Adaptive Reasoning

Paper • 2507.15844 • Published Jul 21 • 16

GUI-G^2: Gaussian Reward Modeling for GUI Grounding

Paper • 2507.15846 • Published Jul 21 • 131

LAPO: Internalizing Reasoning Efficiency via Length-Adaptive Policy Optimization

Paper • 2507.15758 • Published Jul 21 • 34

Yuchen Yan

AI & ML interests

Recent Activity

Organizations

yanyc's activity