Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2506.09967

I add and I forget to read

LLM-Pruner: On the Structural Pruning of Large Language Models

Paper • 2305.11627 • Published May 19, 2023 • 3
Adapt-Pruner: Adaptive Structural Pruning for Efficient Small Language Model Training

Paper • 2502.03460 • Published Feb 5
Pruning as a Domain-specific LLM Extractor

Paper • 2405.06275 • Published May 10, 2024 • 1
KnowTuning: Knowledge-aware Fine-tuning for Large Language Models

Paper • 2402.11176 • Published Feb 17, 2024 • 2

s3: You Don't Need That Much Data to Train a Search Agent via RL

Paper • 2505.14146 • Published May 20 • 18
Vibe Coding vs. Agentic Coding: Fundamentals and Practical Implications of Agentic AI

Paper • 2505.19443 • Published May 26 • 15
ARM: Adaptive Reasoning Model

Paper • 2505.20258 • Published May 26 • 45
Enigmata: Scaling Logical Reasoning in Large Language Models with Synthetic Verifiable Puzzles

Paper • 2505.19914 • Published May 26 • 44

Interpretability

I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 121
Truth Neurons

Paper • 2505.12182 • Published May 18 • 8
Resa: Transparent Reasoning Models via SAEs

Paper • 2506.09967 • Published Jun 11 • 22

Resa: Transparent Reasoning Models via SAEs

Paper • 2506.09967 • Published Jun 11 • 22
Gemma Scope: Open Sparse Autoencoders Everywhere All At Once on Gemma 2

Paper • 2408.05147 • Published Aug 9, 2024 • 41
Train Sparse Autoencoders Efficiently by Utilizing Features Correlation

Paper • 2505.22255 • Published May 28 • 25
I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 121

Reasoning Language Models

Tina: Tiny Reasoning Models via LoRA

Paper • 2504.15777 • Published Apr 22 • 56
Resa: Transparent Reasoning Models via SAEs

Paper • 2506.09967 • Published Jun 11 • 22

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18, 2024 • 152
Orion-14B: Open-source Multilingual Large Language Models

Paper • 2401.12246 • Published Jan 20, 2024 • 14
MambaByte: Token-free Selective State Space Model

Paper • 2401.13660 • Published Jan 24, 2024 • 61
MM-LLMs: Recent Advances in MultiModal Large Language Models

Paper • 2401.13601 • Published Jan 24, 2024 • 49

I add and I forget to read

LLM-Pruner: On the Structural Pruning of Large Language Models

Paper • 2305.11627 • Published May 19, 2023 • 3
Adapt-Pruner: Adaptive Structural Pruning for Efficient Small Language Model Training

Paper • 2502.03460 • Published Feb 5
Pruning as a Domain-specific LLM Extractor

Paper • 2405.06275 • Published May 10, 2024 • 1
KnowTuning: Knowledge-aware Fine-tuning for Large Language Models

Paper • 2402.11176 • Published Feb 17, 2024 • 2

Resa: Transparent Reasoning Models via SAEs

Paper • 2506.09967 • Published Jun 11 • 22
Gemma Scope: Open Sparse Autoencoders Everywhere All At Once on Gemma 2

Paper • 2408.05147 • Published Aug 9, 2024 • 41
Train Sparse Autoencoders Efficiently by Utilizing Features Correlation

Paper • 2505.22255 • Published May 28 • 25
I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 121

s3: You Don't Need That Much Data to Train a Search Agent via RL

Paper • 2505.14146 • Published May 20 • 18
Vibe Coding vs. Agentic Coding: Fundamentals and Practical Implications of Agentic AI

Paper • 2505.19443 • Published May 26 • 15
ARM: Adaptive Reasoning Model

Paper • 2505.20258 • Published May 26 • 45
Enigmata: Scaling Logical Reasoning in Large Language Models with Synthetic Verifiable Puzzles

Paper • 2505.19914 • Published May 26 • 44

Reasoning Language Models

Tina: Tiny Reasoning Models via LoRA

Paper • 2504.15777 • Published Apr 22 • 56
Resa: Transparent Reasoning Models via SAEs

Paper • 2506.09967 • Published Jun 11 • 22

Interpretability

I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 121
Truth Neurons

Paper • 2505.12182 • Published May 18 • 8
Resa: Transparent Reasoning Models via SAEs

Paper • 2506.09967 • Published Jun 11 • 22

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18, 2024 • 152
Orion-14B: Open-source Multilingual Large Language Models

Paper • 2401.12246 • Published Jan 20, 2024 • 14
MambaByte: Token-free Selective State Space Model

Paper • 2401.13660 • Published Jan 24, 2024 • 61
MM-LLMs: Recent Advances in MultiModal Large Language Models

Paper • 2401.13601 • Published Jan 24, 2024 • 49

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs