LLM Tuning - a danielz01 Collection

danielz01 's Collections

VLFM

Agents

Image Generation

ViT

LLM Tuning

updated Jan 30, 2024

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18, 2024 • 152
Tuning Language Models by Proxy

Paper • 2401.08565 • Published Jan 16, 2024 • 24
ReFT: Reasoning with Reinforced Fine-Tuning

Paper • 2401.08967 • Published Jan 17, 2024 • 32
Rephrasing the Web: A Recipe for Compute and Data-Efficient Language Modeling

Paper • 2401.16380 • Published Jan 29, 2024 • 51