samkeet
/

GPT_124M

samkeet commited on Feb 1

Commit

387ea7d

verified ·

1 Parent(s): 48107dd

GitHub Link

Files changed (1) hide show

README.md CHANGED Viewed

@@ -51,6 +51,7 @@ GPT-124M is a decoder-only transformer model based on OpenAI’s GPT-2 architect
 - **Paper:** [Training Compute-Optimal Large Language Models](https://arxiv.org/pdf/2203.15556)
 - **Video:** [Andrej Karpathy-Let's reproduce GPT-2 (124M)](https://youtu.be/l8pRSuU81PU?si=KAo1y9dHYQAGJmj5)
 - **Demo:** [GPT 124M Demo](https://huggingface.co/spaces/samkeet/GPT_124M)
 ## Model Details

 - **Paper:** [Training Compute-Optimal Large Language Models](https://arxiv.org/pdf/2203.15556)
 - **Video:** [Andrej Karpathy-Let's reproduce GPT-2 (124M)](https://youtu.be/l8pRSuU81PU?si=KAo1y9dHYQAGJmj5)
 - **Demo:** [GPT 124M Demo](https://huggingface.co/spaces/samkeet/GPT_124M)
+- **GitHub:** [SamkeetSangai/GPT_124M](https://github.com/SamkeetSangai/GPT_124M)
 ## Model Details