Upload MolmoForConditionalGeneration

Browse files

Files changed (10) hide show

config.json +55 -7
generation_config.json +1 -1
model-00001-of-00007.safetensors +3 -0
model-00002-of-00007.safetensors +3 -0
model-00003-of-00007.safetensors +3 -0
model-00004-of-00007.safetensors +3 -0
model-00005-of-00007.safetensors +3 -0
model-00006-of-00007.safetensors +3 -0
model-00007-of-00007.safetensors +3 -0
model.safetensors.index.json +0 -0

config.json CHANGED Viewed

@@ -1,28 +1,76 @@
 {
-  "_name_or_path": "/raid/pablo/Molmo-7B-D-hf-modular",
   "architectures": [
     "MolmoForConditionalGeneration"
   ],
   "image_token_index": 152069,
   "initializer_range": 0.02,
   "model_type": "molmo",
   "pooling_config": {
-    "model_type": ""
   },
   "text_config": {
     "attention_bias": true,
     "model_type": "molmo_text",
     "use_attention_layer_norm": false,
-    "use_postnorm": false
   },
-  "torch_dtype": "bfloat16",
-  "transformers_version": "4.48.0.dev0",
   "vision_config": {
-    "model_type": "molmo_vision_model"
   },
   "vision_feature_layers": [
     -2,
     -9
   ],
-  "vision_feature_select_strategy": "default"
 }

 {
   "architectures": [
     "MolmoForConditionalGeneration"
   ],
   "image_token_index": 152069,
   "initializer_range": 0.02,
   "model_type": "molmo",
+  "pad_token_id": 152070,
   "pooling_config": {
+    "attention_dropout": 0.0,
+    "head_dim": 64,
+    "hidden_size": 2048,
+    "image_feature_dropout": 0.0,
+    "image_num_patches": 24,
+    "image_padding_embed": "pad_and_partial_pad",
+    "image_pooling_type": "attention_meanq",
+    "initializer_range": 0.02,
+    "model_type": "",
+    "num_attention_heads": 16,
+    "num_key_value_heads": 16,
+    "pad_embed_dim": 2048,
+    "pooling_height": 2,
+    "pooling_width": 2,
+    "projector_hidden_act": "silu",
+    "text_hidden_size": 3584,
+    "text_intermediate_size": 37888
   },
   "text_config": {
+    "additional_embedding_size": 0,
     "attention_bias": true,
+    "attention_dropout": 0.0,
+    "head_dim": 128,
+    "hidden_act": "swiglu",
+    "hidden_size": 3584,
+    "initializer_range": 0.02,
+    "intermediate_size": 37888,
+    "layer_norm_eps": 1e-06,
+    "max_position_embeddings": 4096,
     "model_type": "molmo_text",
+    "num_attention_heads": 28,
+    "num_hidden_layers": 28,
+    "num_key_value_heads": 4,
+    "pad_token_id": 152070,
+    "rope_scaling": null,
+    "rope_theta": 1000000.0,
+    "sliding_window": 4096,
     "use_attention_layer_norm": false,
+    "use_cache": true,
+    "use_postnorm": false,
+    "use_qk_norm": false,
+    "vocab_size": 152071
   },
+  "torch_dtype": "float32",
+  "transformers_version": "4.52.0.dev0",
   "vision_config": {
+    "attention_dropout": 0.0,
+    "hidden_act": "quick_gelu",
+    "hidden_size": 1024,
+    "image_size": 576,
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "layer_norm_eps": 1e-05,
+    "model_type": "molmo_vision_model",
+    "num_attention_heads": 16,
+    "num_hidden_layers": 23,
+    "num_image_positions": 577,
+    "num_key_value_heads": 16,
+    "patch_size": 14
   },
   "vision_feature_layers": [
     -2,
     -9
   ],
+  "vision_feature_select_strategy": "default",
+  "vocab_size": 152071
 }

generation_config.json CHANGED Viewed

@@ -1,4 +1,4 @@
 {
   "_from_model_config": true,
-  "transformers_version": "4.48.0.dev0"
 }

 {
   "_from_model_config": true,
+  "transformers_version": "4.52.0.dev0"
 }

model-00001-of-00007.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:33faa9d5db45f207158c24765c462c07d9f523b5f4aabb56a4abab5f7b415790
+size 4936632760

model-00002-of-00007.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:377183545865d53632f4c5b6d045085cb9a705fea5150279f48de09b904d48d7
+size 4998852560

model-00003-of-00007.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c3025afae405d5aafc22d08568f5800610ed89b092fbedb1afba59a4d0705888
+size 4712543208

model-00004-of-00007.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a30711525d2912e5fcc45d8b6c6d6b36a5fb893392e9aa46ed94107ed3af6cc3
+size 4661162896

model-00005-of-00007.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:18ee25ec0d9b67899e3e0fb30975a72607bb4a0345382c778a7d412cdd31df6a
+size 4661162896

model-00006-of-00007.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dea8f823824d5bf72ef143d34ae864784cacf767daa0bd7471c456e19975c8e4
+size 4661162896

model-00007-of-00007.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f0c5aeae04bed3bdec13feab3e9880bb2b12d274f83958927678244b7b55743f
+size 3451041816

model.safetensors.index.json CHANGED Viewed

The diff for this file is too large to render. See raw diff