Added uncertainty estimation scripts for ByT5 architecture models #63

haukurb · 2023-11-07T17:29:08Z

No description provided.

HaukurPall · 2023-11-13T14:07:17Z

src/greynirseq/utils/infer_file_byt5.py

+        model = model.train()
+    else:
+        model = model.eval()
+    model = model.to("cuda").half() if use_gpu else model


Er half ok? Þjálfum við með FP16? Ég held að við gerum það en ég veit að upphaflegu líkönin eru með Bfloat16

HaukurPall · 2023-11-13T14:13:09Z

src/greynirseq/utils/score_byt5_uncertainty.py

+MAX_LENGTH = 512
+
+
+def batch_by_n(iterable, batch_size):


þetta fall er skilgreint í hinni skránni líka. Import-a?

HaukurPall · 2023-11-13T14:16:21Z

src/greynirseq/utils/score_byt5_uncertainty.py

+    model = T5ForConditionalGeneration.from_pretrained(str(checkpoint_path))
+    model = model.to("cuda").half() if use_gpu else model
+
+    def prepare_model_inputs(data_lines):


Þetta er líka skilgreint í hinni skránni og mikið af þessum kóða. Er hægt að samnýta?

HaukurPall · 2023-11-13T14:19:02Z

src/greynirseq/utils/score_byt5_uncertainty.py

+                permuted_stds.append(seq_stds)
+
+    # # recover the original order by inverting the length-sorted indices
+    inverse_indices = sorted_indices.argsort().tolist()


Ertu alveg viss?

HaukurPall · 2023-11-13T14:20:22Z

src/greynirseq/utils/score_byt5_uncertainty.py

+            # we need to pass the attention mask to the model (encoder attention mask)
+            encoder_attention_mask = model_inputs["attention_mask"]
+            tgt_ids = prepare_model_inputs(decoded_output)["input_ids"]
+            cpu = torch.device("cpu")


ég vona að þetta sé ekki dýrt kall

Added uncertainty estimation scripts for ByT5 architecture models

8da8305

haukurb assigned HaukurPall Nov 8, 2023

HaukurPall approved these changes Nov 13, 2023

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Added uncertainty estimation scripts for ByT5 architecture models #63

Added uncertainty estimation scripts for ByT5 architecture models #63

haukurb commented Nov 7, 2023

HaukurPall Nov 13, 2023

HaukurPall Nov 13, 2023

HaukurPall Nov 13, 2023

HaukurPall Nov 13, 2023

HaukurPall Nov 13, 2023

Added uncertainty estimation scripts for ByT5 architecture models #63

Are you sure you want to change the base?

Added uncertainty estimation scripts for ByT5 architecture models #63

Conversation

haukurb commented Nov 7, 2023

HaukurPall Nov 13, 2023

Choose a reason for hiding this comment

HaukurPall Nov 13, 2023

Choose a reason for hiding this comment

HaukurPall Nov 13, 2023

Choose a reason for hiding this comment

HaukurPall Nov 13, 2023

Choose a reason for hiding this comment

HaukurPall Nov 13, 2023

Choose a reason for hiding this comment