Spaces:

TiberiuCristianLeon
/

StreamlitTranslate

Running

App Files Files

TiberiuCristianLeon commited on 22 days ago

Commit

8de4060

verified ·

1 Parent(s): 18293ea

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -8

app.py CHANGED Viewed

@@ -69,16 +69,16 @@ class Translators:
         # model = AutoModel.from_pretrained(self.model_name, trust_remote_code=True)
         # model.half() # recommended for GPU
         model.eval()
-        model.float()
         # Translating from one or several sentences to a sole language
         src_tokens = tokenizer.encode_source_tokens_to_input_ids(self.input_text, target_language=self.tl)
         # src_tokens may be a torch.Tensor or dict depending on tokenizer; ensure it's a tensor
-        if isinstance(src_tokens, torch.Tensor):
-            src_tokens = src_tokens.to(self.device)
-        else:
-            # if tokenizer returns dict-like inputs (input_ids, attention_mask)
-            for k, v in src_tokens.items():
-                src_tokens[k] = v.to(self.device)
         # src_tokens = src_tokens.to(self.device)
         # generated_tokens = model.generate(src_tokens)
         # return tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]
@@ -86,7 +86,7 @@ class Translators:
         # src_tokens = tokenizer.encode_source_tokens_to_input_ids_with_different_tags([english_text, english_text, ], target_languages_list=["de", "zh", ])
         # generated_tokens = model.generate(src_tokens.to(self.device))
         # results = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
-        with torch.inference_mode(): # no_grad inference_mode
             generated_tokens = model.generate(src_tokens)
         result = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]
         return result

         # model = AutoModel.from_pretrained(self.model_name, trust_remote_code=True)
         # model.half() # recommended for GPU
         model.eval()
+        # model.float()
         # Translating from one or several sentences to a sole language
         src_tokens = tokenizer.encode_source_tokens_to_input_ids(self.input_text, target_language=self.tl)
         # src_tokens may be a torch.Tensor or dict depending on tokenizer; ensure it's a tensor
+        # if isinstance(src_tokens, torch.Tensor):
+        #     src_tokens = src_tokens.to(self.device)
+        # else:
+        #     # if tokenizer returns dict-like inputs (input_ids, attention_mask)
+        #     for k, v in src_tokens.items():
+        #         src_tokens[k] = v.to(self.device)
         # src_tokens = src_tokens.to(self.device)
         # generated_tokens = model.generate(src_tokens)
         # return tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]
         # src_tokens = tokenizer.encode_source_tokens_to_input_ids_with_different_tags([english_text, english_text, ], target_languages_list=["de", "zh", ])
         # generated_tokens = model.generate(src_tokens.to(self.device))
         # results = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
+        with torch.no_grad(): # no_grad inference_mode
             generated_tokens = model.generate(src_tokens)
         result = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]
         return result