GradioTranslate

Running

App Files Files

TiberiuCristianLeon commited on Aug 16

Commit

309f943

verified ·

1 Parent(s): 1cf6327

Update app.py

Browse files

Files changed (1) hide show

app.py +32 -6

app.py CHANGED Viewed

@@ -12,6 +12,7 @@ all_langs = languagecodes.iso_languages
 options = list(favourite_langs.keys())
 options.extend(list(all_langs.keys()))
 models = ["Helsinki-NLP",
           "t5-small", "t5-base", "t5-large",
           "google/flan-t5-small", "google/flan-t5-base", "google/flan-t5-large", "google/flan-t5-xl",
           "facebook/nllb-200-distilled-600M", "facebook/nllb-200-distilled-1.3B", "facebook/nllb-200-1.3B",
@@ -19,11 +20,8 @@ models = ["Helsinki-NLP",
           "bigscience/mt0-small", "bigscience/mt0-base", "bigscience/mt0-large", "bigscience/mt0-xl",
           "bigscience/bloomz-560m", "bigscience/bloomz-1b1", "bigscience/bloomz-1b7", "bigscience/bloomz-3b",
           "utter-project/EuroLLM-1.7B", "utter-project/EuroLLM-1.7B-Instruct",
-          "Unbabel/Tower-Plus-2B",
-          "Unbabel/TowerInstruct-7B-v0.2",
-          "Unbabel/TowerInstruct-Mistral-7B-v0.2",
-          "openGPT-X/Teuken-7B-instruct-commercial-v0.4",
-          "openGPT-X/Teuken-7B-instruct-v0.6"
           ]
 def model_to_cuda(model):
@@ -35,6 +33,30 @@ def model_to_cuda(model):
         print("CUDA not available! Using CPU.")
     return model
 def HelsinkiNLPAutoTokenizer(sl, tl, input_text):
     if model_name == "Helsinki-NLP":
         message_text = f'Translated from {sl} to {tl} with {model_name}.'
@@ -241,7 +263,11 @@ def translate_text(input_text: str, sselected_language: str, tselected_language:
     if model_name.startswith("Helsinki-NLP"):
         translated_text, message_text = HelsinkiNLP(sl, tl, input_text)
         return translated_text, message_text
     elif model_name == "utter-project/EuroLLM-1.7B-Instruct":
         translated_text = eurollm_instruct(model_name, sselected_language, tselected_language, input_text)
         return translated_text, message_text

 options = list(favourite_langs.keys())
 options.extend(list(all_langs.keys()))
 models = ["Helsinki-NLP",
+          "Argos",
           "t5-small", "t5-base", "t5-large",
           "google/flan-t5-small", "google/flan-t5-base", "google/flan-t5-large", "google/flan-t5-xl",
           "facebook/nllb-200-distilled-600M", "facebook/nllb-200-distilled-1.3B", "facebook/nllb-200-1.3B",
           "bigscience/mt0-small", "bigscience/mt0-base", "bigscience/mt0-large", "bigscience/mt0-xl",
           "bigscience/bloomz-560m", "bigscience/bloomz-1b1", "bigscience/bloomz-1b7", "bigscience/bloomz-3b",
           "utter-project/EuroLLM-1.7B", "utter-project/EuroLLM-1.7B-Instruct",
+          "Unbabel/Tower-Plus-2B", "Unbabel/TowerInstruct-7B-v0.2", "Unbabel/TowerInstruct-Mistral-7B-v0.2",
+          "openGPT-X/Teuken-7B-instruct-commercial-v0.4", "openGPT-X/Teuken-7B-instruct-v0.6"
           ]
 def model_to_cuda(model):
         print("CUDA not available! Using CPU.")
     return model
+def download_argos_model(from_code, to_code):
+    import argostranslate.package
+    print('Downloading model', from_code, to_code)
+    # Download and install Argos Translate package
+    argostranslate.package.update_package_index()
+    available_packages = argostranslate.package.get_available_packages()
+    package_to_install = next(
+        filter(
+            lambda x: x.from_code == from_code and x.to_code == to_code, available_packages
+        )
+    )
+    argostranslate.package.install_from_path(package_to_install.download())
+def argos(sl, tl, input_text):
+    import argostranslate.translate
+    # Translate
+    try:
+        download_argos_model(sl, tl)
+        translated_text = argostranslate.translate.translate(input_text, sl, tl)
+    except StopIteration:
+        translated_text = f"No Argos model for {sselected_language} to {tselected_language}. Try other model or languages combination!"
+    except Exception as error:
+        translated_text = error
 def HelsinkiNLPAutoTokenizer(sl, tl, input_text):
     if model_name == "Helsinki-NLP":
         message_text = f'Translated from {sl} to {tl} with {model_name}.'
     if model_name.startswith("Helsinki-NLP"):
         translated_text, message_text = HelsinkiNLP(sl, tl, input_text)
         return translated_text, message_text
+    elif 'Argos' in model_name:
+        translated_text = argos(sl, tl, input_text)
+        return translated_text, message_text
     elif model_name == "utter-project/EuroLLM-1.7B-Instruct":
         translated_text = eurollm_instruct(model_name, sselected_language, tselected_language, input_text)
         return translated_text, message_text