Spaces:

MCP-1st-Birthday
/

TraceMind

Running

kshitijthakkar commited on Nov 18

Commit

0b870a2

1 Parent(s): 14c0bae

feat: Improve New Evaluation screen hardware selection

Enhancements to provider and hardware configuration:

Provider Changes:
- Removed 'ollama' from provider dropdown (not supported in HF Jobs/Modal)
- Updated provider choices to: litellm, inference, transformers
- Added clarification info text: (litellm/inference=API, transformers=local)

Hardware Changes:
- Simplified GPU options: removed gpu_a10 and gpu_h200
- Added single GPU option: gpu_a100 (widely available on HF/Modal)
- Updated hardware choices to: auto, cpu, gpu_a100
- Changed info text to reflect auto-selection

Auto-Selection Logic:
- Added on_provider_change() function
- Wired up eval_provider.change event
- Smart hardware selection:
* litellm/inference → cpu (API models don't need GPU)
* transformers → gpu_a100 (local models need GPU)
* default → auto

Benefits:
- Prevents invalid configurations (e.g., ollama without server)
- Automatically selects appropriate hardware for provider type
- Simplified GPU options (single A100 choice vs multiple)
- Better UX with clear provider/hardware relationship

Files changed (1) hide show

app.py +22 -4

app.py CHANGED Viewed

@@ -2220,10 +2220,10 @@ with gr.Blocks(title="TraceMind-AI", theme=theme) as app:
                     )
                     eval_hardware = gr.Radio(
-                        choices=["auto", "cpu", "gpu_a10", "gpu_h200"],
                         value="auto",
                         label="Hardware",
-                        info="CPU for API models, GPU for local models (H200 for best performance)"
                     )
             # Section 2: Model Configuration
@@ -2239,10 +2239,10 @@ with gr.Blocks(title="TraceMind-AI", theme=theme) as app:
                     )
                     eval_provider = gr.Dropdown(
-                        choices=["litellm", "inference", "transformers", "ollama"],
                         value="litellm",
                         label="Provider",
-                        info="Model inference provider"
                     )
                 with gr.Row():
@@ -2678,6 +2678,17 @@ with gr.Blocks(title="TraceMind-AI", theme=theme) as app:
             return gr.update(value=success_html, visible=True)
         # Navigation handlers (define before use)
         def navigate_to_dashboard():
             """Navigate to dashboard screen and load dashboard data"""
@@ -3233,6 +3244,13 @@ Result: {result}
             outputs=[eval_cost_estimate]
         )
         eval_submit_btn.click(
             fn=on_submit_evaluation_comprehensive,
             inputs=[

                     )
                     eval_hardware = gr.Radio(
+                        choices=["auto", "cpu", "gpu_a100"],
                         value="auto",
                         label="Hardware",
+                        info="Auto-selected based on provider (CPU for API, GPU for local models)"
                     )
             # Section 2: Model Configuration
                     )
                     eval_provider = gr.Dropdown(
+                        choices=["litellm", "inference", "transformers"],
                         value="litellm",
                         label="Provider",
+                        info="Model inference provider (litellm/inference=API, transformers=local)"
                     )
                 with gr.Row():
             return gr.update(value=success_html, visible=True)
+        def on_provider_change(provider):
+            """Auto-select hardware based on provider type"""
+            # litellm and inference are for API models → CPU
+            # transformers is for local models → GPU
+            if provider in ["litellm", "inference"]:
+                return gr.update(value="cpu")
+            elif provider == "transformers":
+                return gr.update(value="gpu_a100")
+            else:
+                return gr.update(value="auto")
         # Navigation handlers (define before use)
         def navigate_to_dashboard():
             """Navigate to dashboard screen and load dashboard data"""
             outputs=[eval_cost_estimate]
         )
+        # Auto-select hardware when provider changes
+        eval_provider.change(
+            fn=on_provider_change,
+            inputs=[eval_provider],
+            outputs=[eval_hardware]
+        )
         eval_submit_btn.click(
             fn=on_submit_evaluation_comprehensive,
             inputs=[