Spaces:

datbkpro
/

voicebot

Sleeping

App Files Files Community

datbkpro commited on Nov 13

Commit

7bd2666

verified ·

1 Parent(s): 7d0b18d

Update ui/tabs.py

Browse files

Files changed (1) hide show

ui/tabs.py +135 -2

ui/tabs.py CHANGED Viewed

@@ -10,6 +10,7 @@ from services.streaming_voice_service import StreamingVoiceService
 from services.openai_realtime_service import HybridStreamingService
 from services.stream_object_detection_service import  StreamObjectDetection
 from services.voice_coding_service import  VoiceCodingService
 from core.rag_system import EnhancedRAGSystem
 from core.tts_service import EnhancedTTSService
 from core.wikipedia_processor import WikipediaProcessor
@@ -20,14 +21,17 @@ def create_all_tabs(audio_service: AudioService, chat_service: ChatService,
                    tts_service: EnhancedTTSService, wikipedia_processor: WikipediaProcessor,
                    streaming_voice_service: StreamingVoiceService,
                    hybrid_service: HybridStreamingService,
-                   voice_coding_service: VoiceCodingService
                    ):
     with gr.Tab("🎙️ Streaming Voice "):
         create_streaming_voice_tab(streaming_voice_service)
     with gr.Tab("OpenAI Realtime"):
         create_openai_realtime_tab(hybrid_service)
-    with gr.Tab("Voice Coding"):
         create_voice_coding_tab(voice_coding_service)
     with gr.Tab("🎙️ Audio"):
         create_audio_tab(audio_service)
@@ -48,6 +52,135 @@ def create_all_tabs(audio_service: AudioService, chat_service: ChatService,
         create_language_info_tab(rag_system.multilingual_manager)
     with gr.Tab("Stream Object Detection"):
         create_streaming_object_detection()
 def create_voice_coding_tab(voice_coding_service):
     """Tạo tab Voice Coding đơn giản - Text-based trước"""

 from services.openai_realtime_service import HybridStreamingService
 from services.stream_object_detection_service import  StreamObjectDetection
 from services.voice_coding_service import  VoiceCodingService
+from services.sambanova_voice_service import  SambanovaVoiceService
 from core.rag_system import EnhancedRAGSystem
 from core.tts_service import EnhancedTTSService
 from core.wikipedia_processor import WikipediaProcessor
                    tts_service: EnhancedTTSService, wikipedia_processor: WikipediaProcessor,
                    streaming_voice_service: StreamingVoiceService,
                    hybrid_service: HybridStreamingService,
+                   voice_coding_service: VoiceCodingService,
+                   sambanova_voice_service : SambanovaVoiceService
                    ):
     with gr.Tab("🎙️ Streaming Voice "):
         create_streaming_voice_tab(streaming_voice_service)
     with gr.Tab("OpenAI Realtime"):
         create_openai_realtime_tab(hybrid_service)
+    with gr.Tab("SambonovaAI Realtime"):
+        create_sambanova_voice_tab(sambanova_voice_service)
+    with gr.Tab("Generation Code"):
         create_voice_coding_tab(voice_coding_service)
     with gr.Tab("🎙️ Audio"):
         create_audio_tab(audio_service)
         create_language_info_tab(rag_system.multilingual_manager)
     with gr.Tab("Stream Object Detection"):
         create_streaming_object_detection()
+def create_sambanova_voice_tab(sambanova_service):
+    """Tạo tab Sambanova Voice AI"""
+    # Tạo stream
+    stream = sambanova_service.create_stream()
+    with gr.Blocks() as sambanova_tab:
+        gr.Markdown("## 🤖 Sambanova Voice AI - Llama 3.2 3B")
+        gr.Markdown("Trò chuyện voice-to-voice với model Llama 3.2 3B thông qua Sambanova API")
+        # State variables
+        chatbot = gr.Chatbot(
+            type="messages",
+            value=[],
+            label="💬 Hội thoại Voice",
+            height=400
+        )
+        conversation_state = gr.State(value=[])
+        with gr.Row():
+            with gr.Column(scale=1):
+                gr.Markdown("### 🎤 Hướng dẫn sử dụng:")
+                gr.Markdown("""
+                **Cách sử dụng:**
+                1. Nhấn **Bắt đầu Voice Chat**
+                2. Nói "Computer", "Hey", "Hello" hoặc "Xin chào" để kích hoạt
+                3. Trò chuyện tự nhiên bằng giọng nói
+                4. Mỗi phiên giới hạn 90 giây
+                **Tính năng:**
+                ✅ Voice-to-Voice conversation
+                ✅ Real-time streaming
+                ✅ Llama 3.2 3B model
+                ✅ Low latency
+                ✅ Multi-language support
+                """)
+                # WebRTC component
+                webrtc = stream.ui()
+                # Manual controls
+                with gr.Accordion("⚙️ Cài đặt nâng cao", open=False):
+                    temperature = gr.Slider(
+                        minimum=0.1,
+                        maximum=1.0,
+                        value=0.1,
+                        label="Temperature"
+                    )
+                    top_p = gr.Slider(
+                        minimum=0.1,
+                        maximum=1.0,
+                        value=0.1,
+                        label="Top-P"
+                    )
+                with gr.Row():
+                    clear_btn = gr.Button("🗑️ Xóa hội thoại", variant="secondary")
+                    export_btn = gr.Button("💾 Export Chat", variant="secondary")
+            with gr.Column(scale=2):
+                # Hiển thị thông tin model
+                with gr.Accordion("📊 Model Information", open=True):
+                    gr.Markdown("""
+                    **Llama 3.2 3B Instruct**
+                    - **Provider**: Sambanova AI
+                    - **Context Window**: 128K tokens
+                    - **Languages**: Multi-language
+                    - **Specialization**: Instruction following
+                    - **API**: OpenAI-compatible
+                    **Voice Features:**
+                    - Real-time speech recognition
+                    - Voice activity detection
+                    - Stop-word activation
+                    - Low-latency streaming
+                    """)
+                # Hiển thị trạng thái
+                status_display = gr.Textbox(
+                    label="🔄 Trạng thái hệ thống",
+                    value="Sẵn sàng kết nối...",
+                    interactive=False,
+                    lines=2
+                )
+        # Additional outputs handling
+        def handle_additional_outputs(chatbot_output, state_output):
+            """Xử lý additional outputs từ streaming"""
+            return chatbot_output, state_output, "✅ Đang trò chuyện..."
+        # Event handlers
+        def clear_conversation():
+            """Xóa hội thoại"""
+            return [], [], "🔄 Đã xóa hội thoại"
+        def export_chat(chat_history):
+            """Export chat history"""
+            if not chat_history:
+                return "❌ Không có dữ liệu để export"
+            try:
+                timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
+                filename = f"sambanova_chat_{timestamp}.json"
+                with open(filename, 'w', encoding='utf-8') as f:
+                    json.dump(chat_history, f, ensure_ascii=False, indent=2)
+                return f"✅ Đã export chat thành {filename}"
+            except Exception as e:
+                return f"❌ Lỗi export: {str(e)}"
+        # Kết nối events
+        webrtc.on_additional_outputs(
+            handle_additional_outputs,
+            outputs=[chatbot, conversation_state, status_display]
+        )
+        clear_btn.click(
+            clear_conversation,
+            outputs=[chatbot, conversation_state, status_display]
+        )
+        export_btn.click(
+            export_chat,
+            inputs=[chatbot],
+            outputs=[status_display]
+        )
+    return sambanova_tab
 def create_voice_coding_tab(voice_coding_service):
     """Tạo tab Voice Coding đơn giản - Text-based trước"""