Wenbo Zhang's picture

1

Wenbo Zhang

Wenboz

https://onepounchman.github.io/

AI & ML interests

Trustworthy AI, LLMs

Organizations

None yet

Wenboz 's datasets 22

Wenboz/mistral-base-dpo-iter2-reward-logps-ultrafeedback

Viewer • Updated Nov 27, 2025 • 20.6k • 83

Wenboz/mistral-base-dpo-iter1-reward-logps-ultrafeedback

Viewer • Updated Nov 27, 2025 • 20.6k • 3

Wenboz/rm_r1_example

Viewer • Updated Jul 7, 2025 • 1k • 8

Wenboz/ultrafeedback_rationale_Qwen2.5-3B-Instruct_cot_v3

Viewer • Updated May 24, 2025 • 6 • 6

Wenboz/ultrafeedback_rationale_Qwen2.5-3B-Instruct_ultra_filter_2e-5_thre-0.8_packing_42_cot

Updated Mar 3, 2025 • 4

Wenboz/ultrafeedback_rationale_Qwen2.5-3B-Instruct_ultra_sft_2e-5_thre-0.7_packing_42_cot

Viewer • Updated Mar 1, 2025 • 63.1k • 8

Wenboz/ultrafeedback_rationale_gemma-2-2b-it_cot

Viewer • Updated Feb 21, 2025 • 10 • 7

Wenboz/ultrafeedback_rationale_Qwen2.5-3B-Instruct_cot

Viewer • Updated Feb 21, 2025 • 63.1k • 16

Wenboz/ultrafeedback_rationale_Qwen2.5-3B-Instruct_direct

Viewer • Updated Feb 20, 2025 • 61.1k • 13

Wenboz/ultrafeedback_rationale_Llama-3.2-3B-Instruct_cot

Viewer • Updated Feb 20, 2025 • 61.1k • 4

Wenboz/ultrafeedback_rationale_Qwen2.5-14B-Instruct

Viewer • Updated Feb 17, 2025 • 8 • 9

Wenboz/llama3-instruct-reward-logps-ultrafeedback-v2

Viewer • Updated Jan 21, 2025 • 61.8k • 8

Wenboz/llama3-instruct-reward-logps-ultrafeedback

Viewer • Updated Jan 3, 2025 • 61.8k • 7

Wenboz/mistral-instruct-reward-logps-ultrafeedback

Viewer • Updated Jan 3, 2025 • 62.7k • 5

Wenboz/llama3-base-reward-logps-ultrafeedback

Viewer • Updated Jan 3, 2025 • 63.1k • 83

Wenboz/mistral-base-reward-logps-ultrafeedback

Viewer • Updated Jan 3, 2025 • 63.1k • 5

Wenboz/mistral-base-proxy-reward-ultrafeedback

Viewer • Updated Dec 24, 2024 • 63.1k • 5

Wenboz/hh_clean_test_messages

Updated Jul 13, 2024 • 5

Wenboz/SELM-Phi-3-mini-4k-instruct-dataset

Viewer • Updated Jul 1, 2024 • 6 • 7

Wenboz/hh_sft_messages

Viewer • Updated Jun 20, 2024 • 48.4k • 55

Wenboz/hh_clean

Viewer • Updated Jun 19, 2024 • 48.4k • 6

Wenboz/hh_sft

Viewer • Updated Jun 18, 2024 • 65.5k • 5