jmajkutewicz (Jan Majkutewicz)

Collections 2

models 10

datasets 5

jmajkutewicz/PKU-SafeRLHF-binarized

Viewer • Updated Sep 26, 2025 • 82.1k • 9

jmajkutewicz/hh-rlhf-binarized

Viewer • Updated Sep 26, 2025 • 169k • 2

jmajkutewicz/oasst1-binarized

Viewer • Updated Sep 26, 2025 • 14.9k • 4

jmajkutewicz/SHP-binarized

Viewer • Updated Sep 26, 2025 • 121k • 2

jmajkutewicz/WikiPrefs

Viewer • Updated Sep 26, 2025 • 65.3k • 14

Jan Majkutewicz

AI & ML interests

Organizations

Collections 2

jmajkutewicz/Llama-3.1-Tulu-3-8B-DPO_hh-rlhf

jmajkutewicz/Llama-3.1-Tulu-3-8B-DPO_oasst1

jmajkutewicz/Llama-3.1-Tulu-3-8B-DPO_PKU-SafeRLHF

jmajkutewicz/Llama-3.1-Tulu-3-8B-DPO_ultrafeedback

jmajkutewicz/WikiPrefs

jmajkutewicz/Llama-3.1-Tulu-3-8B-DPO_hh-rlhf

jmajkutewicz/Llama-3.1-Tulu-3-8B-DPO_oasst1

jmajkutewicz/Llama-3.1-Tulu-3-8B-DPO_PKU-SafeRLHF

jmajkutewicz/Llama-3.1-Tulu-3-8B-DPO_ultrafeedback

jmajkutewicz/WikiPrefs

models 10

jmajkutewicz/zephyr-7b-dpo_dataset-mix

jmajkutewicz/zephyr-7b-dpo_PKU-SafeRLHF

jmajkutewicz/zephyr-7b-dpo_ultrafeedback

jmajkutewicz/zephyr-7b-dpo_hh-rlhf

jmajkutewicz/Llama-3.1-Tulu-3-8B-DPO_dataset-mix

jmajkutewicz/Llama-3.1-Tulu-3-8B-DPO_PKU-SafeRLHF

jmajkutewicz/Llama-3.1-Tulu-3-8B-DPO_ultrafeedback

jmajkutewicz/Llama-3.1-Tulu-3-8B-DPO_hh-rlhf

jmajkutewicz/zephyr-7b-dpo_oasst1

jmajkutewicz/Llama-3.1-Tulu-3-8B-DPO_oasst1

datasets 5

jmajkutewicz/PKU-SafeRLHF-binarized

jmajkutewicz/hh-rlhf-binarized

jmajkutewicz/oasst1-binarized

jmajkutewicz/SHP-binarized

jmajkutewicz/WikiPrefs

Jan Majkutewicz

AI & ML interests

Organizations

Collections 2

models 10 Sort: Recently updated

datasets 5 Sort: Recently updated

models 10

datasets 5