Models

143

Full-text search

Active filters: reward model

mradermacher/Starling-LM-7B-beta-laser-dpo-i1-GGUF

7B • Updated Dec 12, 2024 • 159

mradermacher/Starling-LM-7B-beta-laser-dpo-GGUF

7B • Updated Dec 12, 2024 • 101

mradermacher/Starling-LM-7B-beta-GGUF

7B • Updated Aug 1, 2025 • 55 • 2

mradermacher/Starling-LM-7B-beta-i1-GGUF

7B • Updated Dec 22, 2024 • 73 • 1

mradermacher/JSL-MedMNX-7B-v2.0-GGUF

7B • Updated Dec 27, 2024 • 54

mradermacher/JSL-MedMNX-7B-v2.0-i1-GGUF

7B • Updated Dec 27, 2024 • 70

mradermacher/Starling-LM-7B-beta-LaserRMT-v1-GGUF

7B • Updated Jan 2, 2025 • 30 • 1

mradermacher/GuIA-v2-GGUF

7B • Updated Jan 3, 2025 • 72 • 1

Qwen/Qwen2.5-Math-7B-PRM800K

Text Classification • 8B • Updated Jan 17, 2025 • 696 • 21

Qwen/Qwen2.5-Math-PRM-72B

Text Classification • 73B • Updated Jan 17, 2025 • 139 • 73

sthenno/tempesthenno-hs2-rm

15B • Updated Jan 27, 2025 • 2 • 1

prithivMLmods/PRM-Math-7B-Reasoner

Text Classification • 8B • Updated Jan 19, 2025 • 10 • 1

mradermacher/JSL-MedMNX-7B-SFT-GGUF

7B • Updated Jan 19, 2025 • 5

mradermacher/JSL-MedMNX-7B-SFT-i1-GGUF

7B • Updated Jan 19, 2025 • 91

mradermacher/PRM-Math-7B-Reasoner-GGUF

8B • Updated Jan 21, 2025 • 109

mradermacher/PRM-Math-7B-Reasoner-i1-GGUF

8B • Updated Jan 21, 2025 • 295

internlm/internlm-xcomposer2d5-7b-reward

Any-to-Any • Updated May 20, 2025 • 56 • 11

mradermacher/Starling-LM-11B-alpha-GGUF

11B • Updated Feb 9, 2025 • 151 • 1

mradermacher/Starling-LM-11B-alpha-i1-GGUF

11B • Updated Feb 10, 2025 • 223 • 2

mradermacher/Llama-3.1-Nemotron-70B-Reward-HF-GGUF

71B • Updated Jul 31, 2025 • 31

mradermacher/Llama-3.1-Nemotron-70B-Reward-HF-i1-GGUF

71B • Updated Mar 8, 2025 • 1.86k

weiminw/Heliumos-RM-3B

Text Classification • 3B • Updated May 9, 2025 • 1

tensorblock/CallComply_Starling-LM-11B-alpha-GGUF

11B • Updated Jan 27 • 11

weiminw/Heliumos-RM-4B

Text Classification • 4B • Updated May 9, 2025 • 1

Qwen/WorldPM-72B

Text Classification • 73B • Updated May 17, 2025 • 40 • 82

Qwen/WorldPM-72B-HelpSteer2

Text Classification • 73B • Updated May 17, 2025 • 720 • 11

Qwen/WorldPM-72B-UltraFeedback

Text Classification • 73B • Updated May 17, 2025 • 1.69k • 8

Qwen/WorldPM-72B-RLHFLow

Text Classification • 73B • Updated May 17, 2025 • 104 • 11

KnutJaegersberg/WorldPM-72B-4bit

Text Classification • Updated May 19, 2025 • 3

ryokamoi/Llama-3.1-8B-FoVer-PRM-old

Text Generation • 8B • Updated 29 days ago • 334