int4 llm - a roshniramesh Collection

Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

roshniramesh 's Collections

nf4 llm

fp8 llm

int4 llm

updated Jan 16, 2025

OpenVINO/phi-2-int4-ov

Text Generation • Updated Nov 5, 2024 • 26 • 1
nvidia/Gemma-2b-it-ONNX-INT4

Updated Nov 15, 2024 • 8
nvidia/Meta-Llama-3.1-8B-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 26 • 6
nvidia/Meta-Llama-3.2-3B-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 8
nvidia/Phi-3.5-mini-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 1
nvidia/Mistral-Nemo-12B-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 3
nvidia/Nemotron-Mini-4B-Instruct-ONNX-INT4

Updated Nov 18, 2024 • 5
meta-llama/Llama-3.2-1B-Instruct-SpinQuant_INT4_EO8

Text Generation • Updated Nov 18, 2024 • 92 • 38
hugging-quants/gemma-2-9b-it-AWQ-INT4

Text Generation • 9B • Updated Oct 17, 2024 • 2.02k • 7
Qwen/Qwen2-7B-Instruct-GPTQ-Int4

Text Generation • 8B • Updated Aug 21, 2024 • 690 • 29
hugging-quants/Meta-Llama-3.1-8B-Instruct-AWQ-INT4

Text Generation • 8B • Updated Aug 7, 2024 • 395k • 85
RedHatAI/Meta-Llama-3.1-8B-Instruct-quantized.w4a16

Text Generation • 8B • Updated Sep 22, 2025 • 26.9k • 30
ModelCloud/Meta-Llama-3.1-8B-gptq-4bit

Text Generation • 8B • Updated Jul 26, 2024 • 106
hugging-quants/Llama-3.2-3B-Instruct-Q4_K_M-GGUF

Text Generation • 3B • Updated Sep 25, 2024 • 18.1k • 26
hugging-quants/Meta-Llama-3.1-70B-Instruct-AWQ-INT4

Text Generation • 71B • Updated Aug 7, 2024 • 85.4k • 107
hugging-quants/Llama-3.2-1B-Instruct-Q4_K_M-GGUF

Text Generation • 1B • Updated Sep 25, 2024 • 30.8k • 19
hugging-quants/Meta-Llama-3.1-70B-Instruct-GPTQ-INT4

Text Generation • 71B • Updated Aug 7, 2024 • 700 • 23
hugging-quants/Meta-Llama-3.1-8B-Instruct-GPTQ-INT4

Text Generation • 8B • Updated Aug 7, 2024 • 11.3k • 40
meta-llama/Llama-Guard-3-1B-INT4

Text Generation • Updated Sep 25, 2024 • 8 • 27
meta-llama/Llama-3.2-3B-Instruct-QLORA_INT4_EO8

Text Generation • Updated Nov 18, 2024 • 95 • 71
meta-llama/Llama-3.2-3B-Instruct-SpinQuant_INT4_EO8

Text Generation • Updated Nov 18, 2024 • 94 • 37
meta-llama/Llama-3.2-1B-Instruct-QLORA_INT4_EO8

Text Generation • Updated Nov 18, 2024 • 113 • 47
RedHatAI/Mistral-7B-Instruct-v0.3-GPTQ-4bit

Text Generation • 7B • Updated Jun 10, 2024 • 52.7k • 23
RedHatAI/Mistral-7B-Instruct-v0.3-quantized.w4a16

Text Generation • 7B • Updated Mar 13, 2025 • 71 • 2
RedHatAI/Llama-2-7b-chat-quantized.w4a16

Text Generation • 7B • Updated Jul 18, 2024 • 25
RedHatAI/Meta-Llama-3-8B-Instruct-quantized.w4a16

Text Generation • 8B • Updated Jul 18, 2024 • 66 • 2
RedHatAI/Meta-Llama-3-70B-Instruct-quantized.w4a16

Text Generation • 71B • Updated Aug 29, 2024 • 261 • 2
RedHatAI/gemma-2-2b-it-quantized.w4a16

Text Generation • 1B • Updated Oct 9, 2024 • 56 • 1
RedHatAI/gemma-2-9b-it-quantized.w4a16

Text Generation • 3B • Updated Oct 9, 2024 • 86 • 2
RedHatAI/Mistral-Nemo-Instruct-2407-quantized.w4a16

Text Generation • 3B • Updated Oct 9, 2024 • 1.28k • 4
RedHatAI/Meta-Llama-3.1-70B-Instruct-quantized.w4a16

Text Generation • 71B • Updated Feb 12, 2025 • 1.37k • 32
nvidia/Mistral-7B-Instruct-v0.3-ONNX-INT4

Updated Nov 15, 2024 • 6
OpenVINO/mistral-7b-instruct-v0.1-int4-ov

Text Generation • Updated Oct 29, 2024 • 5
OpenVINO/Mistral-7B-Instruct-v0.2-int4-ov

Text Generation • Updated Oct 31, 2024 • 522 • 1
Qwen/Qwen-72B-Chat-Int4

Text Generation • 72B • Updated Jan 4, 2024 • 195 • 47
Qwen/Qwen-14B-Chat-Int4

Text Generation • 14B • Updated Dec 13, 2023 • 159 • 100
Qwen/Qwen-7B-Chat-Int4

Text Generation • 8B • Updated Jan 4, 2024 • 702 • 75
Qwen/Qwen-1_8B-Chat-Int4

Text Generation • 2B • Updated Dec 13, 2023 • 255 • 36
Qwen/Qwen1.5-110B-Chat-GPTQ-Int4

Text Generation • 111B • Updated Apr 30, 2024 • 64.1k • 18
Qwen/Qwen1.5-1.8B-Chat-GPTQ-Int4

Text Generation • 2B • Updated Apr 30, 2024 • 147 • 7
Qwen/Qwen1.5-MoE-A2.7B-Chat-GPTQ-Int4

Text Generation • 14B • Updated Jun 9, 2024 • 470 • 50
Qwen/Qwen1.5-4B-Chat-GPTQ-Int4

Text Generation • 4B • Updated Apr 30, 2024 • 113 • 6
Qwen/Qwen1.5-72B-Chat-GPTQ-Int4

Text Generation • 72B • Updated Apr 30, 2024 • 2.22k • 37
Qwen/Qwen1.5-4B-Chat-GGUF

Text Generation • 4B • Updated Apr 9, 2024 • 706 • 16
Qwen/Qwen1.5-0.5B-Chat-GGUF

Text Generation • 0.6B • Updated Apr 9, 2024 • 4.76k • 35
Qwen/Qwen1.5-7B-Chat-GGUF

Text Generation • 8B • Updated Apr 9, 2024 • 2.7k • 70
Qwen/CodeQwen1.5-7B-Chat-GGUF

Text Generation • 7B • Updated Apr 23, 2024 • 757 • 109
Qwen/Qwen2.5-1.5B-Instruct-GPTQ-Int4

Text Generation • 2B • Updated Oct 9, 2024 • 803 • 3
Qwen/Qwen2.5-0.5B-Instruct-GPTQ-Int4

Text Generation • 0.5B • Updated Sep 19, 2024 • 412 • 9
Qwen/Qwen2.5-0.5B-Instruct-GGUF

Text Generation • 0.6B • Updated Sep 20, 2024 • 38.6k • 71
Qwen/Qwen2-1.5B-Instruct-GGUF

Text Generation • 2B • Updated Jun 18, 2024 • 6.34k • 27
Qwen/Qwen2-0.5B-Instruct-GGUF

Text Generation • 0.5B • Updated Aug 21, 2024 • 15.8k • 71
Qwen/Qwen2-7B-Instruct-GGUF

Text Generation • 8B • Updated Aug 21, 2024 • 5.53k • 177
Qwen/Qwen2-0.5B-Instruct-GPTQ-Int4

Text Generation • 0.6B • Updated Aug 21, 2024 • 89 • 15
Qwen/Qwen2-1.5B-Instruct-GPTQ-Int4

Text Generation • 2B • Updated Aug 21, 2024 • 15.5k • 5
Qwen/Qwen2-72B-Instruct-GPTQ-Int4

Text Generation • 73B • Updated Aug 21, 2024 • 59 • 33
Qwen/Qwen2-57B-A14B-Instruct-GPTQ-Int4

Text Generation • 57B • Updated Aug 21, 2024 • 198 • 23

Collection guide
Browse collections

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs