Sixfinger-2B Math LoRA 🧮

Bu model, vngrs/kumru-2b temel (base) modeli üzerine Türkçe matematik problemlerini, akıl yürütme (reasoning) ve hesaplama görevlerini daha iyi çözebilmesi amacıyla ince ayar (fine-tuning) yapılarak geliştirilmiş bir LoRA (Low-Rank Adaptation) adaptörüdür.

Geliştirici: sixfingerdev
Lisans: Apache-2.0
Dil: Türkçe (tr)
Temel Model: vngrs/kumru-2b

📌 Modelin Amacı

Bu LoRA adaptörü, Türkçe doğal dil işleme yeteneklerini geliştiren ana modelin, matematiksel problem çözme, adım adım denklemleri açıklama ve sayısal analiz konularındaki performansını artırmayı hedefler.

🚀 Kullanım (Usage)

Modeli kullanmak için transformers ve peft kütüphanelerine ihtiyacınız olacak:

pip install transformers peft torch

Aşağıdaki Python kodu ile modeli projenize dahil edebilirsiniz:

import torch
from peft import PeftModel
from transformers import AutoModelForCausalLM, AutoTokenizer

# Temel modeli ve tokenizer'ı yükleme
model_id = "vngrs/kumru-2b"
base_model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto")
tokenizer = AutoTokenizer.from_pretrained(model_id)

# LoRA adaptörünü temel model ile birleştirme
lora_id = "sixfingerdev/sixfinger-2b-math-lora"
model = PeftModel.from_pretrained(base_model, lora_id)

# Örnek Kullanım
prompt = "Bir bakkal tanesi 5 TL'den 20 tane ekmek alıyor. Toplam ne kadar öder?"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

with torch.no_grad():
    outputs = model.generate(**inputs, max_new_tokens=50)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

⚙️ Eğitim Detayları

  • Kütüphane: PEFT
  • Metot: LoRA
  • Dil: Türkçe
  • Odak Alanı: Matematik Çözümü / Soru Cevaplama

⚠️ Sınırlamalar

  • Model karmaşık matematik teorilerinde zaman zaman hata yapabilir.
  • Üretken (generative) modellerin doğası gereği halüsinasyon durumları görülebilir, elde edilen sayısal sonuçların her zaman teyit edilmesi önerilir.
Downloads last month
17
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support