Quickpanda's picture

3 6

Quickpanda

Quickpanda

·

AI & ML interests

None yet

Recent Activity

updated a collection 2 days ago

upvoted a paper 15 days ago

Emergent temporal abstractions in autoregressive models enable hierarchical reinforcement learning

upvoted a paper 9 months ago

A Minimalist Approach to LLM Reasoning: from Rejection Sampling to Reinforce

View all activity

Organizations

None yet

Collections 1

models 2

Quickpanda/deepcoder-14b-preview-awq

15B • Updated Apr 14, 2025 • 2

Quickpanda/deepseek-14b-sft-dpo4-awq

15B • Updated Apr 13, 2025

datasets 0

None public yet