journal-menarik - a jangnaray Collection

jangnaray 's Collections

journal-menarik

journal-menarik

updated Jul 11, 2025

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

Paper • 2502.11089 • Published Feb 16, 2025 • 168
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

Paper • 2402.03300 • Published Feb 5, 2024 • 141
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22, 2025 • 441
DeepSeek-R1 Thoughtology: Let's <think> about LLM Reasoning

Paper • 2504.07128 • Published Apr 2, 2025 • 87
BioBERT: a pre-trained biomedical language representation model for biomedical text mining

Paper • 1901.08746 • Published Jan 25, 2019 • 6
TableFormer: Table Structure Understanding with Transformers

Paper • 2203.01017 • Published Mar 2, 2022 • 1
Language Modeling on Tabular Data: A Survey of Foundations, Techniques and Evolution

Paper • 2408.10548 • Published Aug 20, 2024
DTT: An Example-Driven Tabular Transformer for Joinability by Leveraging Large Language Models

Paper • 2303.06748 • Published Mar 12, 2023
XTab: Cross-table Pretraining for Tabular Transformers

Paper • 2305.06090 • Published May 10, 2023
UniPredict: Large Language Models are Universal Tabular Classifiers

Paper • 2310.03266 • Published Oct 5, 2023
Language Models are Realistic Tabular Data Generators

Paper • 2210.06280 • Published Oct 12, 2022 • 1
TabNet: Attentive Interpretable Tabular Learning

Paper • 1908.07442 • Published Aug 20, 2019 • 1
Jamba: A Hybrid Transformer-Mamba Language Model

Paper • 2403.19887 • Published Mar 28, 2024 • 112
Jamba-1.5: Hybrid Transformer-Mamba Models at Scale

Paper • 2408.12570 • Published Aug 22, 2024 • 32
Mamba: Linear-Time Sequence Modeling with Selective State Spaces

Paper • 2312.00752 • Published Dec 1, 2023 • 150