Looking for arXiv endorsement (cs.LG) – RL fine-tuning for VLMs (GRPO, MathVista)

kgaero · April 4, 2026, 10:18am

Hi everyone,

I am seeking an arXiv endorsement for cs.LG (Machine Learning) to submit my first paper on RL fine-tuning for vision-language models.

Background:
MS in AI (Purdue), working on RL + VLM training systems.

Paper:
A Case Study of Staged Metric-Gated GRPO for Visual Numeric Reasoning
PDF:
https://github.com/kgaero/RL_GSPO_Qwen2.5VLM/blob/main/paper/staged_metric_gated_grpo.pdf

Short summary:

Main result:
Exact-match improves 0.375 → 0.75 with stable structure under constrained compute.

If you’re eligible to endorse (cs.LG or related), I’d greatly appreciate it.
Happy to share endorsement details via DM.

Thanks!

Topic		Replies	Views
Seeking arXiv endorsement (cs.LG) for new RL optimizer (Hopper) Research	1	46	April 9, 2026
Seeking arXiv endorsement (cs.LG) Research	0	25	February 8, 2026
Seeking Professional Methodology for VLM Domain Fine-tuning: Analyzing 4 Experimental Strategies with Qwen2-VL Beginners	1	23	February 22, 2026
GRPO Trainer for VLM? Research	5	420	July 7, 2025
Looking for endorsor for arXiv Submission (cs.LG) Research	10	190	February 28, 2026