OThink-SRR1: Search, Refine and Reasoning with Reinforced Learning for Large Language Models | OpenReview

OThink-SRR1: Search, Refine and Reasoning with Reinforced Learning for Large Language Models

Open Webpage

Haijian Liang, Zenghao Niu, Junjie Wu, Changwang Zhang, Wangchunshu Zhou, Jun Wang

Published: 2026, Last Modified: 26 May 2026CoRR 2026EveryoneRevisionsBibTeXCC BY-SA 4.0

External IDs:dblp:journals/corr/abs-2604-19766

Loading