A survey of slow thinking-based reasoning LLMs using reinforcement learning and test-time scaling law | OpenReview

A survey of slow thinking-based reasoning LLMs using reinforcement learning and test-time scaling law

Open Webpage

Qianjun Pan, Wenkai Ji, Yuyang Ding, Junsong Li, Shilian Chen, Junyi Wang, Jie Zhou, Qin Chen, Min Zhang, Yulan Wu, Liang He

Published: 2026, Last Modified: 30 May 2026Inf. Process. Manag. 2026EveryoneRevisionsBibTeXCC BY-SA 4.0

External IDs:dblp:journals/ipm/PanJDLCWZCZWH26

Loading