HRPVT: High-Resolution Pyramid Vision Transformer for medium and small-scale human pose estimation

Zhoujie Xu, Meng Dai, Qing Zhang, Xiaodi Jiang

Published: 01 Jan 2025, Last Modified: 17 Apr 2025Neurocomputing 2025EveryoneRevisionsBibTeXCC BY-SA 4.0

Abstract: Highlights•A hybrid Vision Transformer boosts human pose estimation at medium and small scales.•Two HRPM-derived insertion strategies improve performance from two perspectives.•HRPVT outperforms HRNet-W48 while reducing complexity by 60%.