NecoBERT: Self-Supervised Learning Model Trained by Masked Language Modeling on Rich Acoustic Features Derived from Neural Audio Codec. | OpenReview

NecoBERT: Self-Supervised Learning Model Trained by Masked Language Modeling on Rich Acoustic Features Derived from Neural Audio Codec.

Wataru Nakata, Takaaki Saeki, Yuki Saito 0001, Shinnosuke Takamichi, Hiroshi Saruwatari

18 Mar 2026APSIPA 2024EveryoneCC BY-SA 4.0

Loading