BERTs of a feather do not generalize together: Large variability in generalization across models with similar test set performance

R. Thomas McCoy, Junghyun Min, Tal Linzen

2020 (modified: 16 Nov 2021)BlackboxNLP@EMNLP 2020Readers: Everyone

Abstract: R. Thomas McCoy, Junghyun Min, Tal Linzen. Proceedings of the Third BlackboxNLP Workshop on Analyzing and Interpreting Neural Networks for NLP. 2020.

0 Replies