BertForMaskedLM 的正确返回值是多少?
nlp 314
原文标题 :What is the correct return of BertForMaskedLM?
我正在使用huggingface BertForMaskedLM。对于一个句子,我从BertForMaskedLM得到3维返回。例如(P,N,V),这里我理解N是句子的长度,V是词汇大小在 Bert。但我对 P 感到困惑。BertForMaskedLM 的第一个返回究竟是什么?