2017-04-18 35 views

回答

1

上述实验中的模型太小,无法充分利用GPU的所有潜力。

在上述实验中,扩大模型(利用更多图层,增加词汇量,增加序列长度......)会提高利用率(小于80-90%)。