Vakar Nvidia paziņoja, ka tās gaidāmais H100 GPU “Hopper” Tensor Core uzstādīja jaunus
MPerf etaloni mēra darba slodzi"izejas", kas parāda, cik labi mikroshēma var piemērot iepriekš apmācītu mašīnmācīšanās modeli jauniem datiem. Nozares uzņēmumu grupa, kas pazīstama kā MLCommons, 2018. gadā izstrādāja MLPerf etalonus, lai nodrošinātu standartizētu metriku mašīnmācīšanās veiktspējas prezentēšanai potenciālajiem klientiem.
Jo īpaši H100 darbojās labiBERT-Large etalons, kas mēra dabiskās valodas apstrādes veiktspēju, izmantojot Google izstrādāto BERT modeli. Nvidia šo konkrēto rezultātu attiecina uz Hopper arhitektūras Transformer Engine, kas īpaši paātrina transformācijas modeļu apmācību. Tas nozīmē, ka H100 var paātrināt nākotnes dabiskās valodas modeļus, piemēram, OpenAI GPT-3, kas var veidot rakstīšanu dažādos stilos un tērzēšanas sarunas.
Tiek prognozēts, ka mikroshēma, kas joprojām tiek izstrādāta, aizstās A100 kā uzņēmuma vadošo datu centra GPU.