Nvidia ilmoitti eilen, että sen tuleva H100 GPU “Hopper” Tensor Core asensi uudet
MPerf-benchmarkit mittaavat työmäärää"lähtöjä", jotka osoittavat, kuinka hyvin siru voi soveltaa esikoulutettua koneoppimismallia uuteen dataan. MLCommons-niminen teollisuusyritysryhmä kehitti MLPerf-vertailuarvot vuonna 2018 tarjotakseen standardoidun mittarin koneoppimissuorituskyvyn esittelemiseksi potentiaalisille asiakkaille.
Erityisesti H100 toimi hyvinBERT-Large benchmark, joka mittaa luonnollisen kielen käsittelyn suorituskykyä käyttämällä Googlen kehittämää BERT-mallia. Nvidian ansioksi tämä tulos johtuu Hopper-arkkitehtuurin Transformer Enginestä, joka erityisesti nopeuttaa muunnosmallien koulutusta. Tämä tarkoittaa, että H100 voi nopeuttaa tulevia luonnollisen kielen malleja, kuten OpenAI:n GPT-3:a, joka pystyy kirjoittamaan eri tyylejä ja chat-keskusteluja.
Vielä kehitteillä olevan sirun ennustetaan korvaavan A100:n yhtiön lippulaivana datakeskuksen GPU:na.