Anomalian metsästäjät: kuinka CERN etsii harvinaisia hiukkasia Yandex-algoritmeilla

Andrei Ustyuzhanin— Kansallisen tutkimusyliopiston kauppakorkeakoulun Big Data -analyysimenetelmien tutkimus- ja koulutuslaboratorion johtaja.

Yandexin ja CERNin yhteisprojektien johtaja. Osallistuu EventIndex- ja EventFilter-palveluiden kehittämiseen, joita Yandex on tarjonnut LHCb-kokeilua varten vuodesta 2011 lähtien. 

Valmistunut Moskovan fysiikan ja tekniikan instituutista vuonna 2000, fysiikan ja matemaattisten tieteiden kandidaatti. Yksi Microsoft Imagine Cupin kansainvälisten finaalien tuomareista, ennen sitä hän oli vuonna 2005 cupin voittaneen MIPT-joukkueen mentori.

Kuinka etsiä poikkeavuuksia Large Hadron Colliderin tiedoista

Mitä ovat datapoikkeamat?

– Jos puhumme käyttämällä saatuja tietojaLarge Hadron Collider (LHC), nämä voivat olla löytöjä, jotka eivät sovi standardikäsityksiin siitä, kuinka hiukkasten hajoaminen tapahtuu siellä protonitörmäysten jälkeen. Nämä löydöt ovat poikkeavuuksia. 

Esimerkiksi, jos puhumme omaisuustarjouksistapörssissä, poikkeamat voivat johtua siitä, että tietty hedge-rahasto päätti pumpata omaisuuden tai Wall Street Bets päätti ansaita ylimääräistä rahaa ja perustaa oman hajautetun hedge-rahaston. Eli fysiikka on täysin erilainen, ja tämän fysiikan ilmentymä tiedoissa ei myöskään ole samanlainen kuin muissa tapauksissa.

Siksi, jos puhumme poikkeavuuksista, meidän on ensin ymmärrettävä, mistä tiedoista ja fysiikasta puhumme. 

— Selvennetään sitten keskittyen törmäimiin.

- Täällä se on vähän helpompaa, vaikka sitä myös syntyyhaarukka. Tosiasia on, että on olemassa tietoa siitä, millaisia prosesseja tapahtuu ilmaisimen sisällä olevien hiukkasten kanssa. Ja on tietoa siitä, kuinka tämä törmäyskone toimii. Ihmiset, jotka ovat ensisijaisesti kiinnostuneita uusien hiukkasten tai lakien löytämisestä, ovat kiinnostuneita pääasiassa ensimmäisen tyyppisistä tiedoista. Mutta tosiasia on, että kaikki, mitä fysiikassa tapahtuu, käy läpi melko pitkän tämän tiedon keräämis- ja käsittelyketjun. Ja jos jokin tämän ketjun solmuista alkaa käyttäytyä huonommin kuin kuvittelimme, eli se ylittää tietyt sallitun rajat, tämä aiheuttaa vääristymän mittauksissa. Voimme nähdä poikkeavuuksia paikassa, jossa niitä ei yleensä ollut fysiikassa.

Löydöt, jotka eivät sovi standardikäsityksiin siitä, kuinka siellä tapahtuu protonien törmäyksen jälkeen tapahtuvaa hiukkasten hajoamista, ovat poikkeavuuksia

Välttääkseen tällaisia epämiellyttäviä tapahtumia, ihmisethe kirjoittavat erityisiä tietojen laadunvalvontajärjestelmiä, jotka valvovat kaikkia mittauslaitteiden tietoja ja yrittävät jättää huomioimatta ne ajanjaksot, jolloin epäillään, että jokin on vialla. 

Yksi esimerkeistä, joista ihmiset haluavat puhuaLHC:n fyysikot kertoivat, että törmäimen toiminnan alkuvaiheessa he huomasivat poikkeavuuksia, jotka eivät sopineet fysikaalisiin käsitteisiin. LHC:tä ei vielä ollut, vaan sen edellinen versio. Tämän seurauksena fyysikot havaitsivat, että korrelaatio on erittäin vakava lähistöllä sijaitsevan rautatien juna-aikataulun kanssa. Ja jos teet näihin vaihteluihin liittyviä säätöjä, saat ei-fyysisen kuvan maailmasta. 

On tarpeen ottaa huomioon ulkoiset tekijät ja pystyäymmärtää, mitkä niistä on korvattava oikein. Yksinkertaisin ratkaisu: heitetään pois tiedot, jotka eivät sovi tavalliseen maailmakuvaan. Monimutkaisempia tarinoita on yrittää palauttaa nämä poikkeavuudet ymmärrettävien ja fyysisten periaatteiden avulla normaaleihin tietoihin ja yrittää hyötyä niistä. 

Tietojen heittäminen pois on budjettivarojen hukkaa. Jokaisella kilotavulla-megatavulla on tietty hinta.

Andrey Ustyuzhanin, Kansallisen tutkimusyliopiston kauppakorkeakoulun Big Data -analyysimenetelmien tutkimus- ja koulutuslaboratorion johtaja

- Ja miten näiden tietojen poikkeama voidaan havaita koneoppimisjärjestelmän avulla?

— Tällaisia algoritmeja on kaksi ryhmää, jotkatyöskennellä poikkeavuuksien kanssa. Ensimmäinen ryhmä yksiluokkaisia luokittelumenetelmiä sisältää algoritmit, jotka käyttävät tietoa vain niistä tapahtumista, jotka on merkitty hyviksi. Toisin sanoen he yrittävät rakentaa kuperan rungon, joka sulkee sisäänsä sen, mitä pidämme oikeana. Logiikka on tämä: kaikki, mikä menee tämän kuoren ulkopuolelle, harkitsemme poikkeavuuksia. Eli esimerkiksi 99 % tiedoista on sellaisen kuoren peitossa, ja kaikki muu näyttää joltain epäilyttävältä.

Toinen algoritmien ryhmä perustuu osittaiseenmerkitsee sitä, mitä pidämme vääränä. Pohjimmiltaan on olemassa joukko tapahtumia, joilla tiedetään olevan ei-toivottuja vaikutuksia. Ja sitten poikkeamien etsiminen laskeutuu kahden luokan luokitteluongelmaan. Tämä on tavallinen luokitin, joka voidaan rakentaa hermoverkkojen tai päätöspuiden periaatteille. 

Vivahde on, että yleensä tehtävissäpoikkeavuuksia, näyte ei ole tasapainossa. Eli positiivisten esimerkkien määrä ylittää merkittävästi negatiivisten. Tällaisissa olosuhteissa vakioluokitusalgoritmit eivät välttämättä toimi niin hyvin kuin haluaisimme. Oletushäviötoiminto kohtelee oikein kelpuutetut esiintymät tasapuolisesti ja saattaa jättää huomiotta sen tosiasian, että 10 000 oikean tuloksen joukossa on sata virheellisesti hyväksyttyä tulosta. Tämä sata edustaa vain niitä negatiivisia esimerkkejä, jotka ovat mielenkiintoisimpia. On selvää, että tätä vastaan voidaan taistella esimerkiksi antamalla enemmän painoarvoa negatiivisille esimerkeille ja ottamalla niiden luokittelussa tehdyt virheet paljon painokkaammin huomioon.

Häviötoiminto- funktio, joka tilastollisten päätösten teoriassa luonnehtii havaittuun tietoon perustuvasta virheellisestä päätöksenteosta aiheutuvia menetyksiä.

Laboratoriomme panos ongelman ratkaisemiseenAnomalian havaitsemisen tarkoituksena on ehdottaa menetelmiä, joissa yhdistyvät ensimmäisen ja toisen lähestymistavan piirteet. Eli tehtävänä työskennellä yhden luokan ja kahden luokan luokituksen kanssa. Tällainen yhdistelmä tulee mahdolliseksi, jos rakennamme poikkeavista esimerkeistä generatiivisia malleja. 

Käyttämällä lähestymistapoja, kuten generatiivisiaVastakkaisten verkostojen tai normalisoivien virtojen avulla voimme oppia palauttamaan ne esimerkit, jotka on merkitty negatiivisiksi, ja luomaan ylimääräisen näytteen, jonka avulla tavallinen luokitin voi työskennellä laajennetun synteettisen näytteen kanssa tehokkaammin. Tämä lähestymistapa toimii hyvin sekä taulukkotiedoilla että kuvilla. Tästä oli viime vuonna artikkeli, jossa kuvataan, miten tällainen järjestelmä rakennetaan, ja annetaan käytännön esimerkkejä sen käytöstä.

– Mainitsit kuvien parissa työskentelemisen. Miten se toimii tässä tapauksessa?

– On esimerkkejä, joissa näytimme työtätämä algoritmi. He valitsivat vain yhden kuvaluokista: esimerkiksi käsin kirjoitetut numerot. Ja he sanoivat, että nolla on jonkinlainen poikkeama. Ja he pyysivät neuroverkkoa, joka päättää, että nollat eivät ole samanlaisia kuin kaikki muut, kohdistamaan negatiiviseen luokkaan. Luonnollisesti nämä voivat olla paitsi nollia, myös esimerkiksi lukuja, joissa on suljettuja syklejä - 068 - tai numeroita, joissa on vaakasuuntaiset leikkauspisteet. Tai yksinkertaisesti kuvia, jotka on käännetty jossain kulmassa suhteessa muuhun näytteeseen. 

"Voimme simuloida fysiikkaa tietyin edellytyksinulkoiset parametrit hyvällä tarkkuudella ja kertovat mitkä havaittavissa olevat ominaisuudet kuvaavat oikeita signaalitapahtumia, esimerkiksi Higgsin bosonin hajoamista.

On olemassa tietojoukko nimeltä omniglot -eri fonteilla kirjoitetut kirjaimet. On olemassa valtava määrä fontteja: Futuramasta, goottilaista, käsin kirjoitettua epäsuosituista aakkosista - sanskritista tai hepreasta. Voimme sanoa, että sanskritin kirjaimet ovat poikkeama, myös tietyllä käsialalla kirjoitetut kirjaimet ovat.

Pyydämme järjestelmää oppimaan erottamaan kaikenloput näistä poikkeavista symboleista. Tärkeintä on, että ne ovat paljon pienempiä kuin kaikki muut. Tämä on vaikeus työskennellä niiden kanssa tavanomaisissa koneoppimisalgoritmeissa.

Fysiikan ja IT:n symbioosi: miten koneoppimista käytetään LHC-tutkimuksessa

— Mitä LHC:n tehtäviä ratkaistaan koneoppimisen avulla?

– Yksi suuri tehtävä, jonka parissa työskentelemme, onon nopeuttaa laskennallisia prosesseja, jotka simuloivat fyysisiä törmäyksiä ja hiukkasten hajoamista. Tosiasia on, että päätös siitä, ovatko tietyt tapahtumat samanlaisia kuin tietyt fysikaaliset vaimenemiset, tehdään sen jälkeen, kun on analysoitu melko suuri määrä simuloituja vaimenevia. Voimme simuloida fysiikkaa tietyillä ulkoisilla parametreilla hyvällä tarkkuudella ja sanoa, mitkä havaittavat ominaisuudet kuvaavat oikeita signaalitapahtumia, esimerkiksi Higgsin bosonin hajoamista. 

Mutta on tiettyjä varoituksia:Emme aina tiedä parametreja, joiden alla nämä vaimenemiset on synnytettävä. Yleensä tästä on tietty käsitys. Ja oikean fysiikan löytämisen haaste on erottaa signaalitapahtumat taustatapahtumista, jotka voivat liittyä joko palautusalgoritmien virheelliseen toimintaan tai muiden prosessien fysiikkaan, jotka ovat hyvin samankaltaisia kuin mitä yritämme löytää. Koneoppimisalgoritmit tekevät tässä hyvää työtä, mutta tarina on hyvin tunnettu. 

Mutta tällaisten algoritmien kouluttaminen vaatii sitämelko suuri tilastollinen näyte simuloiduista tapahtumista, ja näiden synteettisten tietojen laskeminen vaatii tiettyjä resursseja. Koska yhden tapahtuman simulointi vie noin minuutin tai jopa kymmenen minuuttia nykyaikaisten tietokonekeskusten laskentaajasta. Koska fyysikkojen työskentelyyn liittyvien tositapahtumien määrä kasvaa tulevina vuosina suuruusluokkaa, myös syntetisoitujen tapahtumien määrän pitäisi lisääntyä. Nyt laskentaresurssit tuskin riittävät kattamaan tutkijoiden tarpeita. Koska yhden tapahtuman simuloimiseksi meidän on laskettava mikrohiukkasten vuorovaikutus ilmaisimen rakenteen kanssa ja simuloitava vaste, jonka näemme tämän anturin antureilla erittäin suurella tarkkuudella.

Kiihdytyksen idea on kouluttaa hermoverkkoatapahtumissa, jotka on simuloitu käyttämällä sertifioitua pakettia - GMT 4, joka simuloi kaikkea, mitä törmäysilmaisimien sisällä tapahtuu. Tämä neuroni oppii vertaamaan tuloja, niiden hiukkasten parametreja, joita haluamme simuloida, ja ulostuloja - ilmaisimen tuottamia havaittavia ominaisuuksia. Neuroverkot selviytyvät nykyään jo varsin hyvin tiedon interpoloinnin tehtävästä. Ja useat laboratoriomme projektit tähtäävät juuri tähän. Toisin sanoen hajoamisten ominaisuuksien palauttamiseksi käytettävissä olevasta synteettisestä näytteestä, eli sellaisen toisen asteen synteettisten materiaalien valmistamiseksi. Mutta siinä on vivahde: hermoverkkojen etu on, että voimme hienosäätää niitä käyttämällä todellista dataa. Toisin sanoen, tee tästä asetuksesta tarkempi tiettyä fyysistä hajoamista varten. 

Ihmiset, jotka harjoittavat täysipainoista fyysistä toimintaasimulaatio, he käyttävät aikaa ja vaivaa tähän, mutta neuronien kanssa se osoittautuu hieman vähemmän työvoimavaltaiseksi. Ja tuloksista, joita teimme LHTV-kokeessa CERN:ssä ja Dubna MPD -kokeiluprojektissa Nica-kiihdytinssä, kävi selväksi, että hermoverkot voivat saavuttaa erittäin suuren tarkkuuden kattamaan simuloitujen tapahtumien vaiheavaruuden. Ne nopeuttavat merkittävästi laskentaprosessia: tilaukset ja jopa satoja nopeammin kuin rehellinen simulaatio.

— Miten hermoverkko itse oppii? 

– Oppimisprosessissa ei ole eroja.Mutta on yksi erikoisuus: neuroverkolle on koulutusnäytteen lisäksi tarpeen muotoilla laatukriteerit, eli asettaa häviöfunktio, joka parhaiten vastaisi tehtävää, jonka kanssa tämän verkon tulisi selviytyä hyvin. Lisäksi tällaisen hermoverkon työn laatu ei ole tutkijoiden arvioita: sitä voidaan arvioida riittävästi tietojenkäsittelyn myöhemmässä vaiheessa tapahtuvien laskennallisten vaiheiden perusteella. 

Voimme määrittää, onko simulaatio hyvä vai eivasta sen jälkeen, kun olemme saaneet tapahtumat läpi niiden analysointi-, rekonstruktioketjun ja ymmärrämme, että niistä palautetaan samat ominaisuudet, jotka alun perin asetimme niihin. Tämä tarkoittaa, että esimerkiksi yksinkertaisen MSE Mean Squared Error -mittarin käyttö ei riitä.

MSE Mean Squared Error- mittaa arvioitujen arvojen ja todellisen arvon välisen neliöjuuriarvon.

Neuroverkon käyttäytymistä on arvioitava tarkemminominaisuuksia parametrialueilla, joita ei ehkä ollut koulutussarjassa. Sellaisten mallien rakentaminen, jotka käyttäytyvät huomattavasti koulutusvaiheessa tunnettuja parametriarvoja pidemmälle, on suuri ja teoreettinen tehtävä. 

Neuroverkot ovat hyviä paikoissa, joissa netiesi jotain koulutusvaiheessa. Niiden ulkopuolella he voivat antaa mitä haluavat. Meidän tapauksessamme tämä on erityisen herkkää, koska siitä riippuu ympäröivän todellisuuden fyysisen tulkinnan oikeellisuus. 

"Jos pimeän aineen hiukkanen hajoaa hiukkasiksi, joiden kanssa tiedämme kuinka olla vuorovaikutuksessa, voidaan olettaa, että tämä pimeän aineen hiukkanen todella oli"

- Eli hermoverkko etsii harvinaisia tapahtumia, joita törmätäjässä voi tapahtua?

— Perustuu generatiivisten mallien toimintaan, eliEnsinnäkin puhumme synteesistä kaikesta, mitä voi tapahtua. Teemme tämän minimalleilla. Ja tällaisten verkkojen tuloksena voimme rakentaa mallin, joka etsii mitä tarvitsemme: mitä onnistuimme luomaan generatiivisessa hermoverkossa.

Kuinka etsiä pimeää ainetta ja miksi tähän tarvitaan neuroverkkoja

— Voidaanko samanlaista hakuperiaatetta soveltaa pimeään aineeseen?

- Tosiasia on, että pimeää ainetta voidaan etsiäeri tavoilla. Yksi tapa on rakentaa kunnollinen ilmaisin, joka pystyy eristämään melko hyvin tavallisen aineen vaikutuksista. Eli estää fyysikkojen tuntemista hiukkasista tuleva signaali. Tämä on vain eliminointimenetelmä: jos ilmaisin näkee jotain muuta kuin melua, se näkee jotain, mitä emme ole koskaan ennen nähneet. Yksi mahdollisuus olisi, että nämä ovat pimeän aineen hiukkasia.

Jos esimerkiksi pimeän aineen hiukkanenhajoaa hiukkasiksi, joiden kanssa tiedämme kuinka olla vuorovaikutuksessa, ja on selvää, että hajoamisen jälkiä ei voinut ilmaantua mistään muualta kuin siitä, niin voimme olettaa, että tämä pimeän aineen hiukkanen todella oli.

Tällaisista kokeista keskustellaan ja niitä suunnitellaan.Yksi niistä on nimeltään SHiP (Search for Hidden Particles). Ja muuten, tällaiseen kokeeseen voidaan soveltaa myös lähestymistapoja, joista puhuin. Se vaatii simulaatiota ja algoritmeja harvinaisten lähestymistapojen tunnistamiseen. Mutta koska tämän kokeen valoisuus on paljon pienempi (valoisuus on hiukkasten määrä, jotka on suunniteltu havaittavissa aikayksikköä kohti), tarve simuloida suuri määrä samanlaisia tapahtumia ei ole niin akuutti kuin Hadron Colliderin tapauksessa. ilmaisimia. Vaikka esimerkiksi fysiikan tuntema suojausjärjestelmän laadun arviointiin liittyvä tehtävä hiukkasia vastaan vaatii melko monen tapahtuman simulointia. Tämä on tarpeen, jotta varmistetaan, että suojaus toimii hyvin valtavan määrän erityyppisiä hiukkasia vastaan.

Laivaon kokeilu, jonka tarkoituksena on löytää piilotettujahiukkasia, mukaan lukien pimeän aineen hiukkaset, SPS-kiihdyttimen hiukkasvirrassa, joka on suodatettu magneettikentillä, viiden metrin kerros betonia ja metallia. 

On muitakin tapoja etsiä pimeää ainetta,liittyy avaruusilmiöiden havaintoihin. Erityisesti yksi lähestymistapa on rakentaa herkkiä elementtejä, jotka tunnistavat hyvin heikosti vuorovaikutuksessa olevien hiukkasten suunnan riippuen tämän hiukkasen tulokulmasta. Kokeen logiikka on, että herkät elementit on mahdollista sijoittaa niin, että ne suuntautuvat aurinkokunnan liikevektoria pitkin eli kohti Cygnuksen tähdistöä. Silloin pystymme erottamaan maapallon koordinaatistossa liikkuvat hiukkaset eri tavalla liikkuvista hiukkasista. Kuten liikkumaton eetteri, joka jakautuu ulkoavaruuteen omien lakiensa mukaisesti, ei millään tavalla liity planeettojen suuntaukseen ja liikesuuntaan. Se on vain, että eetterin sijasta oletetaan, että on olemassa pimeän aineen hiukkasia. Ne voivat olla heikosti vuorovaikutuksessa kokeilumme antureiden kanssa. Ja analysoimalla niiden lukemia on mahdollista johtaa kuvioita vuorovaikutuksessa olevien hiukkasten kulmajakaumista. Jos näemme, että on olemassa vakava komponentti, joka ei riipu Maan sijainnista avaruudessa, tämä osoittaa aiemmin tuntemattomien hiukkasten olemassaolon. Ja ehkä nämä ovat ehdokkaita pimeän aineen hiukkasille. 

Tällaisessa kokeessa simulointi on varsin tärkeää,koska signaalitapahtumien tunnistamisalgoritmin rakentamiseksi sinun on kuviteltava, miltä meitä kiinnostava signaali näyttää. Siksi nopeaan simulointiin ja poikkeamien etsimiseen liittyvät tehtävät ovat asiaankuuluvia ja soveltuvia siellä.

He puhuvat eri kieliä, mutta tavoitteet ovat yhteiset

Puhutaanpa työskentelystä CERNissä. Millaista on IT-henkilöllä työskennellä fyysikkojen kanssa? Mitä ominaisuuksia liittyy työskentelyyn sellaisessa poikkitieteellisessä tilassa kuin LHC?

- Hyvä kysymys.Itse asiassa ihmiset puhuvat eri kieliä: samat käsitteet esitetään graafisesti eri tavoin. Esimerkiksi ROC-käyrät, joihin koneoppimisen asiantuntijat ovat tottuneet, piirretään fysiikassa yleensä 90 astetta kierrettynä. Ja koordinaatteja ei kutsuta todelliseksi positiiviseksi ja vääräksi negatiiviseksi nopeudeksi, vaan signaalin tehokkuuteen ja taustan hylkäämiseen. Lisäksi, jos signaalin tehokkuus on edelleen tarkkuus, taustan hylkäys on yksi miinus todellinen negatiivinen määrä. 

ROC-käyrä (englanniksi vastaanottimen toimintaominaisuus, vastaanottimen toimintaominaisuus)— kaavio, jonka avulla voit arvioida binaarin laatualuokitukset. Näyttää suhteen objektien osuuksien välillä attribuutin kantajiksi oikein luokiteltujen attribuutin kantajien kokonaismäärästä ja niiden objektien osuuksien välillä, jotka eivät sisällä attribuuttia ja jotka on luokiteltu attribuuttia kuljettaviksi väärin.

On selvää, että tällaisia asioita voi ollapinnoille ja niihin on suhteellisen helppo tottua, mutta suurimmat haasteet ovat joidenkin tutkijoiden artikkeleita kirjoittaessaan tekemien perusoletusten ymmärtäminen. Ja yleensä he ylittävät sen, mistä he kirjoittavat. Tämä on siis jotain salaista tietoa, joka välittyy henkilön koulutuksen aikana tutkijakoulussa, hänen tutkimusprojektiensa työskentelyn aikana, se muodostuu hänen mielessään. 

Toisen tieteenalan ihmisille se on kuinerilainen kulttuuriympäristö. Heille nämä oletukset eivät ehkä ole niin ilmeisiä. Koska sanasto osoittautuu melko laajaksi ja erilaiseksi, dialogin rakentaminen voi viivästyä tai olla jopa tehotonta. Siksi tässä suosituksena voidaan todennäköisesti neuvoa joko pyytämään ihmisiä menemään pidemmälle, mihin he ovat tottuneet, ja muotoilemaan ongelman fysiikasta abstrakteimmilla termeillä. Teemme tämän osittain järjestäessämme kilpailuja osana IDAL-olympialaistamme. Dialogin prosessissa löydämme ympäristön, joka ei vaatisi syvää fysiikkaan uppoamista, mutta olisi samalla mielenkiintoinen koneoppimisen asiantuntijoille.

Tänä vuonna meillä oli yhteinen projektiitalialainen laboratorio, joka etsii pimeää ainetta. He toimittivat synteettisiä tietoja olympialaisia varten tämän pimeän aineen löytämiseksi. Siellä ei todellakaan ole pimeää ainetta, koska tunnetun fysiikan hajoamisia simuloitiin: elektronien ja heliumionien törmäyksiä.  Mutta pimeän aineen hiukkasten törmäykset voivat olla hyvin samanlaisia kuin jotkut näistä törmäyksistä. Niitä on erittäin vaikea simuloida ja vielä vaikeampi tulkita. Siksi päätimme olla poimimatta näitä tietoja varsinkin ihmisille, jotka eivät ole tämän alan asiantuntijoita, vaan rajoitamme vain samankaltaisiin tietoihin. Algoritmit, joita näemme, toimivat likimääräisellä tiedolla, mutta niitä voidaan soveltaa myös todellisiin tietoihin.

Andrei Ustyuzhanin. Kuva puhujan arkistosta

Yhteenvetona voidaan todeta, että yksi tapa on sopia selkeät ehdot kaikille, ja toinen on käyttää aikaa ja vaivaa, käydä kesäkouluissa, osallistua käytännön tutkimusprojekteihin.

Andrey Ustyuzhaninin suosittelemat kirjat koneoppimisesta ja fyysisistä kokeista:

Deepak Kar,Kokeellinen hiukkasfysiikka: mittausten ja hakujen ymmärtäminen suuressa hadronitörmäyttimessä.
Ilja Narski,Tilastolliset analyysitekniikat hiukkasfysiikassa: sovitukset, tiheyden arviointi ja ohjattu oppiminen. 
Giuseppe Carleo,Koneoppiminen ja fyysiset tieteet.

- Onko fyysikkojen ja IT-asiantuntijoiden arvojen välillä ristiriitoja: esimerkiksi onko jollekin tärkeämpää vuorovaikutuksen luonne vai päinvastoin tarkkuus?

– Jos puhumme nimenomaan tarkkuudesta, luultavastiei ole epäselvyyttä. Mutta tämä johtuu todennäköisemmin siitä, että IT-asiantuntijat eivät ymmärrä tietojen luonnetta. On vain niin, että jos mittaamme tiedot millimetrin tarkkuudella, ei ole mitään järkeä laskea pinta-alaa neliömikronin tarkkuudella. Monimutkaisten hermoverkkojen tapauksessa kohtaamme sen tosiasian, että ne tuottavat tietoa mantissan viimeiseen merkkiin saakka, mutta näillä merkeillä ei ole sen enempää merkitystä kuin syötteen tarkkuudella. 

No, ehkä yleinen toive ihmisilleMallien tarkkuuden arvioinnissa on annettava absoluuttisten ominaisuuksien lisäksi myös hyväksyttävien alueiden rajat tai leviäminen, jolla nämä arvot on saatu. Itse asiassa hyvä suositus ei vain niille, jotka ovat vuorovaikutuksessa fyysikkojen tai biologien kanssa. Tämä on periaatteessa oikea tapa säilyttää saatujen tulosten esitys.

Ja jos puhumme siitä, kuinka paljon ne voivat ollaerilaiset odotukset toisella ja toisella, niin nämä ovat kaikki itse asiassa toimivia kysymyksiä. Jos kiinnostusta on molemmin puolin, ne voidaan ratkaista yksinkertaisesti ja hyvin. Toisin sanoen koneoppiminen on nyt kysyntää fyysikkojen keskuudessa laajassa mielessä, koska se tarjoaa tarkempia työkaluja heidän tietojensa käsittelyyn. Ja se toimii päinvastaiseen suuntaan, koska koneoppimisen asiantuntijoille voi olla paljon mielenkiintoisempaa nähdä, kuinka heidän algoritminsa auttavat esimerkiksi uusien hiukkasten löytämisessä, kuten laboratoriossamme. Työskentelimme pitkään luodaksemme algoritmin, joka määrittäisi hiukkasen tyypin. Äskettäin uutisoitiin uusien tetrakvarkkien löytämisestä, ja algoritmimme osallistuivat suoraan niiden löytämiseen. 

Siksi IT-alan ihmisille, ehdollisesti tietotieteestä,Tietojenkäsittelytiede, kehittämiensa algoritmien hyödyllisyyden tunteminen on erittäin tärkeää. Siksi tiedekunnassamme on esimerkiksi kansainvälinen bioinformatiikan laboratorio. 

Tällaisia vuorovaikutuksia tulee yhä enemmänyhä normaalimpaa. En tiedä, voidaanko niitä jo pitää valtavirtaina vai pitääkö vielä odottaa, mutta tavalla tai toisella tämä tarina on väistämätön. Vaikka katsoisit työpajoja, jotka järjestetään osana nykypäivän johtavia tekoälykonferensseja, tekoälyn käyttöä fysikaalisissa tieteissä käsittelevä työpaja on johtavassa asemassa kiinnostuneiden määrässä. 

Lue lisää:

Amerikkalainen satelliitti "näki" epätavallisen viestin Maasta

Julkaistu video raketista, joka laukaistiin kokeellisesta kiihdyttimestä

Hirviö galaksimme keskustassa: katso kuvaa Linnunradan mustasta aukosta

Geek Tech verkossa

Kaikki teknologiasta ja gadgeteista

Anomalian metsästäjät: kuinka CERN etsii harvinaisia hiukkasia Yandex-algoritmeilla

Kuinka etsiä poikkeavuuksia Large Hadron Colliderin tiedoista

Fysiikan ja IT:n symbioosi: miten koneoppimista käytetään LHC-tutkimuksessa

Kuinka etsiä pimeää ainetta ja miksi tähän tarvitaan neuroverkkoja

He puhuvat eri kieliä, mutta tavoitteet ovat yhteiset