Anomāliju mednieki: kā CERN meklē retas daļiņas, izmantojot Yandex algoritmus

Andrejs Ustjužaņins— Nacionālās pētniecības universitātes Ekonomikas augstskolas Lielo datu analīzes metožu pētniecības un izglītības laboratorijas vadītājs.

Yandex un CERN kopīgo projektu vadītājs. Piedalās EventIndex un EventFilter pakalpojumu izstrādē, ko Yandex nodrošina LHCb eksperimentam kopš 2011. gada. 

2000. gadā absolvējis Maskavas Fizikas un tehnoloģijas institūtu, fizisko un matemātikas zinātņu kandidāts. Viens no Microsoft Imagine Cup starptautiskā fināla tiesnešiem, pirms tam bijis mentors 2005. gadā kausu ieguvušajā MIPT komandā.

Kā meklēt anomālijas Lielā hadronu paātrinātāja datos

Kas ir datu anomālijas?

— Ja runājam par datiem, kas iegūti, izmantojotLielais hadronu paātrinātājs (LHC), tie var būt atklājumi, kas neatbilst standarta idejām par to, kā daļiņu sabrukšana notiek pēc protonu sadursmēm. Šie atklājumi būs anomālijas. 

Piemēram, ja mēs runājam par aktīvu kotācijāmна бирже, то там аномалии могут быть связаны с тем, что некий хедж-фонд решил прокачать актив или Wall Street Bets решили подзаработать и устроили свой распределенный хедж-фонд. То есть и физика совершенно разная, и проявление этой физики в данных тоже не похоже другие кейсы.

Tāpēc, ja runājam par anomālijām, vispirms ir jāsaprot, par kādiem datiem un par kādu fiziku ir runa. 

— Tad precizēsim, koncentrējoties uz kolaideriem.

– Šeit ir nedaudz vieglāk, lai gan arī tā rodasdakša. Fakts ir tāds, ka ir dati par to, kādi procesi notiek ar daļiņām detektora iekšpusē. Un ir dati par to, kā šis koliders darbojas. Cilvēki, kuri galvenokārt interesējas par jaunu daļiņu vai likumu atklāšanu, galvenokārt interesējas par pirmā veida datiem. Bet fakts ir tāds, ka viss, kas notiek fizikā, iet cauri diezgan garai šīs informācijas vākšanas un apstrādes ķēdei. Un, ja kāds no šīs ķēdes mezgliem sāk izturēties ne tik labi, kā mēs iedomājāmies, tas ir, tas pārsniedz noteiktas pieļaujamās robežas, tas rada mērījumu izkropļojumus. Mēs varam redzēt anomālijas tajā vietā, kur tās vispār nebija fizikā.

Atklājumi, kas neiekļaujas standarta priekšstatos par to, kā tur notiek daļiņu sabrukšana, kas rodas pēc protonu sadursmes, būs anomālijas

Lai izvairītos no šādiem nepatīkamiem notikumiem, cilvēkiviņi raksta īpašas datu kvalitātes kontroles sistēmas, kas uzrauga visus datus mērinstrumentos un cenšas izslēgt no izskatīšanas tos laika periodus, kad ir aizdomas, ka kaut kas noiet greizi. 

Viens no piemēriem, par ko cilvēkiem patīk runātfiziķi no LHC, bija tas, ka kolidera darbības sākumposmā viņi pamanīja anomālijas, kas neatbilst fiziskajiem jēdzieniem. Vēl nebija LHC, bet tā iepriekšējā versija. Rezultātā fiziķi atklāja, ka korelācija ir ļoti nopietna ar vilcienu kustības sarakstu uz dzelzceļa, kas atrodas netālu. Un, ja veicat korekcijas, kas saistītas ar šīm svārstībām, jūs iegūstat nefizisku priekšstatu par pasauli. 

Ir jāņem vērā ārējie faktori un jāspējsaprast, kurš no tiem ir pareizi jākompensē. Vienkāršākais risinājums: izmetīsim ārā tos datus, kas neiederas ierastajā pasaules attēlā. Sarežģītāki stāsti ir mēģināt atgriezt šīs anomālijas, izmantojot saprotamus un fiziskus principus, normālos datos un mēģināt no tām gūt labumu. 

Datu izmešana ir budžeta līdzekļu izšķērdēšana. Katram kilobaitam-megabaitam ir noteikta cena.

Andrejs Ustjužaņins, Nacionālās pētniecības universitātes Ekonomikas augstskolas Lielo datu analīzes metožu pētniecības un izglītības laboratorijas vadītājs

- Un, attiecīgi, kā šajos datos var noteikt anomāliju, izmantojot mašīnmācīšanās sistēmu?

— Ir divas šādu algoritmu grupas, kurasdarbs ar anomālijām. Pirmajā vienas klases klasifikācijas metožu grupā ietilpst algoritmi, kas izmanto informāciju tikai par tiem notikumiem, kas ir atzīmēti kā labi. Tas ir, viņi cenšas izveidot izliektu korpusu, kas aptver visu, ko mēs uzskatām par pareizu. Loģika ir šāda: viss, kas pārsniedz šo apvalku, mēs apsvērsim anomālijas. Tas ir, piemēram, 99% datu sedz šāds apvalks, un viss pārējais izskatās pēc kaut kā aizdomīga.

Vēl viena algoritmu grupa balstās uz daļējuatzīmējot to, ko uzskatām par nepareizu. Būtībā ir notikumu kopums, kuriem ir zināms, ka tiem ir nevēlami rezultāti. Un tad anomāliju meklēšana nonāk līdz divu klašu klasifikācijas problēmai. Šis ir parasts klasifikators, ko var veidot pēc neironu tīklu vai lēmumu koku principiem. 

Nianse ir tāda, ka parasti uzdevumosanomālijas, paraugs nav līdzsvarots. Tas ir, pozitīvo piemēru skaits ievērojami pārsniedz negatīvo. Šādos apstākļos standarta klasifikācijas algoritmi var nedarboties tik labi, kā mēs vēlētos. Noklusējuma zuduma funkcija vienādi apstrādā gadījumus, kas ir pareizi kvalificēti, un var neievērot faktu, ka starp 10 000 pareiziem rezultātiem ir simts nepareizi kvalificēti gadījumi. Šis simts tikai atspoguļo tos negatīvos piemērus, kas ir visinteresantākie. Skaidrs, ka ar to var cīnīties, piemēram, negatīviem piemēriem piešķirot lielāku nozīmi un ar daudz lielāku svaru ņemot vērā kļūdas to klasifikācijā.

Zaudējuma funkcija- funkcija, kas statistisko lēmumu teorijā raksturo zaudējumus nepareizu lēmumu pieņemšanas rezultātā, pamatojoties uz novērotajiem datiem.

Mūsu laboratorijas ieguldījums problēmas risināšanāAnomāliju noteikšana ir ierosināt metodes, kas apvieno pirmās un otrās pieejas iezīmes. Tas ir, uzdevums strādāt ar vienas klases un divu klašu klasifikāciju. Šāda kombinācija kļūst iespējama, ja mēs veidojam anomālu piemēru ģeneratīvus modeļus. 

Izmantojot tādas pieejas kā ģeneratīvāKonkurences tīkli vai plūsmas normalizēšana, mēs varam iemācīties atgūt tos piemērus, kas ir apzīmēti kā negatīvi, un ģenerēt papildu paraugu, kas ļaus parastajam klasifikatoram efektīvāk strādāt ar paplašināto sintētisko paraugu. Šī pieeja labi darbojas gan tabulas datiem, gan attēliem. Pagājušajā gadā par to bija raksts, kurā ir aprakstīts, kā tiek veidota šāda sistēma, un sniegti praktiski piemēri tās izmantošanai.

— Jūs minējāt darbu ar attēliem. Kā tas darbojas šajā gadījumā?

— Ir piemēri, kuros parādījām darbušis algoritms. Viņi vienkārši izvēlējās vienu no attēlu klasēm: piemēram, ar roku rakstītus skaitļus. Un viņi teica, ka nulle ir kaut kāda anomālija. Un viņi lūdza neironu tīklu, kas nolemj, ka nulles nav kā viss pārējais, piešķirt negatīvajai klasei. Protams, tās var būt ne tikai nulles, bet arī, piemēram, skaitļi, kuros ir slēgti cikli - 068 - vai skaitļi ar horizontāliem krustojumiem. Vai vienkārši attēli, kas pagriezti noteiktā leņķī attiecībā pret pārējo paraugu. 

"Mēs varam simulēt fiziku saskaņā ar noteiktiem nosacījumiemārējos parametrus ar labu precizitāti un pasakiet, kādi novērojamie raksturlielumi aprakstīs pareizos signāla notikumus, piemēram, Higsa bozona sabrukšanu.

Ir datu kopa, ko sauc par omniglot -burti, kas rakstīti dažādos fontos. Ir milzīgs skaits fontu: no Futurama, gotikas, ar roku rakstīts no nepopulāriem alfabētiem - sanskrita vai ebreju. Var teikt, ka burti sanskritā ir anomālija, arī burti, kas rakstīti noteiktā rokrakstā.

Mēs lūdzam sistēmu iemācīties atšķirt visupārējais no šiem anomālajiem simboliem. Galvenais ir tas, ka tie ir daudz mazāki par visu pārējo. Tas ir grūtības strādāt ar tiem parastajiem mašīnmācīšanās algoritmiem.

Fizikas un IT simbioze: kā mašīnmācība tiek izmantota LHC pētījumos

— Kādi LHC uzdevumi tiek risināti ar mašīnmācības palīdzību?

— Viens liels uzdevums, ar kuru mēs strādājam, irmērķis ir paātrināt skaitļošanas procesus, kas simulē fiziskas sadursmes un daļiņu sabrukšanu. Fakts ir tāds, ka lēmums par to, vai konkrētie notikumi ir līdzīgi noteiktiem fizikāliem samazinājumiem, tiek pieņemts pēc diezgan liela skaita simulēto samazinājumu analīzes. Mēs varam ar labu precizitāti simulēt fiziku pie noteiktiem ārējiem parametriem un pateikt, kādi novērojamie raksturlielumi raksturos pareizos signāla notikumus, piemēram, Higsa bozona sabrukšanu. 

Но есть определенные оговорки:Mēs ne vienmēr zinām parametrus, saskaņā ar kuriem šie samazinājumi jāģenerē. Parasti par to ir zināms priekšstats. Un izaicinājums atrast pareizo fiziku ir atšķirt signālu notikumus no fona notikumiem, kas var būt saistīti vai nu ar nepareizu atkopšanas algoritmu darbību, vai ar citu procesu fiziku, kas ir ļoti līdzīga tam, ko mēs cenšamies atrast. Mašīnmācīšanās algoritmi to labi paveic, taču tas ir labi zināms stāsts. 

Bet, lai apmācītu šādus algoritmus, tas ir nepieciešamsdiezgan liels simulētu notikumu statistiskais paraugs, un šo sintētisko datu aprēķināšanai ir nepieciešami noteikti resursi. Jo viena notikuma simulācija aizņem apmēram minūti vai pat desmit minūtes mūsdienu datorcentru skaitļošanas laika. Sakarā ar to, ka reālo notikumu skaits, ar kuriem strādās fiziķi, tuvākajos gados pieaugs par lielumu kārtām, vajadzētu palielināties arī sintezēto notikumu skaitam. Tagad ar skaitļošanas resursiem tik tikko pietiek, lai segtu pētnieku vajadzības. Jo, lai simulētu vienu notikumu, mums ir jāaprēķina mikrodaļiņu mijiedarbība ar detektora struktūru un jāmodelē reakcija, ko mēs redzēsim uz šī detektora sensoriem ar ļoti augstu precizitāti.

Paātrinājuma ideja ir apmācīt neironu tīklupar notikumiem, kas tika simulēti, izmantojot sertificētu pakotni - GMT 4, kas simulē visu, kas notiek sadursmes detektoru iekšpusē. Šis neirons iemācīsies salīdzināt ievades, to daļiņu parametrus, kuras mēs vēlamies simulēt, un izejas - tos novērojamos raksturlielumus, ko detektors rada. Neironu tīkli mūsdienās jau diezgan labi tiek galā ar datu interpolācijas uzdevumu. Un vairāki projekti mūsu laboratorijā ir vērsti tieši uz to. Tas ir, atjaunot sabrukšanas īpašības no pieejamā sintētiskā parauga, tas ir, izgatavot šādu otrās kārtas sintētiku. Bet ir nianse: neironu tīklu priekšrocība ir tā, ka mēs varam tos precīzi noregulēt, izmantojot reālus datus. Tas ir, padariet šo iestatījumu precīzāku konkrētam fiziskam samazinājumam. 

Cilvēki, kuri nodarbojas ar pilnvērtīgu fiziskosimulācija, viņi tam velta savu laiku un pūles, bet ar neironiem tas izrādās nedaudz mazāk darbietilpīgs. Un no rezultātiem, ko veicām LHTV eksperimentam CERN un Dubnas MPD eksperimenta projektam Nicas paātrinātājā, kļuva skaidrs, ka neironu tīkli var sasniegt ļoti augstu precizitāti, aptverot simulēto notikumu fāzes telpu. Tie ievērojami paātrina aprēķinu procesu: pasūtījumus un pat simtus ātrāk nekā godīga simulācija.

— Kā mācās pats neironu tīkls? 

— Mācību procesā nav atšķirību.Bet ir viena īpatnība: neironu tīklam papildus apmācības paraugam ir jāformulē kvalitātes kritēriji, tas ir, jāiestata zuduma funkcija, kas vislabāk atbilstu uzdevumam, ar kuru šim tīklam būtu labi jātiek galā. Turklāt šāda neironu tīkla darba kvalitāti pētnieki nevērtē: to var adekvāti novērtēt, ņemot vērā skaitļošanas soļus, kas notiek vēlākā datu apstrādes posmā. 

Lai noteiktu, vai simulācija ir laba vai nē, mēs varamtikai pēc tam, kad mēs izlaižam notikumus cauri to analīzes, rekonstrukcijas ķēdei un saprotam, ka no tiem tiek atjaunoti tie paši raksturlielumi, kurus mēs tiem sākotnēji ielikām. Tas nozīmē, ka, piemēram, nepietiek ar vienkāršu MSE Mean Squared Error metrikas izmantošanu.

MSE vidējā kvadrāta kļūda- mēra vidējo kvadrātisko starpību starp aprēķinātajām vērtībām un faktisko vērtību.

Neironu tīkla uzvedība ir jānovērtē tālākfunkcijas parametru diapazonos, kas, iespējams, nebija iekļauti apmācību komplektā. Izveidot tādus modeļus, kas darbojas krietni tālāk par parametru vērtībām, kas zināmas apmācības posmā, ir liels un teorētisks uzdevums. 

Neironu tīkli ir labi tajās vietās, kur tiekaut ko zināja apmācības posmā. Ārpus viņiem viņi var izdalīt visu, ko vēlas. Mūsu gadījumā tas ir īpaši jūtīgi, jo no tā ir atkarīga apkārtējās realitātes fiziskās interpretācijas pareizība. 

"Ja tumšās vielas daļiņa sadalās daļiņās, ar kurām mēs zinām, kā mijiedarboties, var pieņemt, ka šī tumšās vielas daļiņa patiešām bija."

- Tas ir, neironu tīkls meklē retus notikumus, kas var notikt pie sadursmes?

— Pamatojoties uz ģeneratīvo modeļu darbību, tas ir,Pirmkārt, mēs runājam par visa, kas var notikt, sintēzi. Mēs to darām ar miniatūriem modeļiem. Un šādu tīklu rezultātā mēs varam izveidot modeli, kas meklēs to, kas mums nepieciešams: ko mums izdevās ģenerēt ģeneratīvā neironu tīklā.

Kā meklēt tumšo vielu un kāpēc tam ir nepieciešami neironu tīkli

— Vai līdzīgu meklēšanas principu var attiecināt uz tumšo vielu?

- Fakts ir tāds, ka tumšo vielu var meklētDažādi ceļi. Viens veids ir izveidot atbilstošu detektoru, kas var diezgan labi izolēt no parastās vielas iedarbības. Tas ir, lai bloķētu signālu, kas nāk no fiziķiem zināmām daļiņām. Šī ir tikai likvidēšanas metode: ja detektors redz kaut ko citu, nevis troksni, tad tas redz kaut ko tādu, ko mēs nekad iepriekš neesam redzējuši. Viena iespēja būtu, ka tās ir tumšās vielas daļiņas.

Ja, piemēram, tumšās vielas daļiņasadalās daļiņās, ar kurām mēs zinām, kā mijiedarboties, un ir skaidrs, ka sabrukšanas pēdas nevarēja parādīties nekur, izņemot no tās, tad mēs varam pieņemt, ka šī tumšās vielas daļiņa patiešām bija.

Šādi eksperimenti tiek apspriesti un plānoti.Viens no tiem saucas SHiP (Meklēt slēptās daļiņas). Un, starp citu, šādam eksperimentam ir piemērojamas arī pieejas, par kurām es runāju. Tam nepieciešama simulācija un algoritmi, lai atpazītu retas pieejas. Bet, tā kā šī eksperimenta spilgtums ir daudz mazāks (spīdums ir daļiņu skaits, kuras plānots noteikt laika vienībā), nepieciešamība simulēt lielu skaitu līdzīgu notikumu nav tik akūta kā hadronu paātrinātāja gadījumā. detektori. Lai gan, piemēram, uzdevums, kas saistīts ar fizikā zināmo aizsargsistēmas pret daļiņām kvalitātes novērtēšanu, prasa simulēt diezgan lielu notikumu skaitu. Tas ir nepieciešams, lai pārliecinātos, ka aizsardzība labi darbojas ar milzīgu skaitu ienākošo dažāda veida daļiņu.

KUĢISir eksperiments, kura mērķis ir atrast slēptodaļiņas, tostarp tumšās vielas daļiņas, daļiņu plūsmā no SPS paātrinātāja, ko filtrē magnētiskie lauki, piecu metru betona un metāla slānis. 

Ir arī citi veidi, kā meklēt tumšo vielu,kas saistīti ar kosmosa parādību novērojumiem. Jo īpaši viena pieeja ir veidot jutīgus elementus, kas atpazīst ļoti vāji mijiedarbojošo daļiņu virzienu atkarībā no šīs daļiņas krišanas leņķa. Eksperimenta loģika ir tāda, ka ir iespējams novietot jutīgos elementus tā, lai tie būtu orientēti gar Saules sistēmas kustības vektoru, tas ir, uz Cygnus zvaigznāju. Tad mēs varēsim atšķirt daļiņas, kas pārvietojas Zemes koordinātu sistēmā, no daļiņām, kas pārvietojas atšķirīgi. Tāpat kā nekustīgais ēteris, kas izplatās kosmosā pēc saviem likumiem, nekādi nav saistīts ar planētu orientāciju un kustības virzienu. Vienkārši tiek pieņemts, ka ētera vietā ir tumšās vielas daļiņas. Viņi var vāji mijiedarboties ar mūsu eksperimenta sensoriem. Un, analizējot to rādījumus, ir iespējams iegūt mijiedarbojošo daļiņu leņķisko sadalījumu modeļus. Ja mēs redzam, ka ir kāda nopietna sastāvdaļa, kas nav atkarīga no Zemes stāvokļa kosmosā, tas liecinās par iepriekš nezināmu daļiņu esamību. Un, iespējams, tie būs tumšās vielas daļiņu kandidāti. 

Šādā eksperimentā simulācija ir diezgan svarīga,jo, lai izveidotu algoritmu signālu notikumu atpazīšanai, jums ir jāiedomājas, kā izskatās mūs interesējošais signāls. Līdz ar to uzdevumi, kas saistīti ar ātru simulāciju un anomāliju meklēšanu, tur ir aktuāli un piemērojami.

Viņi runā dažādās valodās, bet mērķi ir kopīgi

Parunāsim par darbu CERN. Kā IT cilvēkam ir strādāt ar fiziķiem? Kādas funkcijas ir saistītas ar darbu tādā starpzinātniskā telpā kā LHC?

- Labs jautājums.Patiešām, cilvēki runā dažādās valodās: vieni un tie paši jēdzieni tiek grafiski attēloti dažādos veidos. Piemēram, ROC līknes, pie kurām ir pieraduši mašīnmācības speciālisti, fizikā parasti tiek zīmētas pagrieztas par 90 grādiem. Un koordinātas sauc nevis par patieso pozitīvo ātrumu un viltus negatīvo ātrumu, bet gan par signāla efektivitāti un fona noraidīšanu. Turklāt, ja signāla efektivitāte joprojām ir Precizitāte, tad fona noraidījums ir viens mīnus patiesais negatīvais rādītājs. 

ROC līkne (no angļu valodas uztvērēja darbības raksturlieluma, uztvērēja darbības raksturlielums)— grafiks, kas ļauj novērtēt bināra kvalitātiklasifikācijas. Parāda attiecību starp objektu daļām no kopējā atribūtu nesēju skaita, kas pareizi klasificēti kā atribūta nesēji, un objektu daļām no kopējā objektu skaita, kuriem nav atribūta un kas nepareizi klasificēti kā atribūta nesēji.

Ir skaidrs, ka tādas lietas var būtvirsmām un ir samērā viegli pierast, taču galvenās problēmas ir izprast dažus pamata pieņēmumus, ko pētnieki izdara, rakstot savus darbus. Un, kā likums, viņi pārsniedz to, par ko viņi raksta. Tas ir, tās ir kādas slepenas zināšanas, kas tiek nodotas cilvēka apmācības laikā augstskolā, strādājot pie viņa pētniecības projektiem, tās veidojas viņa prātā. 

Citas zinātnes nozares cilvēkiem tas ir kāatšķirīga kultūras vide. Viņiem šie pieņēmumi var nebūt tik acīmredzami. Sakarā ar to, ka leksika izrādās diezgan apjomīga un dažāda, dialoga konstruēšana var aizkavēties vai pat būt neproduktīva. Tāpēc šeit kā ieteikumus, iespējams, var ieteikt vai nu lūgt cilvēkus iet tālāk, pie kā viņi ir pieraduši, un formulēt problēmu visabstraktākajos fizikas terminos. Mēs to darām daļēji, organizējot sacensības mūsu IDAL olimpiādes ietvaros. Dialoga procesā atrodam uzstādījumu, kas neprasītu dziļu iedziļināšanos fizikā, bet tajā pašā laikā būtu interesants mašīnmācības speciālistiem.

Šogad mums bija kopīgs projekts arItālijas laboratorija, kas meklē tumšo vielu. Viņi sniedza sintētiskus datus olimpiskajām spēlēm, lai atrastu šo tumšo vielu. Tumšās matērijas tur tiešām nav, jo tika simulētas zināmās fizikas sabrukšanas: elektronu un hēlija jonu sadursmes.  Bet tumšās vielas daļiņu sadursmes varētu būt ļoti līdzīgas dažām no šīm sadursmēm. Tos ir ļoti grūti simulēt un vēl grūtāk interpretēt. Tāpēc, īpaši cilvēkiem, kuri nav šīs jomas speciālisti, mēs nolēmām neizvilkt šos datus un aprobežoties ar tiem, kas ir līdzīgi. Algoritmi, kurus mēs redzēsim, strādā ar aptuveniem datiem, taču tos var izmantot arī reāliem datiem.

Andrejs Ustjužaņins. Foto no runātāja arhīva

Rezumējot, viens veids ir vienoties par skaidriem noteikumiem visiem, bet otrs – tērēt laiku un pūles, apmeklēt vasaras skolas, piedalīties praktiskos pētnieciskos projektos.

Andreja Ustjužaņina ieteiktās grāmatas par mašīnmācību un fiziskiem eksperimentiem:

Dīpaks Kārs,Eksperimentālā daļiņu fizika: Izpratne par mērījumiem un meklējumiem lielajā hadronu paātrinātājā.
Iļja Narskis,Daļiņu fizikas statistiskās analīzes metodes: atbilstība, blīvuma novērtēšana un uzraudzīta mācīšanās. 
Džuzepe Karleo,Mašīnmācība un fiziskās zinātnes.

- Vai ir kādas pretrunas starp fiziķu un IT speciālistu vērtībām: piemēram, vai kādam svarīgāks ir mijiedarbības raksturs vai, gluži pretēji, precizitāte?

— Ja runājam konkrēti par precizitāti, droši viennav nekādu neskaidrību. Bet tas, visticamāk, ir saistīts ar faktu, ka IT speciālisti nesaprot datu būtību. Vienkārši, ja mēs izmērījām datus ar milimetra precizitāti, tad nav jēgas aprēķināt laukumu ar kvadrātmikronu precizitāti. Sarežģītu neironu tīklu gadījumā mēs saskaramies ar faktu, ka tie sniedz informāciju, kas ir precīza līdz pēdējai mantisas zīmei, taču šīm zīmēm nav lielākas nozīmes kā precizitātei, kāda bija ievadē. 

Nu, varbūt vispārēja vēlme cilvēkiemKas attiecas uz modeļu precizitātes novērtēšanu, ir jānorāda ne tikai absolūtās īpašības, bet arī pieļaujamo diapazonu robežas vai izplatība, kurā šīs vērtības tika iegūtas. Patiesībā labs ieteikums ne tikai tiem, kas sazinās ar fiziķiem vai biologiem. Tas principā ir pareizais veids, kā saglabāt iegūto rezultātu prezentāciju.

Un, ja mēs runājam par to, cik daudz viņi var būtdažādas cerības no vienas puses un no otras puses, tad patiesībā tie visi ir darba jautājumi. Ja interese ir no abām pusēm, tās var atrisināt vienkārši un labi. Tas ir, mašīnmācība tagad ir pieprasīta fiziķu vidū plašā nozīmē, jo tā nodrošina precīzākus rīkus darbam ar viņu datiem. Un tas darbojas pretējā virzienā, jo mašīnmācības speciālistiem var būt daudz interesantāk redzēt, kā viņu algoritmi palīdz, piemēram, jaunu daļiņu atklāšanā, kā tas ir mūsu laboratorijā. Mēs ilgi strādājām, lai izveidotu algoritmu, kas noteiktu daļiņas veidu. Un nesen parādījās ziņas par jaunu tetrakvarku atklāšanu, un mūsu algoritmi tieši piedalījās to atklāšanā. 

Tāpēc cilvēkiem no IT, nosacīti no datu zinātnes,Datorzinātnēs ir ļoti svarīgi sajust to izstrādāto algoritmu lietderību. Tāpēc mūsu fakultātē, piemēram, darbojas Starptautiskā bioinformātikas laboratorija. 

Šādas mijiedarbības kļūst arvien biežākasarvien normālāk. Es nezinu, vai tos jau var uzskatīt par galveno vai vēl ir jāgaida, bet tā vai citādi šis stāsts ir neizbēgams. Pat ja paskatās uz semināriem, kas tiek organizēti kā daļa no mūsdienu vadošajām konferencēm par mākslīgo intelektu, seminārs par AI izmantošanu fiziskajās zinātnēs ieņem vadošo vietu interesentu skaitā. 

Lasīt vairāk:

Amerikāņu satelīts "redzēja" neparastu vēstījumu no Zemes

Publicēts video no raķetes, kas tika palaista no eksperimentālā paātrinātāja

Briesmonis mūsu galaktikas centrā: skatiet Piena ceļa melnā cauruma fotoattēlu

Geek Tech tiešsaistē

Viss par tehnoloģiju un sīkrīkiem

Anomāliju mednieki: kā CERN meklē retas daļiņas, izmantojot Yandex algoritmus

Kā meklēt anomālijas Lielā hadronu paātrinātāja datos

Fizikas un IT simbioze: kā mašīnmācība tiek izmantota LHC pētījumos

Kā meklēt tumšo vielu un kāpēc tam ir nepieciešami neironu tīkli

Viņi runā dažādās valodās, bet mērķi ir kopīgi