Andrej Ustjuschanin— Leiter des Forschungs- und Bildungslabors für Big-Data-Analysemethoden an der National Research University Higher School of Economics.
Absolvent des Moskauer Instituts für Physik und Technologie im Jahr 2000, Kandidat der physikalischen und mathematischen Wissenschaften. Einer der Juroren des internationalen Finales des Microsoft Imagine Cup, davor war er Mentor des MIPT-Teams, das den Pokal 2005 gewann.
Wie man in den Daten des Large Hadron Collider nach Anomalien sucht
Was sind Datenanomalien?
— Wenn wir über Daten sprechen, die mit erhalten wurdenBeim Large Hadron Collider (LHC) handelt es sich möglicherweise um Entdeckungen, die nicht in die Standardvorstellungen darüber passen, wie dort nach Protonenkollisionen Teilchenzerfälle ablaufen. Diese Entdeckungen werden Anomalien sein.
Zum Beispiel, wenn wir über Vermögenskurse sprechenan der Börse, dann können Anomalien darauf zurückzuführen sein, dass ein bestimmter Hedgefonds beschlossen hat, einen Vermögenswert zu pumpen, oder Wall Street Bets beschlossen hat, zusätzliches Geld zu verdienen und einen eigenen verteilten Hedgefonds zu gründen. Das heißt, die Physik ist völlig anders, und die Manifestation dieser Physik in den Daten ist auch nicht ähnlich zu anderen Fällen.
Wenn wir also über Anomalien sprechen, müssen wir zunächst verstehen, um welche Daten und welche Physik es sich handelt.
— Dann lassen Sie uns das mit einem Fokus auf Collider verdeutlichen.
- Hier ist es etwas einfacher, obwohl es auch auftauchtGabel. Tatsache ist, dass es Daten darüber gibt, welche Prozesse mit Partikeln im Detektor ablaufen. Und es gibt Daten darüber, wie dieser Collider funktioniert. Menschen, die hauptsächlich daran interessiert sind, neue Teilchen oder Gesetzmäßigkeiten zu entdecken, interessieren sich hauptsächlich für die erste Art von Daten. Aber Tatsache ist, dass alles, was in der Physik passiert, eine ziemlich lange Kette des Sammelns und Verarbeitens dieser Informationen durchläuft. Und wenn einer der Knoten dieser Kette beginnt, sich nicht so zu verhalten, wie wir es uns vorgestellt haben, dh bestimmte Grenzen des Zulässigen überschreitet, führt dies zu einer Verzerrung der Messungen. Wir können Anomalien dort sehen, wo sie im Allgemeinen nicht in der Physik waren.
Entdeckungen, die nicht in die gängigen Vorstellungen darüber passen, wie dort Teilchenzerfälle ablaufen, die nach der Kollision von Protonen entstehen, werden Anomalien sein
Um solche unangenehmen Ereignisse zu vermeiden, LeuteSie schreiben spezielle Datenqualitätskontrollsysteme, die alle Daten in den Messgeräten überwachen und versuchen, jene Zeiträume aus der Betrachtung auszuschließen, in denen der Verdacht besteht, dass etwas schief läuft.
Eines der Beispiele, über die gerne gesprochen wirdPhysiker vom LHC hatten festgestellt, dass sie in den frühen Phasen des Kolliderbetriebs Anomalien bemerkten, die nicht in physikalische Konzepte passten. Den LHC gab es noch nicht, aber seine Vorgängerversion. Als Ergebnis stellten die Physiker fest, dass der Zusammenhang mit dem Zugfahrplan der nahegelegenen Eisenbahn sehr gravierend ist. Und wenn man mit diesen Schwankungen verbundene Anpassungen vornimmt, erhält man ein nicht-physisches Bild der Welt.
Es ist notwendig, externe Faktoren zu berücksichtigen und in der Lage zu seinVerstehen Sie, welche davon richtig kompensiert werden müssen. Die einfachste Lösung: Werfen wir die Daten weg, die nicht in das gewohnte Weltbild passen. Bei komplexeren Geschichten wird versucht, diese Anomalien unter Verwendung verständlicher und physikalischer Prinzipien auf normale Daten zurückzuführen und daraus einen Nutzen zu ziehen.
Das Wegwerfen von Daten ist eine Verschwendung von Haushaltsmitteln. Jedes Kilobyte-Megabyte hat einen bestimmten Preis.
Andrey Ustyuzhanin, Leiter des Forschungs- und Bildungslabors für Big-Data-Analysemethoden an der National Research University Higher School of Economics
- Und wie kann dementsprechend die Anomalie in diesen Daten mit einem maschinellen Lernsystem erkannt werden?
— Es gibt zwei Gruppen solcher Algorithmen, dieArbeit mit Anomalien. Die erste Gruppe der einklassigen Klassifikationsverfahren umfasst Algorithmen, die nur Informationen über die als gut markierten Ereignisse verwenden. Das heißt, sie versuchen, eine konvexe Hülle zu bauen, die alles umschließt, was wir für richtig halten. Die Logik ist folgende: Alles, was über diese Hülle hinausgeht, betrachten wir als Anomalien. Das heißt, dass beispielsweise 99 % der Daten von einer solchen Hülle abgedeckt werden und alles andere verdächtig aussieht.
Eine andere Gruppe von Algorithmen basiert auf Teilalgorithmenmarkieren, was wir für falsch halten. Im Wesentlichen handelt es sich um eine Reihe von Ereignissen, von denen bekannt ist, dass sie unerwünschte Folgen haben. Und dann läuft die Suche nach Anomalien auf ein Zwei-Klassen-Klassifizierungsproblem hinaus. Dabei handelt es sich um einen regulären Klassifikator, der auf den Prinzipien neuronaler Netze oder Entscheidungsbäume aufgebaut werden kann.
Die Nuance ist das normalerweise in AufgabenAnomalien, die Stichprobe ist nicht ausgeglichen. Das heißt, die Zahl der positiven Beispiele übersteigt die Zahl der negativen deutlich. Unter solchen Bedingungen funktionieren Standardklassifizierungsalgorithmen möglicherweise nicht so gut, wie wir es uns wünschen. Die Default-Loss-Funktion behandelt Instanzen, die sich korrekt qualifizieren, gleich und kann die Tatsache übersehen, dass es unter 10.000 richtigen Ergebnissen hundert gibt, die sich falsch qualifizieren. Diese Hundert stellen nur die Negativbeispiele dar, die am interessantesten sind. Es ist klar, dass dem entgegengewirkt werden kann, indem man beispielsweise Negativbeispielen mehr Gewicht beimisst und Fehler bei deren Einordnung viel stärker berücksichtigt.
Verlustfunktion- eine Funktion, die in der Theorie statistischer Entscheidungen Verluste aufgrund falscher Entscheidungen auf der Grundlage beobachteter Daten charakterisiert.
Beitrag unseres Labors zur Lösung des ProblemsBei der Anomalieerkennung werden Methoden vorgeschlagen, die die Merkmale des ersten und zweiten Ansatzes kombinieren. Das heißt, die Aufgabe besteht darin, mit Ein-Klassen- und Zwei-Klassen-Klassifizierung zu arbeiten. Eine solche Kombination wird möglich, wenn wir generative Modelle anomaler Beispiele erstellen.
Verwenden von Ansätzen wie generativeKontradiktorische Netzwerke oder normalisierende Flüsse können wir lernen, die als negativ gekennzeichneten Beispiele wiederherzustellen und ein zusätzliches Sample zu generieren, das es dem regulären Klassifikator ermöglicht, effizienter mit dem erweiterten synthetischen Sample zu arbeiten. Dieser Ansatz funktioniert gut sowohl für tabellarische Daten als auch für Bilder. Dazu gab es letztes Jahr einen Artikel, der beschreibt, wie ein solches System aufgebaut ist, und praktische Anwendungsbeispiele gibt.
— Sie erwähnten die Arbeit mit Bildern. Wie funktioniert es in diesem Fall?
— Es gibt Beispiele, in denen wir die Arbeit gezeigt habendieser Algorithmus. Sie wählten einfach eine der Bildklassen: zum Beispiel handschriftliche Zahlen. Und sie sagten, dass Null eine Art Anomalie sei. Und sie baten das neuronale Netzwerk, das entscheidet, dass Nullen nicht wie alles andere sind, der negativen Klasse zuzuordnen. Dabei kann es sich natürlich nicht nur um Nullen handeln, sondern beispielsweise auch um Zahlen, innerhalb derer sich geschlossene Kreise – 068 – befinden, oder um Zahlen mit horizontalen Schnittpunkten. Oder einfach Bilder, die in einem bestimmten Winkel relativ zum Rest der Probe gedreht sind.
„Wir können Physik unter bestimmten Bedingungen simulierenexterne Parameter mit guter Genauigkeit und sagen aus, welche beobachtbaren Eigenschaften die richtigen Signalereignisse beschreiben, zum Beispiel den Zerfall des Higgs-Bosons "
Es gibt einen Datensatz namens Omniglot -Buchstaben in verschiedenen Schriftarten. Es gibt eine Vielzahl von Schriftarten: von Futurama, Gothic, handschriftlich aus unbeliebten Alphabeten - Sanskrit oder Hebräisch. Wir können sagen, dass die Buchstaben in Sanskrit eine Anomalie sind, die in einer bestimmten Handschrift geschriebenen Buchstaben sind es auch.
Wir bitten das System zu lernen, alles zu unterscheidender Rest von diesen anomalen Symbolen. Die Hauptsache ist, dass sie viel kleiner sind als alles andere. Dies ist die Schwierigkeit, mit ihnen für herkömmliche maschinelle Lernalgorithmen zu arbeiten.
Symbiose aus Physik und IT: Wie maschinelles Lernen in der LHC-Forschung eingesetzt wird
— Welche Aufgaben des LHC werden mit Hilfe von maschinellem Lernen gelöst?
— Eine große Aufgabe, mit der wir arbeiten, istbesteht darin, Rechenprozesse zu beschleunigen, die physikalische Kollisionen und Teilchenzerfälle simulieren. Tatsache ist, dass die Entscheidung darüber, ob bestimmte Ereignisse bestimmten physikalischen Zerfällen ähneln oder nicht, nach der Analyse einer relativ großen Anzahl simulierter Zerfälle getroffen wird. Wir können die Physik bei bestimmten externen Parametern mit guter Genauigkeit simulieren und sagen, welche beobachtbaren Eigenschaften die richtigen Signalereignisse beschreiben, zum Beispiel den Zerfall des Higgs-Bosons.
Es gibt jedoch bestimmte Einschränkungen:Wir kennen nicht immer die Parameter, unter denen diese Zerfälle erzeugt werden müssen. In der Regel gibt es dazu eine bestimmte Vorstellung. Und die Herausforderung bei der Suche nach der richtigen Physik besteht darin, Signalereignisse von Hintergrundereignissen zu unterscheiden, die entweder mit der fehlerhaften Funktionsweise von Wiederherstellungsalgorithmen oder mit der Physik anderer Prozesse zusammenhängen können, die dem, was wir suchen, sehr ähnlich sind. Algorithmen für maschinelles Lernen leisten hier gute Arbeit, aber das ist eine bekannte Geschichte.
Aber um solche Algorithmen zu trainieren, ist es erforderlicheine ziemlich große statistische Stichprobe simulierter Ereignisse, und die Berechnung dieser synthetischen Daten erfordert bestimmte Ressourcen. Denn die Simulation eines Ereignisses nimmt etwa eine Minute oder gar zehn Minuten Rechenzeit moderner Rechenzentren in Anspruch. Da die Zahl der realen Ereignisse, mit denen Physiker arbeiten werden, in den kommenden Jahren um Größenordnungen zunehmen wird, dürfte auch die Zahl der synthetisierten Ereignisse zunehmen. Jetzt reichen die Rechenressourcen kaum aus, um den Bedarf der Forscher zu decken. Denn um ein Ereignis zu simulieren, müssen wir die Wechselwirkung von Mikropartikeln mit der Struktur des Detektors berechnen und die Reaktion simulieren, die wir auf den Sensoren dieses Detektors mit sehr hoher Genauigkeit sehen werden.
Die Idee der Beschleunigung besteht darin, das neuronale Netzwerk zu trainierenauf Ereignissen, die mit einem zertifizierten Paket – GMT 4 – simuliert wurden, das alles simuliert, was in den Collider-Detektoren passiert. Dieses Neuron lernt, die Eingaben, die Parameter der Partikel, die wir simulieren möchten, und die Ausgaben – diese beobachtbaren Eigenschaften, die der Detektor erzeugt – zu vergleichen. Neuronale Netze bewältigen die Aufgabe der Dateninterpolation bereits heute recht gut. Und genau darauf zielen mehrere Projekte in unserem Labor ab. Das heißt, die Eigenschaften von Zerfällen aus der verfügbaren synthetischen Probe wiederherzustellen, also solche Kunststoffe zweiter Ordnung herzustellen. Aber es gibt eine Nuance: Der Vorteil neuronaler Netze besteht darin, dass wir sie anhand realer Daten optimieren können. Das heißt, machen Sie diese Einstellung für einen bestimmten physischen Verfall genauer.
Menschen, die sich mit vollwertigen körperlichen Aktivitäten beschäftigenSimulation verwenden sie ihre Zeit und Mühe darauf, aber mit Neuronen ist es etwas weniger arbeitsintensiv. Und aus den Ergebnissen, die wir für das LHTV-Experiment am CERN und das Dubna-MPD-Experimentprojekt am Nica-Beschleuniger gemacht haben, wurde deutlich, dass neuronale Netze eine sehr hohe Genauigkeit bei der Abdeckung des Phasenraums simulierter Ereignisse erreichen können. Sie beschleunigen den Berechnungsprozess erheblich: Bestellungen und sogar Hunderte schneller als eine ehrliche Simulation.
— Wie lernt das neuronale Netzwerk selbst?
— Es gibt keine Unterschiede im Lernprozess.Es gibt jedoch eine Besonderheit: Für ein neuronales Netzwerk ist es zusätzlich zur Trainingsprobe notwendig, Qualitätskriterien zu formulieren, also eine Verlustfunktion festzulegen, die der Aufgabe, die dieses Netzwerk gut bewältigen soll, am besten entspricht. Darüber hinaus wird die Qualität der Arbeit eines solchen neuronalen Netzwerks von Forschern nicht beurteilt: Sie kann anhand der Rechenschritte, die in einem späteren Stadium der Datenverarbeitung stattfinden, angemessen beurteilt werden.
Wir können feststellen, ob eine Simulation gut ist oder nichterst nachdem wir die Ereignisse durch die Kette ihrer Analyse und Rekonstruktion geführt haben, verstehen wir, dass die gleichen Eigenschaften, die wir ursprünglich in sie gelegt haben, aus ihnen wiederhergestellt werden. Das bedeutet, dass beispielsweise die Verwendung einer einfachen MSE-Mean-Squared-Error-Metrik nicht ausreicht.
Mittlerer quadratischer MSE-Fehler- misst den quadratischen Mittelwert der Differenz zwischen den geschätzten Werten und dem tatsächlichen Wert.
Das Verhalten des neuronalen Netzwerks muss weiter bewertet werdenFunktionen für Parameterbereiche, die möglicherweise nicht im Trainingssatz vorhanden waren. Der Aufbau solcher Modelle, die sich weit über die in der Trainingsphase bekannten Parameterwerte hinaus verhalten, ist eine große und theoretische Aufgabe.
Neuronale Netze sind dort gut, wo sie sindwusste etwas in der Ausbildungsphase. Außerhalb von ihnen können sie geben, was sie wollen. In unserem Fall ist dies besonders heikel, da davon die Richtigkeit der physikalischen Interpretation der uns umgebenden Realität abhängt.
„Wenn ein Dunkle-Materie-Teilchen in Teilchen zerfällt, mit denen wir zu interagieren wissen, kann davon ausgegangen werden, dass dieses Dunkle-Materie-Teilchen wirklich war“
- Das heißt, das neuronale Netzwerk sucht nach seltenen Ereignissen, die am Collider auftreten können?
— Basierend auf der Funktionsweise generativer Modelle, d. h.Erstens sprechen wir über die Synthese von allem, was passieren kann. Wir tun dies mit Miniaturmodellen. Und am Ausgang solcher Netzwerke können wir ein Modell erstellen, das nach dem sucht, was wir brauchen: was wir in einem generativen neuronalen Netzwerk erzeugen konnten.
Wie man nach dunkler Materie sucht und warum dafür neuronale Netze benötigt werden
— Lässt sich ein ähnliches Suchprinzip auf dunkle Materie anwenden?
- Fakt ist, dass nach Dunkler Materie gesucht werden kannverschiedene Wege. Eine Möglichkeit besteht darin, einen geeigneten Detektor zu bauen, der ziemlich gut von den Auswirkungen gewöhnlicher Materie isolieren kann. Das heißt, das Signal zu blockieren, das von den Physikern bekannten Teilchen kommt. Dies ist nur eine Methode zur Eliminierung: Wenn der Detektor etwas anderes als Rauschen sieht, dann sieht er etwas, das wir noch nie zuvor gesehen haben. Eine Möglichkeit wäre, dass es sich um Dunkle-Materie-Teilchen handelt.
Handelt es sich beispielsweise um ein Dunkle-Materie-Teilchenin Teilchen zerfällt, mit denen wir zu interagieren wissen, und es ist klar, dass Spuren von Zerfall nirgendwo anders als von ihr erscheinen können, dann können wir davon ausgehen, dass dieses Teilchen wirklich dunkle Materie war.
Solche Experimente werden diskutiert und geplant.Einer davon heißt SHiP (Search for Hidden Particles). Und übrigens, für ein solches Experiment sind die Ansätze, von denen ich gesprochen habe, auch anwendbar. Es erfordert Simulationen und Algorithmen zur Erkennung seltener Ansätze. Da die Leuchtkraft dieses Experiments jedoch viel geringer ist (Leuchtkraft ist die Anzahl der Teilchen, die pro Zeiteinheit nachgewiesen werden sollen), ist die Notwendigkeit, eine große Anzahl ähnlicher Ereignisse zu simulieren, nicht so akut wie im Fall des Hadron Collider Detektoren. Obwohl beispielsweise die Aufgabe, die mit der Bewertung der Qualität des Schutzsystems gegen die der Physik bekannten Partikel verbunden ist, die Simulation einer größeren Anzahl von Ereignissen erfordert. Dies ist notwendig, um sicherzustellen, dass der Schutz bei der enormen Anzahl einfallender Partikel verschiedener Art gut funktioniert.
Schiffist ein Experiment, das darauf abzielt, Verborgenes zu findenPartikel, darunter Partikel der Dunklen Materie, in einem durch Magnetfelder gefilterten Partikelstrom aus dem SPS-Beschleuniger, einer fünf Meter hohen Schicht aus Beton und Metall.
Es gibt andere Möglichkeiten, nach dunkler Materie zu suchen,im Zusammenhang mit Beobachtungen von Weltraumphänomenen. Ein Ansatz besteht insbesondere darin, empfindliche Elemente zu bauen, die die Richtung sehr schwach wechselwirkender Teilchen abhängig vom Einfallswinkel dieses Teilchens erkennen. Die Logik des Experiments besteht darin, dass es möglich ist, die empfindlichen Elemente so zu platzieren, dass sie entlang des Bewegungsvektors des Sonnensystems, also in Richtung des Sternbildes Schwan, ausgerichtet sind. Dann werden wir in der Lage sein, Teilchen, die sich im Erdkoordinatensystem bewegen, von Teilchen zu unterscheiden, die sich anders bewegen. Wie der bewegungslose Äther, der sich im Weltraum nach seinen eigenen Gesetzen verteilt, die in keiner Weise mit der Ausrichtung und Bewegungsrichtung der Planeten zusammenhängen. Es wird nur angenommen, dass es sich anstelle von Äther um Teilchen der Dunklen Materie handelt. Sie können schwach mit den Sensoren unseres Experiments interagieren. Und durch die Analyse ihrer Messwerte ist es möglich, Muster der Winkelverteilungen wechselwirkender Teilchen abzuleiten. Wenn wir sehen, dass es eine schwerwiegende Komponente gibt, die nicht von der Position der Erde im Weltraum abhängt, deutet dies auf die Existenz bisher unbekannter Teilchen hin. Und vielleicht sind dies Kandidaten für Teilchen der Dunklen Materie.
Bei einem solchen Experiment ist die Simulation ziemlich wichtig,denn um einen Algorithmus zur Erkennung von Signalereignissen zu bauen, muss man sich vorstellen, wie das für uns interessante Signal aussieht. Daher sind die Aufgaben der schnellen Simulation und der Suche nach Anomalien dort relevant und anwendbar.
Sie sprechen unterschiedliche Sprachen, aber die Ziele sind gemeinsam
Reden wir über die Arbeit am CERN. Wie ist es für einen Informatiker, mit Physikern zusammenzuarbeiten? Welche Besonderheiten sind mit der Arbeit in einem so wissenschaftsübergreifenden Raum wie dem LHC verbunden?
- Gute Frage.Tatsächlich sprechen Menschen unterschiedliche Sprachen: Es kommt zu dem Punkt, dass dieselben Konzepte auf unterschiedliche Weise grafisch dargestellt werden. Beispielsweise werden ROC-Kurven, an die Machine-Learning-Spezialisten gewöhnt sind, in der Regel um 90 Grad gedreht in der Physik gezeichnet. Und die Koordinaten heißen nicht True Positive Rate und False Negative Rate, sondern Signaleffizienz und Hintergrundunterdrückung. Wenn außerdem die Signaleffizienz immer noch Präzision ist, beträgt die Hintergrundunterdrückung eins minus True Negative Rate.
ROC-Kurve (von engl. Receiver Operating Characteristic, Receiver Operating Characteristic)– ein Diagramm, mit dem Sie die Qualität der Binärdatei bewerten könnenKlassifikationen. Zeigt das Verhältnis zwischen den Anteilen der Objekte an der Gesamtzahl der Attributträger, die korrekt als das Attribut tragend klassifiziert wurden, und den Anteilen der Objekte an der Gesamtzahl der Objekte, die das Attribut nicht tragen, die fälschlicherweise als das Attribut tragend klassifiziert wurden, an.
Es ist klar, dass solche Dinge passieren könnenOberflächen und sind relativ leicht zu gewöhnen, aber die größte Herausforderung besteht darin, einige der Grundannahmen zu verstehen, die Forscher beim Verfassen ihrer Arbeiten treffen. Und in der Regel gehen sie über das hinaus, worüber sie schreiben. Das heißt, es handelt sich hierbei um ein geheimes Wissen, das einem Menschen während seiner Ausbildung in der Graduiertenschule weitergegeben wird, während er an seinen Forschungsprojekten arbeitet und in seinem Kopf geformt wird.
Für Leute aus einem anderen Wissenschaftsbereich ist es wieanderen kulturellen Umfeld. Für sie sind diese Annahmen möglicherweise nicht so offensichtlich. Dadurch, dass das Lexikon recht umfangreich und unterschiedlich ausfällt, kann sich der Aufbau eines Dialogs verzögern oder sogar unproduktiv sein. Daher kann man hier als Empfehlungen wohl raten, entweder die Menschen zu bitten, über das Gewohnte hinauszugehen und das Problem in den abstraktesten Begriffen der Physik zu formulieren. Das tun wir zum Teil, wenn wir Wettkämpfe im Rahmen unserer IDAL-Olympiade organisieren. Im Prozess des Dialogs finden wir ein Setting, das kein tiefes Eintauchen in die Physik erfordern würde, aber gleichzeitig für Machine-Learning-Spezialisten interessant wäre.
Dieses Jahr hatten wir ein gemeinsames Projekt mitein italienisches Labor, das nach dunkler Materie sucht. Sie stellten den Olympischen Spielen synthetische Daten zur Verfügung, um diese dunkle Materie zu finden. Dort gibt es eigentlich keine Dunkle Materie, denn die Zerfälle der bekannten Physik wurden simuliert: Kollisionen von Elektronen und Heliumionen. Aber Kollisionen von Teilchen dunkler Materie könnten einigen dieser Kollisionen sehr ähnlich sein. Sie sind sehr schwer zu simulieren und noch schwieriger zu interpretieren. Daher haben wir uns insbesondere für Personen, die keine Spezialisten auf diesem Gebiet sind, entschieden, diese Daten nicht herauszuziehen und uns nur auf ähnliche Daten zu beschränken. Die Algorithmen, die wir sehen werden, funktionieren mit Näherungsdaten, können aber auch auf reale Daten angewendet werden.
Andrej Ustjuschanin. Foto aus dem Archiv des Sprechers
Zusammenfassend lässt sich sagen, dass der eine Weg darin besteht, klare Bedingungen für alle zu vereinbaren, und der andere darin besteht, Zeit und Mühe aufzuwenden, Sommerschulen zu besuchen und an praktischen Forschungsprojekten teilzunehmen.
Bücher über maschinelles Lernen und physikalische Experimente, empfohlen von Andrey Ustyuzhanin:
- Deepak Kar,Experimentelle Teilchenphysik: Verstehen der Messungen und Suchen am Large Hadron Collider.
- Ilja Narski,Statistische Analysetechniken in der Teilchenphysik: Anpassungen, Dichteschätzung und überwachtes Lernen.
- Giuseppe Carleo,Maschinelles Lernen und die Naturwissenschaften.
- Gibt es Widersprüche zwischen den Werten von Physikern und IT-Spezialisten: Ist jemandem beispielsweise die Art der Interaktion wichtiger oder im Gegenteil die Genauigkeit?
— Wenn wir speziell über Genauigkeit sprechen, wahrscheinlichEs gibt keine Unklarheiten. Dies liegt jedoch eher daran, dass IT-Spezialisten die Natur der Daten nicht verstehen. Es ist nur so, dass es keinen Sinn macht, die Fläche mit einer Genauigkeit von Quadratmikrometern zu berechnen, wenn wir die Daten mit einer Genauigkeit von einem Millimeter messen. Bei komplexen neuronalen Netzen stehen wir vor der Tatsache, dass sie bis auf das letzte Zeichen in der Mantisse genaue Informationen liefern, in diesen Zeichen steckt aber nicht mehr Bedeutung als in der Genauigkeit, die am Eingang anliegt.
Nun, vielleicht ein allgemeiner Wunsch für Menschendie sich mit der Bewertung der Genauigkeit von Modellen befassen, besteht darin, nicht nur absolute Kennwerte anzugeben, sondern auch die Grenzen akzeptabler Bereiche oder die Streuung, in der diese Werte ermittelt wurden. Eigentlich eine gute Empfehlung nicht nur für diejenigen, die mit Physikern oder Biologen zu tun haben. Dies ist im Prinzip der richtige Weg, um eine Präsentation der erzielten Ergebnisse aufrechtzuerhalten.
Und wenn wir darüber reden, wie viel sie sein könnenWenn es auf der einen und auf der anderen Seite unterschiedliche Erwartungen gibt, dann sind das alles tatsächlich funktionierende Probleme. Wenn auf beiden Seiten Interesse besteht, können sie einfach und gut gelöst werden. Das heißt, maschinelles Lernen ist heute bei Physikern im weitesten Sinne gefragt, da es genauere Werkzeuge für die Arbeit mit ihren Daten bietet. Und es funktioniert in die entgegengesetzte Richtung, denn für Spezialisten des maschinellen Lernens kann es viel interessanter sein zu sehen, wie ihre Algorithmen beispielsweise bei der Entdeckung neuer Teilchen helfen, wie es in unserem Labor der Fall ist. Wir haben lange daran gearbeitet, einen Algorithmus zu entwickeln, der die Art des Partikels bestimmen würde. Und kürzlich gab es Neuigkeiten über die Entdeckung neuer Tetraquarks, und unsere Algorithmen waren direkt an ihrer Entdeckung beteiligt.
Daher gilt für Leute aus der IT, bedingt aus Data Science,In der Informatik ist es sehr wichtig, den Nutzen der von ihnen entwickelten Algorithmen zu spüren. Daher gibt es an unserer Fakultät beispielsweise ein Internationales Labor für Bioinformatik.
Solche Interaktionen werden immer häufigerimmer normaler. Ich weiß nicht, ob sie bereits als Mainstream gelten können oder ob wir noch warten müssen, aber auf die eine oder andere Weise ist diese Geschichte unvermeidlich. Auch wenn man sich die Workshops ansieht, die im Rahmen der heute führenden Konferenzen zum Thema Künstliche Intelligenz organisiert werden, nimmt der Workshop zum Einsatz von KI in den Naturwissenschaften einen Spitzenplatz in der Zahl der Interessierten ein.
weiter lesen:
Der amerikanische Satellit „sah“ eine ungewöhnliche Nachricht von der Erde
Veröffentlichtes Video von der Rakete, die von einem experimentellen Beschleuniger gestartet wurde
Das Monster im Zentrum unserer Galaxie: Schauen Sie sich das Foto eines Schwarzen Lochs in der Milchstraße an