นักล่าความผิดปกติ: CERN ค้นหาอนุภาคหายากโดยใช้อัลกอริทึม Yandex ได้อย่างไร

อันเดรย์ อุสตูซานิน— หัวหน้าห้องปฏิบัติการวิจัยและการศึกษาวิธีวิเคราะห์ข้อมูลขนาดใหญ่ คณะเศรษฐศาสตร์ มหาวิทยาลัยวิจัยแห่งชาติ

หัวหน้าโครงการร่วมระหว่าง Yandex และ CERN เข้าร่วมในการพัฒนาบริการ EventIndex และ EventFilter ซึ่ง Yandex ได้จัดเตรียมไว้ให้สำหรับการทดลอง LHCb ตั้งแต่ปี 2011

สำเร็จการศึกษาจากสถาบันฟิสิกส์และเทคโนโลยีมอสโกในปี 2543 ผู้สมัครสาขาวิทยาศาสตร์กายภาพและคณิตศาสตร์ หนึ่งในผู้ตัดสินการแข่งขัน Microsoft Imagine Cup ระดับนานาชาติ ก่อนหน้านั้นเขาเป็นที่ปรึกษาของทีม MIPT ที่ได้รับรางวัลถ้วยในปี 2548

วิธีค้นหาความผิดปกติในข้อมูลของ Large Hadron Collider

ความผิดปกติของข้อมูลคืออะไร?

— ถ้าเราพูดถึงข้อมูลที่ได้รับโดยใช้เครื่องชนแฮดรอนขนาดใหญ่ (LHC) สิ่งเหล่านี้อาจเป็นการค้นพบที่ไม่สอดคล้องกับแนวคิดมาตรฐานเกี่ยวกับการสลายตัวของอนุภาคที่เกิดขึ้นหลังจากการชนของโปรตอน การค้นพบเหล่านี้จะมีความผิดปกติ 

ตัวอย่างเช่น หากเรากำลังพูดถึงราคาสินทรัพย์ในตลาดหลักทรัพย์ ความผิดปกติอาจเกิดขึ้นเนื่องจากกองทุนเฮดจ์ฟันด์บางแห่งตัดสินใจปั๊มสินทรัพย์หรือเดิมพันวอลล์สตรีทตัดสินใจหารายได้พิเศษและตั้งกองทุนป้องกันความเสี่ยงแบบกระจายของตนเอง นั่นคือ ฟิสิกส์แตกต่างไปจากเดิมอย่างสิ้นเชิง และการปรากฎของฟิสิกส์นี้ในข้อมูลก็ไม่เหมือนกับกรณีอื่นๆ

ดังนั้น หากเราพูดถึงความผิดปกติ ก่อนอื่นเราต้องเข้าใจก่อนว่าเรากำลังพูดถึงข้อมูลอะไรและฟิสิกส์อะไร

— ถ้าอย่างนั้นเรามาชี้แจงโดยเน้นที่คอลไลเดอร์

- นี่มันง่ายกว่าเล็กน้อยแม้ว่ามันจะเกิดขึ้นด้วยส้อม. ความจริงก็คือมีข้อมูลเกี่ยวกับกระบวนการที่เกิดขึ้นกับอนุภาคภายในเครื่องตรวจจับ และมีข้อมูลเกี่ยวกับวิธีการทำงานของคอลไลเดอร์นี้ ผู้ที่มีความสนใจในการค้นพบอนุภาคหรือกฎหมายใหม่เป็นหลักจะสนใจข้อมูลประเภทแรกเป็นหลัก แต่ความจริงก็คือทุกสิ่งที่เกิดขึ้นในฟิสิกส์ต้องผ่านการรวบรวมและประมวลผลข้อมูลนี้ค่อนข้างยาว และถ้าโหนดใด ๆ ของห่วงโซ่นี้เริ่มทำงานไม่ดีเท่าที่เราจินตนาการไว้ นั่นคือมันเกินขอบเขตที่อนุญาต สิ่งนี้ทำให้เกิดการบิดเบือนในการวัด เราสามารถเห็นความผิดปกติในสถานที่ซึ่งโดยทั่วไปแล้วไม่อยู่ในฟิสิกส์

การค้นพบที่ไม่สอดคล้องกับแนวคิดมาตรฐานเกี่ยวกับการสลายตัวของอนุภาคที่เกิดขึ้นหลังจากการชนกันของโปรตอนจะเป็นความผิดปกติ

เพื่อหลีกเลี่ยงเหตุการณ์อันไม่พึงประสงค์ดังกล่าวผู้คนพวกเขาเขียนระบบควบคุมคุณภาพข้อมูลพิเศษที่ตรวจสอบข้อมูลทั้งหมดในเครื่องมือวัดและพยายามแยกออกจากการพิจารณาช่วงเวลาเหล่านั้นเมื่อมีข้อสงสัยว่ามีบางอย่างเกิดขึ้น 

ตัวอย่างหนึ่งที่คนชอบพูดถึงนักฟิสิกส์จาก LHC กล่าวว่าในช่วงแรกของการผ่าตัดเครื่องชนกัน พวกเขาสังเกตเห็นความผิดปกติที่ไม่สอดคล้องกับแนวคิดทางกายภาพ ยังไม่มี LHC แต่เป็นเวอร์ชันก่อนหน้า ส่งผลให้นักฟิสิกส์พบว่ามีความสัมพันธ์กันอย่างมากกับตารางรถไฟบนทางรถไฟซึ่งตั้งอยู่ใกล้เคียง และถ้าคุณทำการปรับเปลี่ยนที่เกี่ยวข้องกับความผันผวนเหล่านี้ คุณก็จะได้เห็นภาพของโลกที่ไม่ใช่ทางกายภาพ 

มีความจำเป็นต้องคำนึงถึงปัจจัยภายนอกและสามารถเข้าใจว่าสิ่งใดที่ต้องได้รับการชดเชยอย่างถูกต้อง วิธีแก้ปัญหาที่ง่ายที่สุด: โยนข้อมูลที่ไม่เข้ากับภาพปกติของโลกออกไป เรื่องราวที่ซับซ้อนมากขึ้นคือการพยายามคืนความผิดปกติเหล่านี้โดยใช้หลักการทางกายภาพที่เข้าใจได้ ไปยังข้อมูลปกติ และพยายามใช้ประโยชน์จากสิ่งเหล่านั้น

การทิ้งข้อมูลเป็นการสิ้นเปลืองเงินงบประมาณ แต่ละกิโลไบต์-เมกะไบต์มีราคาที่แน่นอน

Andrey Ustyuzhanin หัวหน้าห้องปฏิบัติการวิจัยและการศึกษาสำหรับวิธีวิเคราะห์ Big Data ที่ National Research University Higher School of Economics

- และด้วยเหตุนี้ เราจะตรวจจับความผิดปกติในข้อมูลเหล่านี้โดยใช้ระบบการเรียนรู้ของเครื่องได้อย่างไร

— มีอัลกอริธึมดังกล่าวสองกลุ่มซึ่งทำงานกับความผิดปกติ กลุ่มแรกของวิธีการจำแนกประเภทหนึ่งคลาสรวมถึงอัลกอริธึมที่ใช้ข้อมูลเกี่ยวกับเหตุการณ์ที่ทำเครื่องหมายว่าดีเท่านั้น นั่นคือพวกเขากำลังพยายามสร้างตัวถังนูนที่ล้อมรอบสิ่งที่เราคิดว่าถูกต้อง ตรรกะคือสิ่งนี้: ทุกสิ่งที่นอกเหนือไปจากเชลล์นี้ เราจะพิจารณาถึงความผิดปกติ ตัวอย่างเช่น 99% ของข้อมูลถูกปกปิดโดยเชลล์ และทุกอย่างอื่นดูเหมือนบางอย่างน่าสงสัย

อัลกอริธึมอีกกลุ่มหนึ่งอาศัยบางส่วนทำเครื่องหมายสิ่งที่เราถือว่าผิด โดยพื้นฐานแล้ว มีเหตุการณ์หลายอย่างที่ทราบกันว่าให้ผลลัพธ์ที่ไม่พึงประสงค์ จากนั้นการค้นหาความผิดปกติก็ลงมาที่ปัญหาการจำแนกประเภทสองชั้น นี่คือตัวแยกประเภทปกติที่สามารถสร้างขึ้นบนหลักการของโครงข่ายประสาทเทียมหรือแผนผังการตัดสินใจ

ความแตกต่างก็คือว่ามักจะอยู่ในงานความผิดปกติ ตัวอย่างไม่สมดุล นั่นคือจำนวนตัวอย่างเชิงบวกมีจำนวนมากเกินกว่าจำนวนตัวอย่างเชิงลบ ภายใต้เงื่อนไขดังกล่าว อัลกอริธึมการจำแนกประเภทมาตรฐานอาจทำงานได้ไม่ดีเท่าที่เราต้องการ ฟังก์ชันการสูญเสียเริ่มต้นจะจัดการกับอินสแตนซ์ที่มีคุณสมบัติถูกต้องเท่าเทียมกัน และอาจมองข้ามข้อเท็จจริงที่ว่าในผลลัพธ์ที่ถูกต้อง 10,000 รายการ มีหลายร้อยรายการที่มีคุณสมบัติไม่ถูกต้อง ร้อยนี้เป็นเพียงตัวอย่างเชิงลบที่น่าสนใจที่สุด เป็นที่ชัดเจนว่าสิ่งนี้สามารถแก้ไขได้ ตัวอย่างเช่น โดยการกำหนดน้ำหนักให้มากขึ้นให้กับตัวอย่างเชิงลบ และคำนึงถึงข้อผิดพลาดด้วยการจัดประเภทที่มีน้ำหนักมากขึ้น

ฟังก์ชั่นการสูญเสีย- ฟังก์ชันที่ตามทฤษฎีการตัดสินใจทางสถิติ ระบุลักษณะการสูญเสียเนื่องจากการตัดสินใจที่ไม่ถูกต้องโดยอาศัยข้อมูลที่สังเกตได้

การมีส่วนร่วมของห้องปฏิบัติการของเราในการแก้ปัญหาการตรวจจับความผิดปกติคือการเสนอวิธีการที่รวมคุณลักษณะของแนวทางที่หนึ่งและที่สองเข้าด้วยกัน นั่นคืองานทำงานกับการจำแนกประเภทหนึ่งชั้นและสองชั้น การรวมกันดังกล่าวจะเป็นไปได้ถ้าเราสร้างแบบจำลองกำเนิดของตัวอย่างที่ผิดปกติ 

การใช้วิธีการเช่นกำเนิดเครือข่ายที่เป็นปฏิปักษ์หรือกระแสการทำให้เป็นมาตรฐาน เราสามารถเรียนรู้ที่จะกู้คืนตัวอย่างเหล่านั้นที่ติดป้ายกำกับว่าเป็นค่าลบ และสร้างตัวอย่างเพิ่มเติมที่จะช่วยให้ตัวแยกประเภทปกติทำงานกับตัวอย่างสังเคราะห์ที่เพิ่มเข้ามาได้อย่างมีประสิทธิภาพมากขึ้น วิธีนี้ใช้ได้ดีกับทั้งข้อมูลแบบตารางและรูปภาพ มีบทความเกี่ยวกับปีที่แล้วซึ่งอธิบายว่าระบบดังกล่าวถูกสร้างขึ้นอย่างไรและให้ตัวอย่างการใช้งานจริง

— คุณพูดถึงการทำงานกับรูปภาพ มันทำงานอย่างไรในกรณีนี้?

— มีตัวอย่างที่เราแสดงผลงานอัลกอริทึมนี้ พวกเขาเพียงเลือกหนึ่งในคลาสของรูปภาพ เช่น ตัวเลขที่เขียนด้วยลายมือ และพวกเขาบอกว่าศูนย์เป็นความผิดปกติบางอย่าง และพวกเขาขอให้โครงข่ายประสาทเทียมซึ่งตัดสินใจว่าเลขศูนย์ไม่เหมือนกับสิ่งอื่นใด ถูกกำหนดให้กับคลาสเชิงลบ โดยธรรมชาติแล้วสิ่งเหล่านี้ไม่เพียงแต่เป็นศูนย์เท่านั้น แต่ยังรวมถึงตัวเลขที่มีวงรอบปิด - 068 - หรือตัวเลขที่มีจุดตัดแนวนอน หรือเพียงแค่หมุนรูปภาพเป็นมุมหนึ่งโดยสัมพันธ์กับส่วนอื่นๆ ของตัวอย่าง 

“เราสามารถจำลองฟิสิกส์ได้อย่างแน่นอนพารามิเตอร์ภายนอกที่มีความแม่นยำที่ดีและบอกว่าลักษณะใดที่สังเกตได้จะอธิบายเหตุการณ์สัญญาณที่ถูกต้องเช่นการสลายตัวของ Higgs boson "

มีชุดข้อมูลที่เรียกว่า omniglot -ตัวอักษรที่เขียนด้วยแบบอักษรต่างๆ มีแบบอักษรจำนวนมาก: จาก Futurama, Gothic, ลายมือจากตัวอักษรที่ไม่เป็นที่นิยม - สันสกฤตหรือฮีบรู เราสามารถพูดได้ว่าตัวอักษรในภาษาสันสกฤตเป็นความผิดปกติ ตัวอักษรที่เขียนด้วยลายมือบางอย่างก็เช่นกัน

เราขอให้ระบบเรียนรู้ที่จะแยกแยะทุกสิ่งส่วนที่เหลือจากสัญลักษณ์ผิดปกติเหล่านี้ สิ่งสำคัญคือพวกมันเล็กกว่าทุกอย่างมาก นี่คือความยากลำบากในการทำงานกับอัลกอริธึมแมชชีนเลิร์นนิงทั่วไป

Symbiosis of Physics and IT: วิธีการใช้แมชชีนเลิร์นนิงในการวิจัย LHC

— งานใดบ้างของ LHC ที่แก้ไขได้ด้วยการเรียนรู้ของเครื่อง

— งานใหญ่อย่างหนึ่งที่เรากำลังทำอยู่คือคือการเร่งกระบวนการคำนวณที่จำลองการชนทางกายภาพและการสลายตัวของอนุภาค ความจริงก็คือการตัดสินใจว่าเหตุการณ์ที่กำหนดจะคล้ายกับการสลายตัวทางกายภาพบางอย่างหรือไม่นั้นเกิดขึ้นหลังจากการวิเคราะห์การสลายตัวจำลองจำนวนมากพอสมควร เราสามารถจำลองฟิสิกส์ที่พารามิเตอร์ภายนอกบางตัวได้อย่างแม่นยำ และบอกว่าคุณลักษณะที่สังเกตได้ใดบ้างที่จะอธิบายเหตุการณ์สัญญาณที่ถูกต้อง เช่น การสลายของฮิกส์โบซอน

แต่มีข้อแม้บางประการ:เราไม่ทราบเสมอไปว่าจะต้องสร้างการสลายตัวเหล่านี้ถึงพารามิเตอร์ใด ตามกฎแล้วมีแนวคิดบางอย่างเกี่ยวกับเรื่องนี้ และความท้าทายในการค้นหาฟิสิกส์ที่เหมาะสมคือการแยกแยะเหตุการณ์สัญญาณจากเหตุการณ์เบื้องหลัง ซึ่งอาจเกี่ยวข้องกับการดำเนินการที่ไม่ถูกต้องของอัลกอริธึมการกู้คืน หรือกับฟิสิกส์ของกระบวนการอื่น ๆ ที่คล้ายกับสิ่งที่เราพยายามค้นหามาก อัลกอริธึมการเรียนรู้ของเครื่องทำงานได้ดีในเรื่องนี้ แต่ก็เป็นเรื่องราวที่รู้จักกันดี 

แต่การจะฝึกอัลกอริธึมนั้นจำเป็นตัวอย่างทางสถิติที่ค่อนข้างใหญ่ของเหตุการณ์จำลอง และการคำนวณข้อมูลสังเคราะห์เหล่านี้ต้องใช้ทรัพยากรบางอย่าง เนื่องจากการจำลองเหตุการณ์หนึ่งเหตุการณ์ใช้เวลาประมาณหนึ่งนาทีหรือสิบนาทีในการคำนวณของศูนย์คอมพิวเตอร์สมัยใหม่ เนื่องจากข้อเท็จจริงที่ว่าจำนวนเหตุการณ์จริงที่นักฟิสิกส์จะทำงานด้วยจะเพิ่มขึ้นตามลำดับความสำคัญในปีต่อๆ ไป จำนวนเหตุการณ์ที่สังเคราะห์ควรเพิ่มขึ้นด้วย ขณะนี้ทรัพยากรการคำนวณแทบจะไม่เพียงพอที่จะครอบคลุมความต้องการของนักวิจัย เนื่องจากการจำลองเหตุการณ์หนึ่ง เราจึงต้องคำนวณปฏิกิริยาระหว่างอนุภาคขนาดเล็กกับโครงสร้างของเครื่องตรวจจับ และจำลองการตอบสนองที่เราจะได้เห็นบนเซ็นเซอร์ของเครื่องตรวจจับนี้ด้วยความแม่นยำสูงมาก

แนวคิดของการเร่งความเร็วคือการฝึกโครงข่ายประสาทเทียมในเหตุการณ์ที่จำลองโดยใช้แพ็คเกจที่ได้รับการรับรอง - GMT 4 ซึ่งจำลองทุกสิ่งที่เกิดขึ้นภายในเครื่องตรวจจับการชนกัน เซลล์ประสาทนี้จะเรียนรู้ที่จะเปรียบเทียบอินพุต พารามิเตอร์ของอนุภาคที่เราต้องการจำลอง และเอาต์พุต ซึ่งเป็นคุณลักษณะที่สังเกตได้ซึ่งเครื่องตรวจจับสร้างขึ้น โครงข่ายประสาทเทียมในปัจจุบันสามารถรับมือกับงานการแก้ไขข้อมูลได้ค่อนข้างดี และหลายโครงการในห้องปฏิบัติการของเรามุ่งเป้าไปที่สิ่งนี้อย่างแม่นยำ นั่นคือเพื่อฟื้นฟูคุณลักษณะของการสลายตัวจากตัวอย่างสังเคราะห์ที่มีอยู่ นั่นคือเพื่อทำการสังเคราะห์ลำดับที่สองดังกล่าว แต่มีความแตกต่างกันเล็กน้อย: ข้อดีของโครงข่ายประสาทเทียมคือเราสามารถปรับแต่งโครงข่ายประสาทเทียมได้โดยใช้ข้อมูลจริง กล่าวคือ ทำให้การตั้งค่านี้แม่นยำยิ่งขึ้นสำหรับการสลายตัวทางกายภาพที่เฉพาะเจาะจง 

ผู้ที่มีส่วนร่วมในร่างกายที่เต็มเปี่ยมการจำลอง พวกเขาใช้เวลาและความพยายามในเรื่องนี้ แต่ด้วยเซลล์ประสาท มันกลับกลายเป็นว่าใช้แรงงานน้อยลงเล็กน้อย และจากผลลัพธ์ที่เราทำสำหรับการทดลอง LHTV ที่ CERN และโครงการทดลอง Dubna MPD ที่เครื่องเร่ง Nica เป็นที่ชัดเจนว่าโครงข่ายประสาทเทียมสามารถบรรลุความแม่นยำสูงมากในการครอบคลุมพื้นที่เฟสของเหตุการณ์จำลอง พวกเขาเร่งกระบวนการคำนวณได้อย่างมาก: คำสั่งซื้อและเร็วกว่าการจำลองที่ซื่อสัตย์หลายร้อยรายการ

— โครงข่ายประสาทเทียมเรียนรู้ได้อย่างไร 

— ไม่มีความแตกต่างในกระบวนการเรียนรู้แต่มีลักษณะเฉพาะประการหนึ่ง: สำหรับโครงข่ายประสาทเทียมนอกเหนือจากตัวอย่างการฝึกอบรมแล้วยังจำเป็นต้องกำหนดเกณฑ์คุณภาพนั่นคือตั้งค่าฟังก์ชันการสูญเสียที่จะสอดคล้องกับงานที่เครือข่ายนี้ควรรับมือได้ดีที่สุด นอกจากนี้ นักวิจัยไม่ได้ประเมินคุณภาพของการทำงานของโครงข่ายประสาทเทียมดังกล่าว แต่สามารถประเมินได้อย่างเพียงพอในแง่ของขั้นตอนการคำนวณที่เกิดขึ้นในขั้นตอนต่อมาของการประมวลผลข้อมูล

เพื่อตรวจสอบว่าการจำลองนั้นดีหรือไม่ เราสามารถหลังจากที่เราส่งต่อเหตุการณ์ต่างๆ ผ่านห่วงโซ่ของการวิเคราะห์ การสร้างใหม่ และเราเข้าใจว่าคุณลักษณะเดียวกันกับที่เราวางไว้ในตอนแรกนั้นได้รับการฟื้นฟูจากเหตุการณ์เหล่านั้น ซึ่งหมายความว่า ตัวอย่างเช่น การใช้ตัววัด MSE Mean Squared Error แบบธรรมดาไม่เพียงพอ

MSE Mean Squared Error- วัดผลต่างรากกำลังสองเฉลี่ยระหว่างค่าประมาณและค่าจริง

ต้องมีการประเมินพฤติกรรมของโครงข่ายประสาทเทียมเพิ่มเติมในคุณสมบัติในช่วงพารามิเตอร์ที่อาจไม่มีอยู่ในชุดการฝึก การสร้างโมเดลดังกล่าวที่ทำงานเกินกว่าค่าพารามิเตอร์ที่ทราบในขั้นตอนการฝึกถือเป็นงานใหญ่และเป็นงานทางทฤษฎี

โครงข่ายประสาทเทียมนั้นดีในสถานที่ที่พวกเขาอยู่รู้อะไรบางอย่างในขั้นตอนการฝึก ภายนอกพวกเขาสามารถให้สิ่งที่พวกเขาต้องการได้ ในกรณีของเรา นี่เป็นเรื่องละเอียดอ่อนอย่างยิ่ง เนื่องจากความถูกต้องของการตีความทางกายภาพของความเป็นจริงรอบตัวเรานั้นขึ้นอยู่กับการตีความนั้น

“ถ้าอนุภาคสสารมืดสลายตัวเป็นอนุภาคที่เรารู้วิธีโต้ตอบกัน ก็สามารถสันนิษฐานได้ว่าอนุภาคสสารมืดนี้มีอยู่จริง”

- นั่นคือโครงข่ายประสาทกำลังมองหาเหตุการณ์ที่หายากที่สามารถเกิดขึ้นได้ที่ collider?

— จากการดำเนินการของแบบจำลองกำเนิด กล่าวคืออันดับแรก เรากำลังพูดถึงการสังเคราะห์ทุกสิ่งที่สามารถเกิดขึ้นได้ เราทำสิ่งนี้กับโมเดลจิ๋ว และที่ผลลัพธ์ของเครือข่ายดังกล่าว เราสามารถสร้างแบบจำลองที่จะมองหาสิ่งที่เราต้องการ นั่นคือสิ่งที่เราจัดการเพื่อสร้างบนโครงข่ายประสาทเทียม

วิธีการค้นหาสสารมืดและเหตุใดจึงต้องมีโครงข่ายประสาทเทียมสำหรับสิ่งนี้

— หลักการค้นหาที่คล้ายกันสามารถนำไปใช้กับสสารมืดได้หรือไม่?

- ความจริงก็คือสามารถค้นหาสสารมืดได้วิธีทางที่แตกต่าง. วิธีหนึ่งคือสร้างเครื่องตรวจจับที่เหมาะสมซึ่งสามารถแยกผลกระทบจากสสารธรรมดาได้ค่อนข้างดี นั่นคือเพื่อป้องกันสัญญาณที่มาจากอนุภาคที่นักฟิสิกส์รู้จัก นี่เป็นเพียงวิธีการกำจัด หากเครื่องตรวจจับเห็นสิ่งอื่นที่ไม่ใช่เสียง มันก็จะมองเห็นสิ่งที่เราไม่เคยเห็นมาก่อน ความเป็นไปได้อย่างหนึ่งก็คืออนุภาคเหล่านี้คืออนุภาคสสารมืด

ตัวอย่างเช่น ถ้าอนุภาคสสารมืดสลายตัวเป็นอนุภาคที่เรารู้วิธีโต้ตอบ และเป็นที่แน่ชัดว่าร่องรอยของการสลายตัวไม่สามารถปรากฏได้จากทุกที่ยกเว้นจากมัน จากนั้นเราสามารถสรุปได้ว่าอนุภาคของสสารมืดนี้มีอยู่จริง

มีการหารือและวางแผนการทดลองดังกล่าวหนึ่งในนั้นเรียกว่า SHiP (ค้นหาอนุภาคที่ซ่อนอยู่) และสำหรับการทดลองดังกล่าว วิธีการที่ฉันพูดถึงก็สามารถใช้ได้เช่นกัน ต้องใช้การจำลองและอัลกอริธึมในการระบุแนวทางที่หายาก แต่เนื่องจากความส่องสว่างของการทดลองนี้ต่ำกว่ามาก (ความส่องสว่างคือจำนวนอนุภาคที่วางแผนจะตรวจจับต่อหน่วยเวลา) ความจำเป็นในการจำลองเหตุการณ์ที่คล้ายคลึงกันจำนวนมากจึงไม่รุนแรงเท่ากรณีของ Hadron Collider เครื่องตรวจจับ ถึงแม้ว่า ตัวอย่างเช่น งานที่เกี่ยวข้องกับการประเมินคุณภาพของระบบป้องกันจากอนุภาคที่รู้จักในวิชาฟิสิกส์ จำเป็นต้องมีการจำลองเหตุการณ์จำนวนมากพอสมควร นี่เป็นสิ่งจำเป็นเพื่อให้แน่ใจว่าการป้องกันนั้นทำงานได้ดีกับอนุภาคที่เข้ามาหลายประเภท

เรือเป็นการทดลองที่มุ่งค้นหาสิ่งที่ซ่อนเร้นอนุภาค รวมถึงอนุภาคสสารมืด ในกระแสอนุภาคจากเครื่องเร่ง SPS ที่ถูกกรองด้วยสนามแม่เหล็ก ซึ่งเป็นชั้นคอนกรีตและโลหะยาวห้าเมตร

มีวิธีอื่นในการค้นหาสสารมืดเกี่ยวข้องกับการสังเกตปรากฏการณ์อวกาศ โดยเฉพาะอย่างยิ่ง แนวทางหนึ่งคือการสร้างองค์ประกอบที่มีความละเอียดอ่อนซึ่งรับรู้ทิศทางของอนุภาคที่มีปฏิกิริยาโต้ตอบอย่างอ่อนมาก ขึ้นอยู่กับมุมตกกระทบของอนุภาคนี้ ตรรกะของการทดลองคือสามารถวางองค์ประกอบที่ละเอียดอ่อนเพื่อให้องค์ประกอบเหล่านั้นมีทิศทางตามเวกเตอร์การเคลื่อนที่ของระบบสุริยะ ซึ่งก็คือ ไปทางกลุ่มดาวหงส์ จากนั้นเราจะสามารถแยกแยะอนุภาคที่เคลื่อนที่ในระบบพิกัดของโลกออกจากอนุภาคที่เคลื่อนที่ต่างกันได้ เช่นเดียวกับอีเธอร์ที่ไม่เคลื่อนที่ซึ่งกระจายไปในอวกาศตามกฎของมันเอง ไม่เกี่ยวข้องกับการวางแนวและทิศทางการเคลื่อนที่ของดาวเคราะห์ เพียงแต่แทนที่จะเป็นอีเทอร์ กลับสันนิษฐานว่ามีอนุภาคของสสารมืด พวกมันสามารถโต้ตอบกับเซ็นเซอร์ของการทดลองของเราได้ไม่ดีนัก และโดยการวิเคราะห์การอ่าน ก็เป็นไปได้ที่จะได้รูปแบบของการกระจายเชิงมุมของอนุภาคที่มีปฏิสัมพันธ์กัน หากเราเห็นว่ามีองค์ประกอบร้ายแรงที่ไม่ขึ้นอยู่กับตำแหน่งของโลกในอวกาศ สิ่งนี้จะบ่งบอกถึงการมีอยู่ของอนุภาคที่ไม่รู้จักมาก่อน และบางทีสิ่งเหล่านี้อาจจะเป็นตัวเลือกสำหรับอนุภาคสสารมืด

ในการทดลองดังกล่าว การจำลองมีความสำคัญมากเพราะในการสร้างอัลกอริทึมสำหรับการจดจำเหตุการณ์สัญญาณ คุณต้องจินตนาการว่าสัญญาณที่เราสนใจเป็นอย่างไร ดังนั้น งานที่เกี่ยวข้องกับการจำลองอย่างรวดเร็วและการค้นหาสิ่งผิดปกติจึงมีความเกี่ยวข้องและนำไปใช้ได้ที่นั่น

พวกเขาพูดภาษาต่างกัน แต่เป้าหมายเป็นเรื่องธรรมดา

พูดคุยเกี่ยวกับการทำงานที่ CERN คนไอทีทำงานกับนักฟิสิกส์เป็นอย่างไร? คุณลักษณะใดบ้างที่เกี่ยวข้องกับการทำงานในพื้นที่ข้ามวิทยาศาสตร์เช่น LHC

- คำถามที่ดี.แท้จริงแล้ว ผู้คนพูดภาษาที่แตกต่างกัน: มาถึงจุดที่แนวคิดเดียวกันนั้นถูกนำเสนอในรูปแบบกราฟิกในรูปแบบที่แตกต่างกัน ตัวอย่างเช่น เส้นโค้ง ROC ซึ่งผู้เชี่ยวชาญด้านการเรียนรู้ของเครื่องคุ้นเคย มักจะวาดในวิชาฟิสิกส์ที่หมุน 90 องศา และพิกัดไม่ได้เรียกว่าอัตราบวกจริงและอัตราลบเท็จ แต่เป็นประสิทธิภาพของสัญญาณและการปฏิเสธเบื้องหลัง ยิ่งไปกว่านั้น หากประสิทธิภาพของสัญญาณยังคงมีความแม่นยำ การปฏิเสธในพื้นหลังก็จะเท่ากับ 1 ลบด้วยอัตราลบที่แท้จริง 

ROC-curve (จากลักษณะการทำงานของตัวรับภาษาอังกฤษ ลักษณะการทำงานของตัวรับ)— กราฟที่ให้คุณประเมินคุณภาพของไบนารี่การจำแนกประเภท แสดงความสัมพันธ์ระหว่างการแบ่งใช้ของอ็อบเจ็กต์จากจำนวนรวมของตัวพาแอททริบิวต์ ซึ่งจัดประเภทอย่างถูกต้องว่ามีแอททริบิวต์ และการแบ่งใช้ของอ็อบเจ็กต์จากจำนวนรวมของออบเจ็กต์ที่ไม่มีแอททริบิวต์ ซึ่งจัดประเภทไม่ถูกต้องว่ามีแอททริบิวต์

เห็นได้ชัดว่าสิ่งเหล่านี้อาจเกิดขึ้นได้และค่อนข้างคุ้นเคยได้ง่าย แต่ความท้าทายหลักอยู่ที่การทำความเข้าใจสมมติฐานพื้นฐานบางประการที่นักวิจัยทำเมื่อเขียนรายงาน และตามกฎแล้ว พวกเขาอยู่นอกเหนือสิ่งที่พวกเขาเขียน นั่นคือนี่คือความรู้ลับบางอย่างที่ถ่ายทอดระหว่างการฝึกอบรมของบุคคลในระดับบัณฑิตวิทยาลัย ในกระบวนการทำงานในโครงการวิจัยของเขา มันถูกสร้างขึ้นในใจของเขา

สำหรับคนที่มาจากศาสตร์แขนงอื่นก็แบบสภาพแวดล้อมทางวัฒนธรรมที่แตกต่างกัน สำหรับพวกเขา ข้อสันนิษฐานเหล่านี้อาจไม่ชัดเจนนัก เนื่องจากคำศัพท์ค่อนข้างกว้างและแตกต่างกัน การสร้างบทสนทนาจึงอาจล่าช้าหรือไม่เกิดผลก็ได้ ดังนั้น ในที่นี้ ตามคำแนะนำ เราอาจแนะนำให้คนทำมากกว่าที่เคย และกำหนดปัญหาในเงื่อนไขที่เป็นนามธรรมที่สุดจากฟิสิกส์ เราทำเช่นนี้บางส่วนเมื่อเราจัดการแข่งขันซึ่งเป็นส่วนหนึ่งของ IDAL Olympiad ของเรา ในกระบวนการสนทนา เราพบฉากที่ไม่ต้องอาศัยฟิสิกส์อย่างลึกซึ้ง แต่ในขณะเดียวกันก็น่าสนใจสำหรับผู้เชี่ยวชาญด้านแมชชีนเลิร์นนิง

ปีนี้เรามีโครงการร่วมกันกับห้องทดลองของอิตาลีที่กำลังมองหาสสารมืด พวกเขาให้ข้อมูลสังเคราะห์สำหรับการแข่งขันกีฬาโอลิมปิกเพื่อค้นหาสสารมืดนี้ จริงๆ แล้วไม่มีสสารมืดอยู่ที่นั่น เนื่องจากมีการจำลองการสลายของฟิสิกส์ที่รู้จัก นั่นคือ การชนกันของอิเล็กตรอนและฮีเลียมไอออน แต่การชนของอนุภาคสสารมืดอาจคล้ายกันมากกับการชนเหล่านี้บางส่วน เป็นการยากที่จะจำลองและตีความได้ยากยิ่งขึ้น ดังนั้น โดยเฉพาะอย่างยิ่งสำหรับผู้ที่ไม่ใช่ผู้เชี่ยวชาญในสาขานี้ เราจึงตัดสินใจที่จะไม่ดึงข้อมูลนี้ออกมาและจำกัดตัวเองไว้เฉพาะข้อมูลที่คล้ายกันเท่านั้น อัลกอริธึมที่เราจะเห็นทำงานกับข้อมูลโดยประมาณ แต่ก็สามารถนำไปใช้กับข้อมูลจริงได้เช่นกัน

Andrey Ustyuzhanin. ภาพจากแฟ้มเอกสารของผู้บรรยาย

โดยสรุป วิธีหนึ่งคือยอมรับเงื่อนไขที่ชัดเจนสำหรับทุกคน และอีกวิธีหนึ่งคือการใช้เวลาและความพยายาม เข้าเรียนในโรงเรียนภาคฤดูร้อน เข้าร่วมในโครงการวิจัยเชิงปฏิบัติ

หนังสือเกี่ยวกับการเรียนรู้ของเครื่องและการทดลองทางกายภาพที่แนะนำโดย Andrey Ustyuzhanin:

  • ดีพัค การ์,ฟิสิกส์ของอนุภาคทดลอง: การทำความเข้าใจการวัดและการค้นหาที่ Large Hadron Collider.
  • อิลยา นาร์สกี้เทคนิคการวิเคราะห์ทางสถิติในฟิสิกส์อนุภาค: ความพอดี การประมาณความหนาแน่น และการเรียนรู้ภายใต้การดูแล. 
  • จูเซปเป้ คาร์เลโอ,แมชชีนเลิร์นนิงและวิทยาศาสตร์กายภาพ. 

- มีความขัดแย้งใดๆ ระหว่างค่านิยมของนักฟิสิกส์และผู้เชี่ยวชาญด้านไอทีหรือไม่: ตัวอย่างเช่น ธรรมชาติของการโต้ตอบมีความสำคัญกับใครบางคนมากกว่าหรือในทางกลับกัน ความถูกต้อง?

— ถ้าเราพูดถึงความแม่นยำโดยเฉพาะก็น่าจะเป็นไม่มีความคลุมเครือ แต่มีแนวโน้มมากกว่าเนื่องจากผู้เชี่ยวชาญด้านไอทีไม่เข้าใจธรรมชาติของข้อมูล เพียงแต่ถ้าเราวัดข้อมูลด้วยความแม่นยำระดับมิลลิเมตร ก็ไม่มีประโยชน์ที่จะคำนวณพื้นที่ด้วยความแม่นยำระดับตารางไมครอน ในกรณีของโครงข่ายประสาทเทียมที่ซับซ้อน เรากำลังเผชิญกับข้อเท็จจริงที่ว่ามันให้ข้อมูลที่แม่นยำจนถึงสัญญาณสุดท้ายในแมนทิสซา แต่สัญญาณเหล่านี้ไม่มีความหมายใดมากไปกว่าความแม่นยำที่อินพุต

บางทีความปรารถนาทั่วไปของผู้คนที่เกี่ยวข้องกับการประเมินความถูกต้องของแบบจำลองไม่เพียงแต่ให้คุณลักษณะที่แน่นอน แต่ยังรวมถึงขีดจำกัดของช่วงที่ยอมรับได้หรือการแพร่กระจายที่ได้รับค่าเหล่านี้ จริงๆแล้วคำแนะนำที่ดีไม่เพียงแต่สำหรับผู้ที่มีปฏิสัมพันธ์กับนักฟิสิกส์หรือนักชีววิทยาเท่านั้น โดยหลักการแล้วนี่คือวิธีที่ถูกต้องในการรักษาการนำเสนอผลงานที่ได้รับ

และถ้าเราพูดถึงว่าพวกเขาสามารถทำได้มากแค่ไหนความคาดหวังที่แตกต่างกันทั้งในด้านหนึ่งและอีกด้านหนึ่ง สิ่งเหล่านี้ล้วนเป็นปัญหาในการทำงาน จริงๆ แล้ว หากมีความสนใจทั้งสองฝ่ายก็สามารถแก้ไขได้ง่ายและดี กล่าวคือ ปัจจุบันแมชชีนเลิร์นนิงเป็นที่ต้องการของนักฟิสิกส์ในความหมายกว้างๆ เนื่องจากมีเครื่องมือที่แม่นยำมากขึ้นในการทำงานกับข้อมูลของตน และมันทำงานในทิศทางตรงกันข้าม เพราะสำหรับผู้เชี่ยวชาญด้านการเรียนรู้ของเครื่อง มันน่าสนใจกว่ามากที่จะเห็นว่าอัลกอริทึมของพวกเขาช่วยในการค้นพบอนุภาคใหม่ได้อย่างไร เช่นในกรณีในห้องปฏิบัติการของเรา เราทำงานกันเป็นเวลานานเพื่อสร้างอัลกอริธึมที่จะกำหนดประเภทของอนุภาค และเมื่อไม่นานมานี้ มีข่าวเกี่ยวกับการค้นพบเตตราควาร์กชนิดใหม่ และอัลกอริธึมของเรามีส่วนโดยตรงในการค้นพบพวกมัน

ดังนั้นสำหรับคนไอทีตามเงื่อนไขจาก Data Scienceวิทยาการคอมพิวเตอร์ ความรู้สึกถึงประโยชน์ของอัลกอริธึมที่พวกเขาพัฒนาเป็นสิ่งสำคัญมาก ดังนั้น ที่คณะของเรา จึงมีห้องปฏิบัติการนานาชาติด้านชีวสารสนเทศศาสตร์ 

ปฏิสัมพันธ์ดังกล่าวมีเพิ่มมากขึ้นเป็นปกติมากขึ้นเรื่อยๆ ฉันไม่รู้ว่าพวกเขาสามารถถือเป็นกระแสหลักได้แล้วหรือว่าเรายังคงต้องรอ แต่อย่างใดไม่ทางใดก็ทางหนึ่งเรื่องราวนี้ก็หลีกเลี่ยงไม่ได้ แม้ว่าคุณจะดูเวิร์กช็อปที่จัดขึ้นโดยเป็นส่วนหนึ่งของการประชุมชั้นนำในปัจจุบันเกี่ยวกับปัญญาประดิษฐ์ แต่เวิร์กช็อปเกี่ยวกับการใช้ AI ในวิทยาศาสตร์กายภาพก็ยังเป็นผู้นำในจำนวนผู้สนใจ 

อ่านเพิ่มเติม:

ดาวเทียมอเมริกัน "เห็น" ข้อความผิดปกติจาก Earth

เผยแพร่วิดีโอจากจรวดซึ่งเปิดตัวจากเครื่องเร่งการทดลอง

สัตว์ประหลาดที่ใจกลางกาแลคซีของเรา: ดูภาพหลุมดำในทางช้างเผือก