Объединенный институт ядерных исследований

ЕЖЕНЕДЕЛЬНИК
Электронная версия с 1997 года
Газета основана в ноябре 1957 года
Регистрационный № 1154
Индекс 00146
Газета выходит по четвергам
50 номеров в год

Номер 27 (4624) от 21 июля 2022:


№ 27 в формате pdf
 

Совещания

ОИЯИ остается притягательным центром

6-е Международное совещание "Глубокое обучение в вычислительной физике" (DLCP 2022) работало в ЛИТ ОИЯИ с 6 по 8 июля в смешанном формате. Оно в основном было посвящено использованию машинного обучения в астрофизике элементарных частиц и физике высоких энергий, но не ограничивалось этими областями. Его темами также стали различные приложения искусственных нейронных сетей к физическим задачам, разработка новых современных методов машинного обучения для анализа различных научных данных, в том числе больших данных. В совещании приняли участие специалисты НИИЯФ МГУ, МИФИ, НИЦ "Курчатовский институт", государственных университетов Иркутска, Москвы, Санкт-Петербурга, Твери, Тулы, университетов Индии, Сербии, Словакии, сотрудники лабораторий ОИЯИ.

Открывая совещание, директор ЛИТ В.В.Кореньков отметил, что глубокое машинное обучение чрезвычайно важно во всех сферах исследований Института, а работы, выполненные ЛИТ в этом направлении, будут представлены в докладах на совещании. В своем вступительном докладе он рассказал о направлениях работы лаборатории, участии в крупных проектах ОИЯИ и ЦЕРН, развитии Многофункционального информационно-вычислительного комплекса. С директором ЛИТ побеседовала наш корреспондент:

- Рабочее совещание-конференция "Глубокое машинное обучение в научной сфере" - традиционное мероприятие МГУ. Они провели уже несколько таких, достаточно локальных мероприятий, ориентированных только на использование методов глубокого машинного обучения в различных областях науки, в основном, в ядерной физике, физике высоких энергий, астрофизике. Несколько месяцев назад коллеги обратились к нам, чтобы, во-первых, мы немного расширили тематику конференции, и, во-вторых, провели это мероприятие в Дубне. Эта тема нас очень интересует, причем в более широком диапазоне, не только в физике высоких энергий и астрофизике, но и в экономике, социальной сфере, биологии, медицине и так далее. Глубокое машинное обучение сейчас находит очень широкое применение в разных сферах. Так что здесь мы ее проводим в первый раз, но я бы не сказал, что мы не имеем к этой конференции прямого отношения, конечно, имеем. Эта тема для нас очень важна, мы занимаемся глубоким машинным обучением для новых мегасайенс проектов. Для всех экспериментов проекта NICA делаются и трекинг, и методы анализа данных, они используется и в проекте Baikal GVD, мы много работаем и в радиобиологии, ядерной медицине.

Эта тематика является частью нашей конференции MMCP, поэтому не удивительно, что здесь зарегистрировались более 120 участников, тогда как в МГУ в этих совещаниях участвовали 30-35 человек. Программа интересная, очень разнообразная, надеемся, конференция будет полезной для развития этого направления в нашем Институте и в странах-участницах, представители которых смогли принять в ней участие. Приехала и команда Санкт-Петербургского госуниверситета, с которым мы вместе выполняем многие работы в этой области. Многие выпускники или аспиранты СПбГУ выполняли работы по нашей тематике. Я возглавляю государственную экзаменационную комиссию по защите магистерских диссертаций в СПбГУ, и в этом году почти половина представленных работ была выполнена по тематике ОИЯИ, как правило, с применением глубокого машинного обучения. Многие кандидатские диссертации в СПбГУ сделаны совместно с нашей лабораторией.

- Станет ли эта конференция традиционной конференцией ЛИТ?

- Мы пока не обсуждали дальнейшие планы, возможно, конференция станет нашей традиционной или будет проводиться вместе с МГУ. Команду НИИЯФ МГУ, занимавшуюся этой конференцией, возглавляет Александр Павлович Крюков, с которым мы знакомы очень давно, много занимались компьютингом для LHC и представляли Россию в разных комитетах.

- Начиналось все пять лет назад с совместного проекта НИИИЯФ - KIT (Технологический институт Карлсруэ, Германия), - рассказывает сопредседатель оргкомитета конференции А.П.Крюков (НИИЯФ МГУ). - Тогда же началось это движение в сторону машинных методов в астрофизике частиц. Дело в том, что базовый эксперимент, на котором это сотрудничество возникло, это гамма-астрономия на базе проекта TAIGA-Tunka. В Тункинской долине рядом с Байкалом развертывается гамма-обсерватория. Она имеет большую историю, но последнее время проект быстро развивается, уже стоят три черенковских телескопа, еще два запланированы. Это совместный проект, в том числе и с Дубной, которая внесла в него большой вклад. Более старая установка Тункан-133 сейчас расширена и обновлена, и носит имя TAIGA-HiSCORE - это тоже черенковский телескоп. В гамма-астрономии есть несколько базовых задач: первая - выделить собственно сигнал, а на одно гамма-событие приходится 10000 протонных, и это очень сложная задача. А если мы умеем выделять гамма-событие, то дальше можем проводить физический анализ и получать те самые спектры, по которым можно судить о природе источника, о природе гамма-квантов, решать другие астрофизические задачи.

Возникло понимание, что необходима разработка новых методов, потому что старые фактически исчерпали себя, достигли некоторого предела. В последнее время огромное значение приобретают методы машинного обучения, сейчас по этой теме идет вал публикаций практически во всех областях науки. Сегодня мы услышали доклады про коллайдерную физику, про астрофизику, но на самом деле это и биология, лингвистика, обычные сервисы, к которым многие люди привыкли, типа голосового помощника Алисы, сервисы Google, - все это в том или ином виде нейронные сети. Зная об их большом потенциале, мы начали развивать это направление, и организовали сначала первое совещание, а потом оно стало традиционным и международным. К сожалению, в этот раз число зарубежных участников невелико, но мы считаем, что международный статус сохраняется, и надеемся, что будет развитие и дальше. Помощь Дубны в его организации в этом году ключевая.

Что меня удивило в этом году? Мы организовывали достаточно узкие совещания, собиравшие 25-30 человек, но мы никогда не ограничивались астрофизикой и физикой высоких энергий, всегда включали приложения в биологии, метеорологии и другие направления. Методы едины для того, чтобы анализировать огромные потоки данных, которые получают не только с установок типа LHC, но и от мониторинга Земли, например. Но в этом году число желающих выступить увеличилось, по крайней мере, вдвое. Учитывая наличие хорошей образовательной базы в Дубне в виде университета, с которым сотрудничает ОИЯИ, и важность образовательного момента в плане подготовки смены, мы добавили секцию "Машинное обучение в образовании". С одной стороны, это возможность высказаться, как нам готовить специалистов в этой области с уклоном в физику, а с другой - дать возможность молодым людям, может быть, еще студентам, представить свои дипломные работы в виде постеров.

О постоянном участии СПбГУ во многих конференциях ЛИТ сообщил представитель этого университета В.А.Руднев:

- Прежде всего надо сказать, что между нашим университетом и ОИЯИ есть давние научные связи, которые происходят, наверное, с самого момента основания Объединенного института. Конечно, я здесь - немного со стороны. В том смысле, что больше представляю ту сторону вычислительной физики, а здесь очень много людей, которые занимаются более-менее абстрактными математическими задачами, алгоритмическими задачами, хотя и в приложении к физике, но эта конференция, тем не менее, сосредоточена на методе. Меня же интересуют какие-то физические приложения, которые бы позволили продвинуть моделирование сложных квантовых систем на концептуально новый уровень. Те вычислительные технологии, та техника, которая является предметом этой конференции, она как раз дает надежду сделать колоссальный прорыв именно в области решения сложных квантово-механических задач. Собственно, сообщить об этом коллегам я и приехал. А если мы это сделаем, то сможем обеспечить технологическое доминирование в области нанотехнологий, там, где сложные квантовые эффекты начинают играть существенную роль.

Есть системы, которые мы физически не можем просчитать даже на современных, самых "страшных" компьютерах, про которые нам здесь рассказывали, их не хватит, чтобы решить эти задачи. Шанс появляется, если применить правильные техники к их решению, а эти техники еще нужно разработать, у нас есть только обоснованные, но всё еще надежды. Наша задача - превратить эти надежды в реальную технологию. И пообщаться в кругу людей, которые занимаются именно современными вычислительными технологиями, связанными с глубоким машинным обучением, с нейронными сетями, - это для меня важно. И, конечно же, между ЛИТ и СПбГУ, а я представляю кафедру вычислительной физики, есть давние связи, наши аспиранты здесь защищаются. А у меня как у теоретика по происхождению давние связи с ЛТФ, надеюсь посетить своих товарищей в этот раз. Эти связи, несмотря на все сложности нашей жизни, остаются прежними, и ОИЯИ остается притягательным центром, в котором можно найти здоровую научную атмосферу, что сегодня, в условиях сильной бюрократизации науки, явление редкое. Именно она притягивает нас сюда вновь и вновь.

- Вы приехали сюда с молодыми коллегами?

- Понимаете, с молодыми коллегами, особенно с аспирантами, сейчас проблема. Работа аспиранта такова, что ей надо себя посвящать целиком, если у тебя нет физической возможности выжить при этом, а аспирантская зарплата не дает такой возможности, то вся талантливая молодежь будет решать прежде всего задачи выживания. Те, у кого эта задача решена, могут каким-то образом поучаствовать в развитии науки, но текущая социальная ситуация начисто отсекает будущее российской науки, правильнее сказать так - она отсекает российскую науку от ее будущего.

- Вот на этой печальной ноте и закончим наше интервью...

- Ну, не то чтобы нота совсем печальная, это - реальность, но нас никогда не оставляет надежда, что что-то может измениться, что мы можем попытаться что-то изменить.

С докладом "Машинное обучение в МЛИТ. История, вызовы и перспективы" на конференции выступил Г.А.Ососков. "Машинное обучение - это то, чем я занимаюсь 60 лет работы в ОИЯИ. Я и не знал сначала, что методы обработки экспериментальных данных - это и есть методы машинного обучения". Докладчик рассказал о классических методах машинного обучения и о современных, возникших с появлением нейронных сетей; показал главные этапы анализа экспериментальных данных в экспериментах физики высоких энергий; остановился на современных вызовах - проекте NICA с экспериментами BM&N, MPD и SPD; привел примеры удачного использования нейронных сетей. А началось это все в 1966 году, когда М.Г.Мещеряков, будучи физиком, стал директором новой лаборатории и категорически настоял на том, чтобы в ЛВТА занялись обработкой экспериментальных данных...

Об истории я и спросила Геннадия Алексеевича после его выступления:

- Михаил Григорьевич был весьма озадачен, когда ему предложили возглавить новую лабораторию. И хотя была даже некая битва за руководство, но поскольку дирекции тогда были не совсем ясны организационные моменты и требовались большие затраты, то вспомнили о Мещерякове. Все рассчитывали на его старые связи в министерстве и его умение, как танк, проламывать любые проблемы. Он отсиделся какое-то время после своей отставки. Причем, должен заметить, это были лучшие годы его жизни - он наконец-то занялся приличной физикой, сделал значимые открытия. Подумав, он согласился на это предложение. Единственное условие, которое он поставил, что это не будет вычислительный центр. Он говорил: "В этих вещах я мало что понимаю, я понимаю в физике, и я вижу, что сейчас главная проблема для физиков - отсутствие сканеров, которые бы считывали фильмовую информацию". В то время эксперименты шли на разного рода пузырьковых камерах, а их результаты фотографировались. Были накоплены уже миллионы фотографий, и, хотя в ЦЕРН и ОИЯИ работали по 70 просмотрщиц, они не справлялись - требовалась автоматизация. И в ЦЕРН такой процесс уже шел.

Мещеряков отнесся к этому довольно фундаментально. Он поехал в США и прямо спросил нобелевского лауреата Л.Альвареса, что сейчас самое разумное, чтобы быстро обрабатывать снимки в автоматическом режиме? Тот ответил: спиральный измеритель. Мещеряков задался идеей запустить серийное производство спиральных измерителей в Дубне, чтобы обеспечить все физические центры СССР, а, может быть, и соцстран. Его грандиозные планы не сбылись по разным причинам, в основном, из-за низкого уровня развития технологий в стране. Но когда он запустил свой циклотрон, он показал, что умеет собрать народ и сделать так, чтобы все заработало. В этот раз он поступил так же: взял список сотрудников ОИЯИ, и вытащил к себе всех нужных специалистов. Так появились Юра Каржавин с отделом автоматизации, специалисты по электронике, обеспечивающие эту автоматизацию, и возникла довольно большая лаборатория. Он далеко смотрел вперед, единственное, чего он не мог предвидеть, это быстрого развития электронных экспериментов. Тогда еще не было даже идеи дрейфовых камер, а потом появились коллайдерные эксперименты, так что то, что он придумал, к сожалению, прожило не очень долго. Самое интересно, что практически все задачи, что мы решали тогда, для меня до сих пор представляют кладезь полезных алгоритмов, многие задумки и изобретения работают до сих пор.

С Михаилом Григорьевичем мы тесно общались. Он отправил меня, переломив мои возражения, в ЦЕРН изучать этот спиральный измеритель. Изучать всерьез: я должен был придумать программы, которые двигают частями этого измерителя. У них были разработаны программы в автокодах, а я написал язык для управления автоматами, написал свой транслятор в тот машинный код. Жаль, что в ОИЯИ не смогли купить такую большую и дорогую машину, какая была в ЦЕРН, и все мои наработки не очень-то пригодились.

- Расскажите, пожалуйста, подробнее, о том, какие вызовы стоят перед вами сейчас.

- Наша небольшая команда делает программы по реконструкции событий будущих экспериментов на комплексе NICA. А.С.Жемчугов уже вовлек нас в задачи ЛЯП, связанные с SPD. У нас есть абсолютно новые подходы в нейронных сетях, которые мы собираемся использовать. Например, возможность с помощью сверточной нейросети представить пространственное изображения всего изучаемого SPD события, что позволяет, в частности, найти координаты его вершины до распознавания всех треков, как это сейчас делается. Единственное, нам сейчас не хватает компьютерных ресурсов, чтобы разместить это огромное цифровое представление события в памяти компьютера, но уже то, что нам удалось реализовать, демонстрирует большую перспективу такого подхода.

Основная проблема в реконструкции событий с помощью нейросетей - это то, что из-за жесткого требования не потерять полезные треки при высокой эффективности распознавания, нейросеть может допустить появление ложных, несуществующих треков. Они недопустимы для физиков, их не должно быть более 4 процентов, а у нас сейчас их количество доходит до 20 процентов. Сейчас перед нами стоит настоящий вызов: используя тонкую настройку параметров применяемых нейросетей и такие сети, как графовые и трансформеры, повысить эффективность результатов реконструкции с подавлением ложных треков.

***

Диапазон выступлений на 6-й конференции оказался таков: от энергетической реконструкции при анализе изображений черенковских телескопов и приложений глубокой нейронной сети для отслеживания частиц в экспериментах BM&N и SPD до оценки точности моделей эволюции COVID-19 и восстановления недостающих данных при решении обратных задач разведочной геофизики. Где еще можно использовать возможности машинного обучения и нейросетей, узнаем на следующей конференции.

Ольга ТАРАНТИНА,
фото Игоря ЛАПЕНКО
 


При цитировании ссылка на еженедельник обязательна.
Перепечатка материалов допускается только с согласия редакции.
Техническая поддержка -
ЛИТ ОИЯИ
   Веб-мастер