Теория относительности помогла компьютеру предсказать будущее

Искусственный интеллект картинка

По словам разработчиков, созданный ими подход универсален.

Британские специалисты по машинному обучению разработали систему прогнозирования будущих событий, основанную на концепциях специальной теории относительности: причинности, пространства-времени Минковского и световых конусах, передает nplus1.ru.

Алгоритм был успешно испытан в задаче предсказания и генерации новых кадров на основе набора изображений.

По словам разработчиков, созданный ими подход универсален, он может применяться для множества задач и будет востребован там, где необходимо прогнозирование развития событий в будущем с учетом причинно-следственных связей, например в области медицины и в автономных транспортных средствах.

Исследователи под руководством Атанасиоса Влонцоса (Athanasios Vlontzos) из Имперского колледжа Лондона разработали алгоритм на основе фундаментальных концепций из специальной теории относительности (СТО), таких как пространство-время и световые конусы.

В СТО пространство-время (или пространство Минковского) представляет собой объединение трехмерного евклидова пространства с четвертым временны́м измерением. В таком пространстве каждому событию можно сопоставить точку, пространственные координаты которой описывают место, где событие произошло, а временна́я координата — момент времени, когда оно случилось.

Ограничение на максимально достижимую скорость распространения сигналов (в СТО это скорость света) позволяет выделить в пространстве-времени область, называемую световым конусом, с центром в исходном событии. Множество точек внутри выделенной области будет связано с исходным событием причинно-следственными связями. Так, в конусе будущего, лежащем выше вершины (исходное событие) будут расположены все точки, на которые исходное событие может повлиять, а в нижнем конусе прошлого, — события, которые могли повлиять на рассматриваемое событие в вершине. При этом точки, находящиеся за пределами светового конуса, не связаны причинно-следственными связями с исходным событием.

Разработчики использовали эту концепцию для того, чтобы ограничить варианты возможных новых кадров, генерируемых их алгоритмом, такими, которые близки по содержанию к исходному изображению и отбросить изображения, сильно отличающиеся от него. В качестве основы для алгоритма была выбрана разновидность популярного метода для обучения генеративных моделей — вариационный автокодировщик Пуанкаре. Подаваемые на вход изображения преобразуются энкодером в представление в скрытом пространстве, которое обладает свойствами пространства Минковского с восемью пространственными и одним временным измерениями. Такая размерность пространства была выбрана как оптимальная экспериментальным путем. Затем алгоритм строит световые конусы вокруг этих точек и ищет их пересечение для того, чтобы выделить ту часть скрытого пространства, в которой могут находиться будущие (или прошлые, в нижнем конусе) кадры. Похожие по содержанию кадры оказываются недалеко друг от друга. В дальнейшем производя выборку из этого подпространства можно пытаться предсказывать будущие кадры.

В качестве наборов данных для обучения модели исследователи использовали модифицированный набор moving MNIST, состоящий из небольших фрагментов видео с перемещающимися рукописными цифрами. Каждый фрагмент представляет собой последовательность из 30 кадров. При этом один из них берется из исходного набора данных MNIST, а последующие кадры — случайные непрерывные смещения исходного изображения. Всего было использовано 10000 фрагментов из этого набора. Кроме того, разработчики использовали набор данных KTH action recognition dataset, состоящий из коротких видеоклипов, демонстрирующих движения людей, например ходьбу или взмахи руками. При этом нужно заметить, что кадры в тренировочных наборах воспринимались алгоритмом разрозненно, а не в виде связанных последовательностей или серий.

Затем исследователи поручили алгоритму генерацию множества потенциально возможных кадров на основе входного одиночного тестового кадра. Несмотря на то, что в весах нейросети отсутствует временна́я информация, так как обучение проходило на совокупности отдельных кадров, а не их последовательностях, оказалось, что алгоритм способен прогнозировать подходящие будущие возможные кадры. Например, если на вход подается кадр, на котором изображен идущий человек с короткими волосами и в рубашке, то алгоритм генерирует наиболее подходящие кадры, на которых изображен такой же человек, и отбрасывает сильно отличающиеся кадры, например с людьми с длинными волосами или без рубашки.

Как утверждают авторы исследования, разработанный ими алгоритм не подвержен эффекту накопления ошибок, так как он не полагается на способность нейронных сетей извлекать и запоминать структурную и временну́ю информацию из обрабатываемых изображений. На данный момент диаметр конуса выбирается вручную и считается фиксированным, что означает постоянную скорость эволюции для всех кадров и конусов. Однако в реальности эти скорости могут быть разными. В будущем исследователи планируют внедрить автоматическую подстройку диаметров световых конусов.

Алгоритм может использоваться в областях, где требуется прогнозирование возможных вариантов развития событий. Например, помимо применения в автопилотах для повышения безопасности автономных транспортных средств, новый подход может быть использован в медицине для прогнозирования того, как лекарственные препараты будут воздействовать на состояние пациента, или как будет прогрессировать заболевание на основании данных снимков МРТ и назначаемого лечения.

Напомним, ученые заявили, что мозг любого человека может предсказать будущее.

ТЭГИ:
comments powered by HyperComments