Одним из препятствий расширенного роботизированного искусственного интеллекта является программирование. Если инженер программирует роботизированную руку для перемещения и захвата предмета, ему необходимо знать местоположение предмета и то, с каким усилием его можно захватить. Позже, если инженер хочет перепрофилировать роботизированную руку для работы с другими предметами, он не может применить ту же подпрограмму. Инженер должен переделать программу под новые требования. Это касается большинства роботизированных программ. Уменьшение усилий захвата, датчики обратной связи и машинное зрение помогли устранить проблемы взаимодействия и движения, но перепрограммирование по-прежнему является важным шагом.
Исследователи MIT разработали новую навигационную систему, которая позволяет роботам ориентироваться в своей среде, как люди. Система позволяет роботу исследовать окружающую среду, наблюдать за другими агентами и применять «прошлый опыт», извлеченный из предыдущих испытаний, к их текущей среде. Популярные алгоритмы планирования движения создают дерево возможных решений до тех пор, пока не будет определен лучший путь. Это поэтапные планы, которые определяют лучший путь через процесс исключения. Однако эти алгоритмы редко изучаются: они являются запрограммированными шагами из библиотеки, доступной роботу.
В статье исследователей MIT «Глубокие последовательные модели для планирования на основе выборки» («Deep sequential models for sampling-based planning») они демонстрируют преимущества своей модели в двух случаях: как перемещаться по комнате с ловушками и узкими проходами и как перемещаться по плоскости, избегая столкновений.
«Точно так же, как при игре в шахматы, прорабатывается огромное количество возможных вариантов, пока роботы не высчитают приемлемый способ навигации», — говорит соавтор Андрей Барбу, исследователь лаборатории компьютерных наук Массачусетского технологического института и лаборатории искусственного интеллекта (CSAIL) и Центра мозга, Умы и машины (CBMM) в Институте МакГоверна MIT. «Но в отличие от шахматистов, роботы проводят анализ, имея минимум информации о среде, где они находятся, и окружении»
«В тысячный раз они проходят через ту же самую «толпу», как и в первый раз, — продолжает Барбу. «Они всегда изучают, редко наблюдают и никогда не используют прошлые решения».
Модель представляет собой комбинацию алгоритма планирования с нейронной сетью, которая учится распознавать пути, ведущие к лучшему результату. Реальное применение этой модели будет представлять собой автономные транспортные средства, способные самостоятельно преодолевать перекрестки и взаимодействовать с общим траффиком автомобилей. Исследователи проводят такие испытания в партнерстве с Объединенным исследовательским центром Toyota-CSAIL.
В традиционной системе планирования движения робот исследует окружающую среду, расширяя дерево решений, которое охватывает все возможные варианты в заданном пространстве. Затем робот исследует дерево решений, определяя лучший способ добраться до заданной точки.
Новая модель начинается с нескольких предварительно запрограммированных примеров для навигации по различным типам сред. Нейронная сеть узнает, что необходимо сделать для успешного выполнения задачи, интерпретируя текущую среду вокруг робота. Это включает в себя физические условия, такие как стены, действия других людей в окружающей среде и главную цель робота. Модель сочетает в себе исследовательское поведение предыдущих методов с новым изученным методом.
Основополагающий «проектировщик», известный как «Быстрое исследование случайных деревьев» (RRT), был разработан профессорами Массачусетского технологического института Серфаком Караманом и Эмилио Фраццоли. Нейронная сеть отражает каждый шаг, созданный деревом поиска, чтобы предсказать, какое решение даст лучший результат, и, следовательно, направлять действия робота на основе успешного решения. Если сеть не имеет высокой уверенности в своем решении, она позволяет роботу исследовать окружающую среду, как традиционная система планирования движения.
Другим аспектом исследования является то, как робот обрабатывает других агентов в своей среде. В процессе симуляции робот погружается в среду с другими агентами, избегающими препятствий (люди или другие роботы). Робот должен перемещаться с этими агентами, избегать столкновений и достигать цели (например, выхода). Одним из примеров этого является круговое движение. «Ситуации, такие как «карусели», сложны, потому что им нужно рассуждать о том, как другие будут реагировать на ваши действия, как вы тогда ответите на них, что они будут делать дальше и так далее», — объясняет Барбу. «В конечном итоге вы обнаружите, что ваше первое действие было неправильным, потому что позже это приведет к вероятной аварии. Эта проблема становится экспоненциально хуже с ростом количества автомобилей, с которыми вы должны конкурировать».
Модель может собирать достаточное количество данных о будущем поведении других участников, чтобы на раннем этапе отсрочить процесс анализа и по-прежнему принимать правильные решения для навигации по данному препятствию. Эффективное планирование является ключевым для этих типов систем. Система была запрограммирована только несколькими примерами кругового движения с несколькими автомобилями и была способна экстраполировать будущие навигационные сценарии. Прохождение через перекрестки и круговое движение — одни из самых сложных аспектов автономных транспортных средств; системы, такие как MIT, помогут будущим автомобилям перемещаться по сложной местности.
Небольшой видео обзор современных роботов: