Однако использование такого агента может быть довольно эффективно. Во многих задачах текущее состояние окружения несет в себе всю необходимую информацию о своей истории. Про такое окружение говорят, что оно является Марковским, или несет в себе свойство Маркова.
В случае, если агент использует для принятия решения оценки будущего, необходимо выстроить прогноз об изменении окружения агента после совершения им какого-либо действия. Здесь возможны два варинта:
в детерминистическом мире модель перехода отображает единственным образом пару состояние-действие в новое состояние;
в стохастическом мире модель перехода отображает пару состояние-действие в распределение вероятности состояний.
В качестве примера алгоритма, использующего мультиагентные системы, рассмотрим алгоритм, предложенный в [3]. Данный алгоритм основан на том, все БЛА связаны в единую сеть, внутри которой принимаются решения о распределении объектов наблюдения между ними. Как и во многих других схожих алгоритмах, принятие решения является коллективным и базируется на том, что каждый БЛА выдвигает предложение о том, к какому объекту он считает необходимым двигаться. Остальные БЛА в процессе переговоров могут принять или отвергнуть это решение.
Сам процесс принятия решения состоит в следующем. Каждый агент в течение одного цикла переговоров совершает 4 действия:
отправляет или получает предложение,
обдумывает полученное предложение,
отправляет ответ (согласие или несогласие),
принимает решение.
Каждый агент вычисляет выигрыш, полученный в том случае, если он последует за ней по следующей формуле
bi(Tj) = VTjwr – St,
где VTjwr – «цена» объекта,
St – относительное время преследования объекта
Таким образом, для каждой цели БЛА формирует списки выигрышей, полученных от следования за каждым объектом, и рассылает другим БЛА номер того объекта, за который он получит максимальную выгоду.
На втором и третьем шагах, когда данные от всех БЛА собраны, каждый из них анализирует полученную информацию и принимает решение о согласии или несогласии и этим на основании следующих правил:
если объект выбран только одним БЛА, то данное предложение одобряется;
если объект выбран несколькими БЛА, то согласие посылается только тому БЛА, для которого максимален выигрыш;
один БЛА может отправить только одно согласие для каждой цели;
если все соседи данного БЛА (то есть те БЛА, от которых он находится в непосредственной близости) согласны с его целью, он получает право на принятие решения о целесообразности следования до его текущей цели;
Четвертый шаг заключается в анализе полученных ответов и принятии решения. Если БЛА получил согласия от всех соседей, он выполняет запланированное действие. Если он получил отказ хотя бы от одного из соседей, он участвует в следующем цикле переговоров. Если же БЛА получил отказ от всех своих соседей, он выполняет задачу поиска новых объектов.
Выделим сильные и слабы стороны данного подхода
Сильные стороны:
постоянное взаимодействие между агентами;
коллективное принятие решения всеми агентами.
Слабые стороны:
в случае необходимости использования большой истории действий возрастает ресурсоемкость данного подхода;
агент зачастую действует по аналогии с жадным алгоритмом, а значит его решение в общем случае нельзя считать оптимальным;
необходимость использования стохастических прогнозов в случае использования информации об оценках будущей реакции окружения да действия агентов.
Задача многих коммивояжеров
В своей исторической формулировке задача коммивояжера заключается в том, чтобы найти оптимальный путь торговца между некоторым количеством пунктов маршрута из начальной точки в конечную. При этом в исходной задаче коммивояжера рассматривается только один торговец. В задаче многих коммивояжеров рассматривается поиск пути для нескольких торговцев, причем каждый пункт маршрута должен быть посещен один раз одним из торговцев.
Очевидно, что вместо торговцев в данной задаче также могут быть представлены БЛА, которым нужно облететь некоторое количество наземных объектов.
Похожие статьи:
Размеры пассажирского движения
Исходя из заданного пассажиропотока в дальнем и местном сообщении определим размер пассажирского движения для этого составим композицию состава или другими словами схему размещения в составе поезда в определённой последовательности вагонов разной категории. В зависимости от скорости движения различ ...
Производительность козловых
кранов
Производительность: поскольку пролет рельсовых перегружателей велик, скорость спредерной тележки может быть до 150 м/мин. Скорость подъема до 30-60 м/мин, скорость перемещения портала до 100-150 м/мин. Однако операционные скорости зависят от грузопотока, транспортного расстояния и способности систе ...
Краткие сведения о хозяйстве ОАО “Племзавод им. М. Горького”
ОАО “Племзавод им. М. Горького” расположено в юго-восточной части Белебеевского района Республики Башкортостан. “Племзавод им. М. Горького” занимает – 6,6% общей площади Белебеевского района. Центр хозяйства расположен в населенном пункте Центральная Усадьба ПЗ имени М.Горького. Расстоние от Центра ...