Однако использование такого агента может быть довольно эффективно. Во многих задачах текущее состояние окружения несет в себе всю необходимую информацию о своей истории. Про такое окружение говорят, что оно является Марковским, или несет в себе свойство Маркова.
В случае, если агент использует для принятия решения оценки будущего, необходимо выстроить прогноз об изменении окружения агента после совершения им какого-либо действия. Здесь возможны два варинта:
в детерминистическом мире модель перехода отображает единственным образом пару состояние-действие в новое состояние;
в стохастическом мире модель перехода отображает пару состояние-действие в распределение вероятности состояний.
В качестве примера алгоритма, использующего мультиагентные системы, рассмотрим алгоритм, предложенный в [3]. Данный алгоритм основан на том, все БЛА связаны в единую сеть, внутри которой принимаются решения о распределении объектов наблюдения между ними. Как и во многих других схожих алгоритмах, принятие решения является коллективным и базируется на том, что каждый БЛА выдвигает предложение о том, к какому объекту он считает необходимым двигаться. Остальные БЛА в процессе переговоров могут принять или отвергнуть это решение.
Сам процесс принятия решения состоит в следующем. Каждый агент в течение одного цикла переговоров совершает 4 действия:
отправляет или получает предложение,
обдумывает полученное предложение,
отправляет ответ (согласие или несогласие),
принимает решение.
Каждый агент вычисляет выигрыш, полученный в том случае, если он последует за ней по следующей формуле
bi(Tj) = VTjwr – St,
где VTjwr – «цена» объекта,
St – относительное время преследования объекта
Таким образом, для каждой цели БЛА формирует списки выигрышей, полученных от следования за каждым объектом, и рассылает другим БЛА номер того объекта, за который он получит максимальную выгоду.
На втором и третьем шагах, когда данные от всех БЛА собраны, каждый из них анализирует полученную информацию и принимает решение о согласии или несогласии и этим на основании следующих правил:
если объект выбран только одним БЛА, то данное предложение одобряется;
если объект выбран несколькими БЛА, то согласие посылается только тому БЛА, для которого максимален выигрыш;
один БЛА может отправить только одно согласие для каждой цели;
если все соседи данного БЛА (то есть те БЛА, от которых он находится в непосредственной близости) согласны с его целью, он получает право на принятие решения о целесообразности следования до его текущей цели;
Четвертый шаг заключается в анализе полученных ответов и принятии решения. Если БЛА получил согласия от всех соседей, он выполняет запланированное действие. Если он получил отказ хотя бы от одного из соседей, он участвует в следующем цикле переговоров. Если же БЛА получил отказ от всех своих соседей, он выполняет задачу поиска новых объектов.
Выделим сильные и слабы стороны данного подхода
Сильные стороны:
постоянное взаимодействие между агентами;
коллективное принятие решения всеми агентами.
Слабые стороны:
в случае необходимости использования большой истории действий возрастает ресурсоемкость данного подхода;
агент зачастую действует по аналогии с жадным алгоритмом, а значит его решение в общем случае нельзя считать оптимальным;
необходимость использования стохастических прогнозов в случае использования информации об оценках будущей реакции окружения да действия агентов.
Задача многих коммивояжеров
В своей исторической формулировке задача коммивояжера заключается в том, чтобы найти оптимальный путь торговца между некоторым количеством пунктов маршрута из начальной точки в конечную. При этом в исходной задаче коммивояжера рассматривается только один торговец. В задаче многих коммивояжеров рассматривается поиск пути для нескольких торговцев, причем каждый пункт маршрута должен быть посещен один раз одним из торговцев.
Очевидно, что вместо торговцев в данной задаче также могут быть представлены БЛА, которым нужно облететь некоторое количество наземных объектов.
Похожие статьи:
Коммерческое обеспечение и финансово-экономический результат рейса
Протяженность маршрута перехода Волгоград-Триест, составляет 1906миль – 3530 км. Его можно разделить, по условиям плавания, на два участка: речной и морской. Речной участок (от порта Волгоград до 0 км. реки Дон ) имеет протяженность 596 км. Морской участок ( от 0 км. реки Дон до порта Триест ) имее ...
Выбор закона управления для движения тангажа
Надо отметить, что выбор параметров статического закона управления вида: для движения тангажа, сопряжено с некоторыми трудностями. Очень просто выбираются передаточные числа закона управления, когда в закон управления включается сигнал по углу атаки. Закон управления рулем высоты при угловой стабил ...
Ремонт системы питания двигателей с газобаллонными установками
Ремонт—процесс восстановления и поддержания работоспособности автомобиля путем устранения отказов и неисправностей, возникающих в работе или выявленных при техническом обслуживании. Ремонтные работы выполняют по потребности, т. е. после появления отказа или неисправности, или по плану — через опр ...