1.一種基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法,其特征在于,所述基于所述第i個(gè)海上任務(wù)的樣本海上態(tài)勢(shì)信息,進(jìn)行第一階段的深度強(qiáng)化學(xué)習(xí),包括:
3.根據(jù)權(quán)利要求2所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法,其特征在于,所述編碼器通過(guò)以下步驟訓(xùn)練得到:
4.根據(jù)權(quán)利要求1至3任一所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法,其特征在于,所述海上任務(wù)集合中的第i個(gè)海上任務(wù)為處于上層任務(wù)層中的任一上層任務(wù);
5.根據(jù)權(quán)利要求1至3任一所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法,其特征在于,所述博弈任務(wù)網(wǎng)絡(luò)通過(guò)以下步驟訓(xùn)練得到:
6.根據(jù)權(quán)利要求1至3任一所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法,其特征在于,所述基本評(píng)價(jià)網(wǎng)絡(luò)通過(guò)以下步驟訓(xùn)練得到:
7.根據(jù)權(quán)利要求1至3任一所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法,其特征在于,所述元評(píng)價(jià)網(wǎng)絡(luò)通過(guò)以下步驟訓(xùn)練得到:
8.一種基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)裝置,其特征在于,所述裝置包括:
9.一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法。