1.一種面向乘客需求的列車自主決策方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的面向乘客需求的列車自主決策方法,其特征在于,所述基于客流實(shí)時(shí)變化,刻畫未來(lái)時(shí)刻內(nèi)站臺(tái)乘客數(shù),構(gòu)建動(dòng)態(tài)客流模型,具體包括以下步驟:
3.根據(jù)權(quán)利要求1所述的面向乘客需求的列車自主決策方法,其特征在于,所述基于動(dòng)態(tài)客流模型,建立多列車分布式協(xié)同框架,將多列車問(wèn)題轉(zhuǎn)化為前車和后車的單列車問(wèn)題,并更新各列車獲取的站臺(tái)客流狀態(tài),具體包括以下步驟:
4.根據(jù)權(quán)利要求1所述的面向乘客需求的列車自主決策方法,其特征在于,所述分析前車和后車的運(yùn)行關(guān)系,構(gòu)建前后車安全防護(hù)約束模型,具體包括以下步驟:
5.根據(jù)權(quán)利要求4所述的面向乘客需求的列車自主決策方法,其特征在于,所述基于列車運(yùn)動(dòng)學(xué)模型,以準(zhǔn)點(diǎn)為目標(biāo),設(shè)計(jì)動(dòng)態(tài)規(guī)劃算法,獲取各列車速度曲線,具體包括以下步驟:
6.根據(jù)權(quán)利要求1所述的面向乘客需求的列車自主決策方法,其特征在于,所述基于前后車安全防護(hù)約束模型和各列車獲取的站臺(tái)客流狀態(tài),以列車滿載率均衡和乘客等待時(shí)間最小為目標(biāo),設(shè)計(jì)強(qiáng)化學(xué)習(xí)算法,實(shí)現(xiàn)列車自主決策,具體包括以下步驟:
7.根據(jù)權(quán)利要求6所述的面向乘客需求的列車自主決策方法,其特征在于,所述基于各列車獲取的站臺(tái)客流狀態(tài)以及前后車安全防護(hù)約束模型,設(shè)計(jì)強(qiáng)化學(xué)習(xí)算法,計(jì)算當(dāng)前列車在剩余各區(qū)間的最優(yōu)運(yùn)行時(shí)間和剩余各站臺(tái)的最優(yōu)停站時(shí)間,具體包括以下步驟:
8.根據(jù)權(quán)利要求7所述的面向乘客需求的列車自主決策方法,其特征在于,所述基于獎(jiǎng)勵(lì)函數(shù),計(jì)算各列車位置狀態(tài)下選擇最優(yōu)動(dòng)作的最優(yōu)q值,具體包括以下步驟: