本申請涉及數(shù)據(jù)處理,尤其涉及一種對話模型的訓(xùn)練方法、數(shù)據(jù)處理方法及相關(guān)裝置。
背景技術(shù):
1、對話模型可以用于與用戶進(jìn)行對話,還能夠解答用戶想問咨詢的問題。針對目標(biāo)業(yè)務(wù)場景,由于目標(biāo)業(yè)務(wù)場景僅在目標(biāo)時(shí)間段內(nèi)有效,目標(biāo)業(yè)務(wù)場景對應(yīng)的對話數(shù)據(jù)較少,目標(biāo)業(yè)務(wù)場景對應(yīng)的對話數(shù)據(jù)的話術(shù)質(zhì)量較低,對話數(shù)據(jù)包括的回復(fù)數(shù)據(jù)的準(zhǔn)確率較低,從而會(huì)導(dǎo)致對話模型生成回復(fù)數(shù)據(jù)的準(zhǔn)確率較低。
技術(shù)實(shí)現(xiàn)思路
1、本申請實(shí)施例提供一種對話模型的對話模型的訓(xùn)練方法、數(shù)據(jù)處理方法及相關(guān)裝置,能夠提高目標(biāo)對話模型生成回復(fù)數(shù)據(jù)的準(zhǔn)確率。
2、本申請實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的:
3、本申請實(shí)施例提供一種對話模型的訓(xùn)練方法,所述方法包括:
4、獲取目標(biāo)業(yè)務(wù)場景下的對話數(shù)據(jù),所述目標(biāo)業(yè)務(wù)場景的出現(xiàn)頻次小于閾值,所述對話數(shù)據(jù)包括第一數(shù)據(jù)以及針對所述第一數(shù)據(jù)進(jìn)行回復(fù)的第一回復(fù)數(shù)據(jù);
5、待訓(xùn)練的目標(biāo)對話模型對所述第一數(shù)據(jù)進(jìn)行回復(fù)預(yù)測,得到第一預(yù)測回復(fù)數(shù)據(jù);
6、預(yù)訓(xùn)練的話術(shù)評估模型對所述第一預(yù)測回復(fù)數(shù)據(jù)進(jìn)行話術(shù)質(zhì)量評估,得到評估結(jié)果;
7、獲取所述第一回復(fù)數(shù)據(jù)與所述第一預(yù)測回復(fù)數(shù)據(jù)之間的差異,并基于所述差異以及所述評估結(jié)果,更新所述目標(biāo)對話模型的模型參數(shù)。
8、本申請實(shí)施例提供一種數(shù)據(jù)處理方法,所述方法包括:
9、獲取目標(biāo)業(yè)務(wù)場景下的待回復(fù)數(shù)據(jù),所述目標(biāo)業(yè)務(wù)場景的出現(xiàn)頻次小于閾值;
10、目標(biāo)對話模型對所述待回復(fù)數(shù)據(jù)進(jìn)行回復(fù)預(yù)測,得到預(yù)測回復(fù)數(shù)據(jù),所述目標(biāo)對話模型是基于第一回復(fù)數(shù)據(jù)與第一預(yù)測回復(fù)數(shù)據(jù)之間的差異以及評估結(jié)果訓(xùn)練得到的,所述第一預(yù)測回復(fù)數(shù)據(jù)是待訓(xùn)練的目標(biāo)對話模型對第一數(shù)據(jù)進(jìn)行回復(fù)預(yù)測得到的,所述評估結(jié)果是預(yù)訓(xùn)練的話術(shù)評估模型對所述第一預(yù)測回復(fù)數(shù)據(jù)進(jìn)行話術(shù)質(zhì)量評估得到的;所述第一數(shù)據(jù)和所述第一回復(fù)數(shù)據(jù)是包括在所述目標(biāo)業(yè)務(wù)場景下的對話數(shù)據(jù)中。
11、本申請實(shí)施例提供一種對話模型的訓(xùn)練裝置,所述裝置包括:
12、獲取模塊,用于獲取目標(biāo)業(yè)務(wù)場景下的對話數(shù)據(jù),所述目標(biāo)業(yè)務(wù)場景的出現(xiàn)頻次小于閾值,所述對話數(shù)據(jù)包括第一數(shù)據(jù)以及針對所述第一數(shù)據(jù)進(jìn)行回復(fù)的第一回復(fù)數(shù)據(jù);
13、輸入模塊,用于待訓(xùn)練的目標(biāo)對話模型對所述第一數(shù)據(jù)進(jìn)行回復(fù)預(yù)測,得到第一預(yù)測回復(fù)數(shù)據(jù);
14、所述輸入模塊,還用于預(yù)訓(xùn)練的話術(shù)評估模型對所述第一預(yù)測回復(fù)數(shù)據(jù)進(jìn)行話術(shù)質(zhì)量評估,得到評估結(jié)果;
15、更新模塊,用于獲取所述第一回復(fù)數(shù)據(jù)與所述第一預(yù)測回復(fù)數(shù)據(jù)之間的差異,并基于所述差異以及所述評估結(jié)果,更新所述目標(biāo)對話模型的模型參數(shù)。
16、本申請實(shí)施例提供一種數(shù)據(jù)處理裝置,所述裝置包括:
17、獲取模塊,用于獲取目標(biāo)業(yè)務(wù)場景下的待回復(fù)數(shù)據(jù),所述目標(biāo)業(yè)務(wù)場景的出現(xiàn)頻次小于閾值;
18、預(yù)測模塊,用于目標(biāo)對話模型對所述待回復(fù)數(shù)據(jù)進(jìn)行回復(fù)預(yù)測,得到預(yù)測回復(fù)數(shù)據(jù),所述目標(biāo)對話模型是基于第一回復(fù)數(shù)據(jù)與第一預(yù)測回復(fù)數(shù)據(jù)之間的差異以及評估結(jié)果訓(xùn)練得到的,所述第一預(yù)測回復(fù)數(shù)據(jù)是待訓(xùn)練的目標(biāo)對話模型對第一數(shù)據(jù)進(jìn)行回復(fù)預(yù)測得到的,所述評估結(jié)果是預(yù)訓(xùn)練的話術(shù)評估模型對所述第一預(yù)測回復(fù)數(shù)據(jù)進(jìn)行話術(shù)質(zhì)量評估得到的;所述第一數(shù)據(jù)和所述第一回復(fù)數(shù)據(jù)是包括在所述目標(biāo)業(yè)務(wù)場景下的對話數(shù)據(jù)中。
19、本申請實(shí)施例提供一種電子設(shè)備,所述電子設(shè)備包括:
20、存儲(chǔ)器,用于存儲(chǔ)計(jì)算機(jī)可執(zhí)行指令;
21、處理器,用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的計(jì)算機(jī)可執(zhí)行指令時(shí),實(shí)現(xiàn)本申請實(shí)施例提供的對話模型的訓(xùn)練方法,或?qū)崿F(xiàn)本申請實(shí)施例提供的數(shù)據(jù)處理方法。
22、本申請實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)程序或計(jì)算機(jī)可執(zhí)行指令,用于被處理器執(zhí)行時(shí)實(shí)現(xiàn)本申請實(shí)施例提供的對話模型的訓(xùn)練方法,或?qū)崿F(xiàn)本申請實(shí)施例提供的數(shù)據(jù)處理方法。
23、本申請實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序或計(jì)算機(jī)可執(zhí)行指令,所述計(jì)算機(jī)程序或計(jì)算機(jī)可執(zhí)行指令被處理器執(zhí)行時(shí),實(shí)現(xiàn)本申請實(shí)施例提供的對話模型的訓(xùn)練方法,或?qū)崿F(xiàn)本申請實(shí)施例提供的數(shù)據(jù)處理方法。
24、本申請實(shí)施例能夠?qū)Υ?xùn)練的目標(biāo)對話模型輸出的第一回復(fù)數(shù)據(jù)的話術(shù)質(zhì)量進(jìn)行評估,并將評估結(jié)果作為調(diào)節(jié)模型參數(shù)的依據(jù),也就是說,本申請實(shí)施例結(jié)合了第一回復(fù)數(shù)據(jù)與第一預(yù)測回復(fù)數(shù)據(jù)之間的差異和評估結(jié)果兩個(gè)方面調(diào)節(jié)目標(biāo)對話模型的模型參數(shù),相較于僅結(jié)合預(yù)測回復(fù)數(shù)據(jù)和回復(fù)數(shù)據(jù)之間的差異調(diào)節(jié)模型參數(shù)的方式,可以使目標(biāo)對話模型生成的回復(fù)數(shù)據(jù)更加準(zhǔn)確,并使目標(biāo)對話模型生成的回復(fù)數(shù)據(jù)的話術(shù)質(zhì)量升高,能夠進(jìn)一步提高目標(biāo)對話模型生成的回復(fù)數(shù)據(jù)的準(zhǔn)確率。
1.一種對話模型的訓(xùn)練方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述評估結(jié)果包括所述第一預(yù)測回復(fù)數(shù)據(jù)作為達(dá)標(biāo)話術(shù)的概率值;
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,一個(gè)待評估回復(fù)對應(yīng)的預(yù)測評估結(jié)果包括所述待評估回復(fù)作為達(dá)標(biāo)話術(shù)的預(yù)測概率值;
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述獲取n個(gè)待評估回復(fù),包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述確定所述對話訓(xùn)練數(shù)據(jù)對應(yīng)的對話模型,包括:
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述待訓(xùn)練的目標(biāo)對話模型屬于n個(gè)對話模型,所述待訓(xùn)練的目標(biāo)對話模型對應(yīng)的參數(shù)量大于n-1個(gè)對話模型對應(yīng)的參數(shù)量;
9.一種數(shù)據(jù)處理方法,其特征在于,所述方法包括:
10.一種對話模型的訓(xùn)練裝置,其特征在于,所述裝置包括:
11.一種數(shù)據(jù)處理裝置,其特征在于,所述裝置包括:
12.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:
13.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令或者計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)可執(zhí)行指令或者計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至8任一項(xiàng)所述的對話模型的訓(xùn)練方法,或?qū)崿F(xiàn)權(quán)利要求9所述的數(shù)據(jù)處理方法。
14.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)可執(zhí)行指令或計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)可執(zhí)行指令或計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至8任一項(xiàng)所述的對話模型的訓(xùn)練方法,或?qū)崿F(xiàn)權(quán)利要求9所述的數(shù)據(jù)處理方法。