對話模型的訓(xùn)練方法、數(shù)據(jù)處理方法及相關(guān)裝置與流程

文檔序號(hào)：42882037發(fā)布日期：2025-08-29 19:26閱讀：2來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本申請涉及數(shù)據(jù)處理，尤其涉及一種對話模型的訓(xùn)練方法、數(shù)據(jù)處理方法及相關(guān)裝置。

背景技術(shù)：

1、對話模型可以用于與用戶進(jìn)行對話，還能夠解答用戶想問咨詢的問題。針對目標(biāo)業(yè)務(wù)場景，由于目標(biāo)業(yè)務(wù)場景僅在目標(biāo)時(shí)間段內(nèi)有效，目標(biāo)業(yè)務(wù)場景對應(yīng)的對話數(shù)據(jù)較少，目標(biāo)業(yè)務(wù)場景對應(yīng)的對話數(shù)據(jù)的話術(shù)質(zhì)量較低，對話數(shù)據(jù)包括的回復(fù)數(shù)據(jù)的準(zhǔn)確率較低，從而會(huì)導(dǎo)致對話模型生成回復(fù)數(shù)據(jù)的準(zhǔn)確率較低。

技術(shù)實(shí)現(xiàn)思路

1、本申請實(shí)施例提供一種對話模型的對話模型的訓(xùn)練方法、數(shù)據(jù)處理方法及相關(guān)裝置，能夠提高目標(biāo)對話模型生成回復(fù)數(shù)據(jù)的準(zhǔn)確率。

2、本申請實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的：

3、本申請實(shí)施例提供一種對話模型的訓(xùn)練方法，所述方法包括：

4、獲取目標(biāo)業(yè)務(wù)場景下的對話數(shù)據(jù)，所述目標(biāo)業(yè)務(wù)場景的出現(xiàn)頻次小于閾值，所述對話數(shù)據(jù)包括第一數(shù)據(jù)以及針對所述第一數(shù)據(jù)進(jìn)行回復(fù)的第一回復(fù)數(shù)據(jù)；

5、待訓(xùn)練的目標(biāo)對話模型對所述第一數(shù)據(jù)進(jìn)行回復(fù)預(yù)測，得到第一預(yù)測回復(fù)數(shù)據(jù)；

6、預(yù)訓(xùn)練的話術(shù)評估模型對所述第一預(yù)測回復(fù)數(shù)據(jù)進(jìn)行話術(shù)質(zhì)量評估，得到評估結(jié)果；

7、獲取所述第一回復(fù)數(shù)據(jù)與所述第一預(yù)測回復(fù)數(shù)據(jù)之間的差異，并基于所述差異以及所述評估結(jié)果，更新所述目標(biāo)對話模型的模型參數(shù)。

8、本申請實(shí)施例提供一種數(shù)據(jù)處理方法，所述方法包括：

9、獲取目標(biāo)業(yè)務(wù)場景下的待回復(fù)數(shù)據(jù)，所述目標(biāo)業(yè)務(wù)場景的出現(xiàn)頻次小于閾值；

10、目標(biāo)對話模型對所述待回復(fù)數(shù)據(jù)進(jìn)行回復(fù)預(yù)測，得到預(yù)測回復(fù)數(shù)據(jù)，所述目標(biāo)對話模型是基于第一回復(fù)數(shù)據(jù)與第一預(yù)測回復(fù)數(shù)據(jù)之間的差異以及評估結(jié)果訓(xùn)練得到的，所述第一預(yù)測回復(fù)數(shù)據(jù)是待訓(xùn)練的目標(biāo)對話模型對第一數(shù)據(jù)進(jìn)行回復(fù)預(yù)測得到的，所述評估結(jié)果是預(yù)訓(xùn)練的話術(shù)評估模型對所述第一預(yù)測回復(fù)數(shù)據(jù)進(jìn)行話術(shù)質(zhì)量評估得到的；所述第一數(shù)據(jù)和所述第一回復(fù)數(shù)據(jù)是包括在所述目標(biāo)業(yè)務(wù)場景下的對話數(shù)據(jù)中。

11、本申請實(shí)施例提供一種對話模型的訓(xùn)練裝置，所述裝置包括：

12、獲取模塊，用于獲取目標(biāo)業(yè)務(wù)場景下的對話數(shù)據(jù)，所述目標(biāo)業(yè)務(wù)場景的出現(xiàn)頻次小于閾值，所述對話數(shù)據(jù)包括第一數(shù)據(jù)以及針對所述第一數(shù)據(jù)進(jìn)行回復(fù)的第一回復(fù)數(shù)據(jù)；

13、輸入模塊，用于待訓(xùn)練的目標(biāo)對話模型對所述第一數(shù)據(jù)進(jìn)行回復(fù)預(yù)測，得到第一預(yù)測回復(fù)數(shù)據(jù)；

14、所述輸入模塊，還用于預(yù)訓(xùn)練的話術(shù)評估模型對所述第一預(yù)測回復(fù)數(shù)據(jù)進(jìn)行話術(shù)質(zhì)量評估，得到評估結(jié)果；

15、更新模塊，用于獲取所述第一回復(fù)數(shù)據(jù)與所述第一預(yù)測回復(fù)數(shù)據(jù)之間的差異，并基于所述差異以及所述評估結(jié)果，更新所述目標(biāo)對話模型的模型參數(shù)。

16、本申請實(shí)施例提供一種數(shù)據(jù)處理裝置，所述裝置包括：

17、獲取模塊，用于獲取目標(biāo)業(yè)務(wù)場景下的待回復(fù)數(shù)據(jù)，所述目標(biāo)業(yè)務(wù)場景的出現(xiàn)頻次小于閾值；

18、預(yù)測模塊，用于目標(biāo)對話模型對所述待回復(fù)數(shù)據(jù)進(jìn)行回復(fù)預(yù)測，得到預(yù)測回復(fù)數(shù)據(jù)，所述目標(biāo)對話模型是基于第一回復(fù)數(shù)據(jù)與第一預(yù)測回復(fù)數(shù)據(jù)之間的差異以及評估結(jié)果訓(xùn)練得到的，所述第一預(yù)測回復(fù)數(shù)據(jù)是待訓(xùn)練的目標(biāo)對話模型對第一數(shù)據(jù)進(jìn)行回復(fù)預(yù)測得到的，所述評估結(jié)果是預(yù)訓(xùn)練的話術(shù)評估模型對所述第一預(yù)測回復(fù)數(shù)據(jù)進(jìn)行話術(shù)質(zhì)量評估得到的；所述第一數(shù)據(jù)和所述第一回復(fù)數(shù)據(jù)是包括在所述目標(biāo)業(yè)務(wù)場景下的對話數(shù)據(jù)中。

19、本申請實(shí)施例提供一種電子設(shè)備，所述電子設(shè)備包括：

20、存儲(chǔ)器，用于存儲(chǔ)計(jì)算機(jī)可執(zhí)行指令；

21、處理器，用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的計(jì)算機(jī)可執(zhí)行指令時(shí)，實(shí)現(xiàn)本申請實(shí)施例提供的對話模型的訓(xùn)練方法，或?qū)崿F(xiàn)本申請實(shí)施例提供的數(shù)據(jù)處理方法。

22、本申請實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，存儲(chǔ)有計(jì)算機(jī)程序或計(jì)算機(jī)可執(zhí)行指令，用于被處理器執(zhí)行時(shí)實(shí)現(xiàn)本申請實(shí)施例提供的對話模型的訓(xùn)練方法，或?qū)崿F(xiàn)本申請實(shí)施例提供的數(shù)據(jù)處理方法。

23、本申請實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)程序或計(jì)算機(jī)可執(zhí)行指令，所述計(jì)算機(jī)程序或計(jì)算機(jī)可執(zhí)行指令被處理器執(zhí)行時(shí)，實(shí)現(xiàn)本申請實(shí)施例提供的對話模型的訓(xùn)練方法，或?qū)崿F(xiàn)本申請實(shí)施例提供的數(shù)據(jù)處理方法。

24、本申請實(shí)施例能夠?qū)Υ?xùn)練的目標(biāo)對話模型輸出的第一回復(fù)數(shù)據(jù)的話術(shù)質(zhì)量進(jìn)行評估，并將評估結(jié)果作為調(diào)節(jié)模型參數(shù)的依據(jù)，也就是說，本申請實(shí)施例結(jié)合了第一回復(fù)數(shù)據(jù)與第一預(yù)測回復(fù)數(shù)據(jù)之間的差異和評估結(jié)果兩個(gè)方面調(diào)節(jié)目標(biāo)對話模型的模型參數(shù)，相較于僅結(jié)合預(yù)測回復(fù)數(shù)據(jù)和回復(fù)數(shù)據(jù)之間的差異調(diào)節(jié)模型參數(shù)的方式，可以使目標(biāo)對話模型生成的回復(fù)數(shù)據(jù)更加準(zhǔn)確，并使目標(biāo)對話模型生成的回復(fù)數(shù)據(jù)的話術(shù)質(zhì)量升高，能夠進(jìn)一步提高目標(biāo)對話模型生成的回復(fù)數(shù)據(jù)的準(zhǔn)確率。

技術(shù)特征：

1.一種對話模型的訓(xùn)練方法，其特征在于，所述方法包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述評估結(jié)果包括所述第一預(yù)測回復(fù)數(shù)據(jù)作為達(dá)標(biāo)話術(shù)的概率值；

3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述方法還包括：

4.根據(jù)權(quán)利要求3所述的方法，其特征在于，一個(gè)待評估回復(fù)對應(yīng)的預(yù)測評估結(jié)果包括所述待評估回復(fù)作為達(dá)標(biāo)話術(shù)的預(yù)測概率值；

5.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述獲取n個(gè)待評估回復(fù)，包括：

6.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述方法還包括：

7.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述確定所述對話訓(xùn)練數(shù)據(jù)對應(yīng)的對話模型，包括：

8.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述待訓(xùn)練的目標(biāo)對話模型屬于n個(gè)對話模型，所述待訓(xùn)練的目標(biāo)對話模型對應(yīng)的參數(shù)量大于n-1個(gè)對話模型對應(yīng)的參數(shù)量；

9.一種數(shù)據(jù)處理方法，其特征在于，所述方法包括：

10.一種對話模型的訓(xùn)練裝置，其特征在于，所述裝置包括：

11.一種數(shù)據(jù)處理裝置，其特征在于，所述裝置包括：

12.一種電子設(shè)備，其特征在于，所述電子設(shè)備包括：

13.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令或者計(jì)算機(jī)程序，其特征在于，所述計(jì)算機(jī)可執(zhí)行指令或者計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至8任一項(xiàng)所述的對話模型的訓(xùn)練方法，或?qū)崿F(xiàn)權(quán)利要求9所述的數(shù)據(jù)處理方法。

14.一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)可執(zhí)行指令或計(jì)算機(jī)程序，其特征在于，所述計(jì)算機(jī)可執(zhí)行指令或計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至8任一項(xiàng)所述的對話模型的訓(xùn)練方法，或?qū)崿F(xiàn)權(quán)利要求9所述的數(shù)據(jù)處理方法。

技術(shù)總結(jié)
本申請?zhí)峁┝艘环N對話模型的訓(xùn)練方法、數(shù)據(jù)處理方法及相關(guān)裝置，對話模型的訓(xùn)練方法包括：獲取目標(biāo)業(yè)務(wù)場景下的對話數(shù)據(jù)，目標(biāo)業(yè)務(wù)場景的出現(xiàn)頻次小于閾值，對話數(shù)據(jù)包括第一數(shù)據(jù)以及針對第一數(shù)據(jù)進(jìn)行回復(fù)的第一回復(fù)數(shù)據(jù)，待訓(xùn)練的目標(biāo)對話模型對第一數(shù)據(jù)進(jìn)行回復(fù)預(yù)測，得到第一預(yù)測回復(fù)數(shù)據(jù)，預(yù)訓(xùn)練的話術(shù)評估模型對第一預(yù)測回復(fù)數(shù)據(jù)進(jìn)行話術(shù)質(zhì)量評估，得到評估結(jié)果，獲取第一回復(fù)數(shù)據(jù)與第一預(yù)測回復(fù)數(shù)據(jù)之間的差異，并基于差異以及評估結(jié)果，更新目標(biāo)對話模型的模型參數(shù)。通過本申請，能夠提高目標(biāo)對話模型生成回復(fù)數(shù)據(jù)的準(zhǔn)確率。

技術(shù)研發(fā)人員：呂樂賓
受保護(hù)的技術(shù)使用者：馬上消費(fèi)金融股份有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/8/28

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：呂樂賓
技術(shù)所有人：馬上消費(fèi)金融股份有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！