国产精品无码一区二区三级,免费无码又爽又刺激网站,女人18一级毛片免费观看,久青草国产在线观看,91网在线,大桥未久亚洲一区二区,国产午睡沙发系列大全,免费无码又爽又刺激高潮的视频免费

      對話模型的訓(xùn)練方法、數(shù)據(jù)處理方法及相關(guān)裝置與流程

      文檔序號(hào):42882037發(fā)布日期:2025-08-29 19:26閱讀:2來源:國知局

      本申請涉及數(shù)據(jù)處理,尤其涉及一種對話模型的訓(xùn)練方法、數(shù)據(jù)處理方法及相關(guān)裝置。


      背景技術(shù):

      1、對話模型可以用于與用戶進(jìn)行對話,還能夠解答用戶想問咨詢的問題。針對目標(biāo)業(yè)務(wù)場景,由于目標(biāo)業(yè)務(wù)場景僅在目標(biāo)時(shí)間段內(nèi)有效,目標(biāo)業(yè)務(wù)場景對應(yīng)的對話數(shù)據(jù)較少,目標(biāo)業(yè)務(wù)場景對應(yīng)的對話數(shù)據(jù)的話術(shù)質(zhì)量較低,對話數(shù)據(jù)包括的回復(fù)數(shù)據(jù)的準(zhǔn)確率較低,從而會(huì)導(dǎo)致對話模型生成回復(fù)數(shù)據(jù)的準(zhǔn)確率較低。


      技術(shù)實(shí)現(xiàn)思路

      1、本申請實(shí)施例提供一種對話模型的對話模型的訓(xùn)練方法、數(shù)據(jù)處理方法及相關(guān)裝置,能夠提高目標(biāo)對話模型生成回復(fù)數(shù)據(jù)的準(zhǔn)確率。

      2、本申請實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的:

      3、本申請實(shí)施例提供一種對話模型的訓(xùn)練方法,所述方法包括:

      4、獲取目標(biāo)業(yè)務(wù)場景下的對話數(shù)據(jù),所述目標(biāo)業(yè)務(wù)場景的出現(xiàn)頻次小于閾值,所述對話數(shù)據(jù)包括第一數(shù)據(jù)以及針對所述第一數(shù)據(jù)進(jìn)行回復(fù)的第一回復(fù)數(shù)據(jù);

      5、待訓(xùn)練的目標(biāo)對話模型對所述第一數(shù)據(jù)進(jìn)行回復(fù)預(yù)測,得到第一預(yù)測回復(fù)數(shù)據(jù);

      6、預(yù)訓(xùn)練的話術(shù)評估模型對所述第一預(yù)測回復(fù)數(shù)據(jù)進(jìn)行話術(shù)質(zhì)量評估,得到評估結(jié)果;

      7、獲取所述第一回復(fù)數(shù)據(jù)與所述第一預(yù)測回復(fù)數(shù)據(jù)之間的差異,并基于所述差異以及所述評估結(jié)果,更新所述目標(biāo)對話模型的模型參數(shù)。

      8、本申請實(shí)施例提供一種數(shù)據(jù)處理方法,所述方法包括:

      9、獲取目標(biāo)業(yè)務(wù)場景下的待回復(fù)數(shù)據(jù),所述目標(biāo)業(yè)務(wù)場景的出現(xiàn)頻次小于閾值;

      10、目標(biāo)對話模型對所述待回復(fù)數(shù)據(jù)進(jìn)行回復(fù)預(yù)測,得到預(yù)測回復(fù)數(shù)據(jù),所述目標(biāo)對話模型是基于第一回復(fù)數(shù)據(jù)與第一預(yù)測回復(fù)數(shù)據(jù)之間的差異以及評估結(jié)果訓(xùn)練得到的,所述第一預(yù)測回復(fù)數(shù)據(jù)是待訓(xùn)練的目標(biāo)對話模型對第一數(shù)據(jù)進(jìn)行回復(fù)預(yù)測得到的,所述評估結(jié)果是預(yù)訓(xùn)練的話術(shù)評估模型對所述第一預(yù)測回復(fù)數(shù)據(jù)進(jìn)行話術(shù)質(zhì)量評估得到的;所述第一數(shù)據(jù)和所述第一回復(fù)數(shù)據(jù)是包括在所述目標(biāo)業(yè)務(wù)場景下的對話數(shù)據(jù)中。

      11、本申請實(shí)施例提供一種對話模型的訓(xùn)練裝置,所述裝置包括:

      12、獲取模塊,用于獲取目標(biāo)業(yè)務(wù)場景下的對話數(shù)據(jù),所述目標(biāo)業(yè)務(wù)場景的出現(xiàn)頻次小于閾值,所述對話數(shù)據(jù)包括第一數(shù)據(jù)以及針對所述第一數(shù)據(jù)進(jìn)行回復(fù)的第一回復(fù)數(shù)據(jù);

      13、輸入模塊,用于待訓(xùn)練的目標(biāo)對話模型對所述第一數(shù)據(jù)進(jìn)行回復(fù)預(yù)測,得到第一預(yù)測回復(fù)數(shù)據(jù);

      14、所述輸入模塊,還用于預(yù)訓(xùn)練的話術(shù)評估模型對所述第一預(yù)測回復(fù)數(shù)據(jù)進(jìn)行話術(shù)質(zhì)量評估,得到評估結(jié)果;

      15、更新模塊,用于獲取所述第一回復(fù)數(shù)據(jù)與所述第一預(yù)測回復(fù)數(shù)據(jù)之間的差異,并基于所述差異以及所述評估結(jié)果,更新所述目標(biāo)對話模型的模型參數(shù)。

      16、本申請實(shí)施例提供一種數(shù)據(jù)處理裝置,所述裝置包括:

      17、獲取模塊,用于獲取目標(biāo)業(yè)務(wù)場景下的待回復(fù)數(shù)據(jù),所述目標(biāo)業(yè)務(wù)場景的出現(xiàn)頻次小于閾值;

      18、預(yù)測模塊,用于目標(biāo)對話模型對所述待回復(fù)數(shù)據(jù)進(jìn)行回復(fù)預(yù)測,得到預(yù)測回復(fù)數(shù)據(jù),所述目標(biāo)對話模型是基于第一回復(fù)數(shù)據(jù)與第一預(yù)測回復(fù)數(shù)據(jù)之間的差異以及評估結(jié)果訓(xùn)練得到的,所述第一預(yù)測回復(fù)數(shù)據(jù)是待訓(xùn)練的目標(biāo)對話模型對第一數(shù)據(jù)進(jìn)行回復(fù)預(yù)測得到的,所述評估結(jié)果是預(yù)訓(xùn)練的話術(shù)評估模型對所述第一預(yù)測回復(fù)數(shù)據(jù)進(jìn)行話術(shù)質(zhì)量評估得到的;所述第一數(shù)據(jù)和所述第一回復(fù)數(shù)據(jù)是包括在所述目標(biāo)業(yè)務(wù)場景下的對話數(shù)據(jù)中。

      19、本申請實(shí)施例提供一種電子設(shè)備,所述電子設(shè)備包括:

      20、存儲(chǔ)器,用于存儲(chǔ)計(jì)算機(jī)可執(zhí)行指令;

      21、處理器,用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的計(jì)算機(jī)可執(zhí)行指令時(shí),實(shí)現(xiàn)本申請實(shí)施例提供的對話模型的訓(xùn)練方法,或?qū)崿F(xiàn)本申請實(shí)施例提供的數(shù)據(jù)處理方法。

      22、本申請實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)程序或計(jì)算機(jī)可執(zhí)行指令,用于被處理器執(zhí)行時(shí)實(shí)現(xiàn)本申請實(shí)施例提供的對話模型的訓(xùn)練方法,或?qū)崿F(xiàn)本申請實(shí)施例提供的數(shù)據(jù)處理方法。

      23、本申請實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序或計(jì)算機(jī)可執(zhí)行指令,所述計(jì)算機(jī)程序或計(jì)算機(jī)可執(zhí)行指令被處理器執(zhí)行時(shí),實(shí)現(xiàn)本申請實(shí)施例提供的對話模型的訓(xùn)練方法,或?qū)崿F(xiàn)本申請實(shí)施例提供的數(shù)據(jù)處理方法。

      24、本申請實(shí)施例能夠?qū)Υ?xùn)練的目標(biāo)對話模型輸出的第一回復(fù)數(shù)據(jù)的話術(shù)質(zhì)量進(jìn)行評估,并將評估結(jié)果作為調(diào)節(jié)模型參數(shù)的依據(jù),也就是說,本申請實(shí)施例結(jié)合了第一回復(fù)數(shù)據(jù)與第一預(yù)測回復(fù)數(shù)據(jù)之間的差異和評估結(jié)果兩個(gè)方面調(diào)節(jié)目標(biāo)對話模型的模型參數(shù),相較于僅結(jié)合預(yù)測回復(fù)數(shù)據(jù)和回復(fù)數(shù)據(jù)之間的差異調(diào)節(jié)模型參數(shù)的方式,可以使目標(biāo)對話模型生成的回復(fù)數(shù)據(jù)更加準(zhǔn)確,并使目標(biāo)對話模型生成的回復(fù)數(shù)據(jù)的話術(shù)質(zhì)量升高,能夠進(jìn)一步提高目標(biāo)對話模型生成的回復(fù)數(shù)據(jù)的準(zhǔn)確率。



      技術(shù)特征:

      1.一種對話模型的訓(xùn)練方法,其特征在于,所述方法包括:

      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述評估結(jié)果包括所述第一預(yù)測回復(fù)數(shù)據(jù)作為達(dá)標(biāo)話術(shù)的概率值;

      3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:

      4.根據(jù)權(quán)利要求3所述的方法,其特征在于,一個(gè)待評估回復(fù)對應(yīng)的預(yù)測評估結(jié)果包括所述待評估回復(fù)作為達(dá)標(biāo)話術(shù)的預(yù)測概率值;

      5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述獲取n個(gè)待評估回復(fù),包括:

      6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述方法還包括:

      7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述確定所述對話訓(xùn)練數(shù)據(jù)對應(yīng)的對話模型,包括:

      8.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述待訓(xùn)練的目標(biāo)對話模型屬于n個(gè)對話模型,所述待訓(xùn)練的目標(biāo)對話模型對應(yīng)的參數(shù)量大于n-1個(gè)對話模型對應(yīng)的參數(shù)量;

      9.一種數(shù)據(jù)處理方法,其特征在于,所述方法包括:

      10.一種對話模型的訓(xùn)練裝置,其特征在于,所述裝置包括:

      11.一種數(shù)據(jù)處理裝置,其特征在于,所述裝置包括:

      12.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:

      13.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令或者計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)可執(zhí)行指令或者計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至8任一項(xiàng)所述的對話模型的訓(xùn)練方法,或?qū)崿F(xiàn)權(quán)利要求9所述的數(shù)據(jù)處理方法。

      14.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)可執(zhí)行指令或計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)可執(zhí)行指令或計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至8任一項(xiàng)所述的對話模型的訓(xùn)練方法,或?qū)崿F(xiàn)權(quán)利要求9所述的數(shù)據(jù)處理方法。


      技術(shù)總結(jié)
      本申請?zhí)峁┝艘环N對話模型的訓(xùn)練方法、數(shù)據(jù)處理方法及相關(guān)裝置,對話模型的訓(xùn)練方法包括:獲取目標(biāo)業(yè)務(wù)場景下的對話數(shù)據(jù),目標(biāo)業(yè)務(wù)場景的出現(xiàn)頻次小于閾值,對話數(shù)據(jù)包括第一數(shù)據(jù)以及針對第一數(shù)據(jù)進(jìn)行回復(fù)的第一回復(fù)數(shù)據(jù),待訓(xùn)練的目標(biāo)對話模型對第一數(shù)據(jù)進(jìn)行回復(fù)預(yù)測,得到第一預(yù)測回復(fù)數(shù)據(jù),預(yù)訓(xùn)練的話術(shù)評估模型對第一預(yù)測回復(fù)數(shù)據(jù)進(jìn)行話術(shù)質(zhì)量評估,得到評估結(jié)果,獲取第一回復(fù)數(shù)據(jù)與第一預(yù)測回復(fù)數(shù)據(jù)之間的差異,并基于差異以及評估結(jié)果,更新目標(biāo)對話模型的模型參數(shù)。通過本申請,能夠提高目標(biāo)對話模型生成回復(fù)數(shù)據(jù)的準(zhǔn)確率。

      技術(shù)研發(fā)人員:呂樂賓
      受保護(hù)的技術(shù)使用者:馬上消費(fèi)金融股份有限公司
      技術(shù)研發(fā)日:
      技術(shù)公布日:2025/8/28
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
      1
      主站蜘蛛池模板: 在线毛片一区二区不卡视频| 中日韩字幕中文字幕一区| 久久国产精品第一区二区| 四虎影视国产884a精品亚洲| 兴文县| 亚洲av影片一区二区三区| 精选二区在线观看视频| 日韩人妻无码精品系列专区无遮| 国产精品无套粉嫩白浆在线| a欧美一级爱看视频| 国产在线一区二区视频免费观看| 激情亚洲的在线观看| 久久精品视频中文字幕无码| 马关县| 久久婷婷是五月综合色狠狠| 久久这里只有精品少妇| 国产天堂av手机在线| 国产目拍亚洲精品一区二区| 国产日产亚洲系列av| 一区二区三区婷婷中文字幕| 长治县| 97人妻蜜臀中文字幕| 高密市| 三明市| 偏关县| 超清无码AV丝袜片在线观看| 新闻| 亚洲乱在线播放| 青青草免费在线播放视频五月天 | 91日本人妻在线口爆吞精| 国产视频在线一区二区三区四区| 元氏县| 亚洲精品一区二区三区av| 婷婷色在线视频中文字幕| 亚洲精品国产综合久久一线| 国产精品亚洲综合一区| 国产又粗又猛又黄色呦呦| 亚洲av成人在线网站| 久久婷婷是五月综合色| 国产91一区二这在线播放| 亚洲99一区二区三区|