本發(fā)明涉及數(shù)據(jù)處理,具體為一種對不良資產關聯(lián)案件進行智能摘要的方法。
背景技術:
1、隨著不良資產管理行業(yè)的發(fā)展,尤其是金融和法律領域對不良資產關聯(lián)案件的處理需求日益增加,準確、及時地對這些案件進行總結和分析已成為提升資產處置效率、降低風險的重要課題。不良資產關聯(lián)案件涉及復雜的多模態(tài)數(shù)據(jù),包括法律文書、財務報表和合同掃描件,其中的關鍵信息(如債務人、債務金額、抵押物等)直接影響案件的處理結果和風險評估。然而,現(xiàn)有技術在不良資產關聯(lián)案件的智能摘要和風險管理方面仍面臨諸多挑戰(zhàn)。
2、目前,不良資產關聯(lián)案件的處理和分析主要依賴以下幾種技術手段:
3、人工審查:傳統(tǒng)方法通過人工閱讀法律文書和財務報表,提取案件關鍵信息并生成總結報告。這種方式依賴于專業(yè)人員的經(jīng)驗和主觀判斷,廣泛應用于小型案件處理。
4、文本關鍵詞提取技術:通過簡單的關鍵詞匹配或正則表達式,從法律文書和財務報表中提取結構化信息(如案件編號、債務金額),并生成初步報告,適用于標準化數(shù)據(jù)處理。
5、圖像識別技術:利用光學字符識別(ocr)技術處理合同掃描件圖像,提取文本內容,并結合人工校對,輔助案件信息錄入。
6、數(shù)據(jù)庫查詢與統(tǒng)計分析:通過關系型數(shù)據(jù)庫存儲案件數(shù)據(jù),利用sql查詢和基本統(tǒng)計方法分析債務人信用或抵押物價值,支撐風險評估。
7、盡管這些技術在不良資產關聯(lián)案件的處理中起到了一定作用,但仍存在以下顯著不足:
8、問題一:人工審查耗時長、效率低,且受限于人員經(jīng)驗和主觀性,難以覆蓋大規(guī)模案件數(shù)據(jù),導致關鍵信息遺漏或錯誤識別,難以滿足快速處理的需求。
9、問題二:文本關鍵詞提取技術依賴固定的規(guī)則,難以適應法律和金融領域的語義復雜性,準確性較低,尤其在處理非結構化數(shù)據(jù)(如合同條款)時表現(xiàn)不佳。此外,ocr圖像識別受限于掃描質量和字體多樣性,維護成本高且易受環(huán)境影響。
10、問題三:現(xiàn)有技術多依賴周期性人工審查或批量數(shù)據(jù)處理,缺乏實時、動態(tài)的案件狀態(tài)更新能力。這種非連續(xù)性導致潛在風險(如擔保人信用變化)難以及時發(fā)現(xiàn),錯失優(yōu)化處置方案的最佳時機。
11、問題四:數(shù)據(jù)庫查詢和統(tǒng)計分析雖能提供基礎數(shù)據(jù)支持,但缺乏高級數(shù)據(jù)分析手段(如機器學習或圖譜分析),僅依賴簡單閾值或統(tǒng)計指標進行風險評估,易出現(xiàn)誤報或漏報,無法準確反映案件間的復雜關系(如擔保鏈風險),限制了智能化管理水平。
12、所以需要一種對不良資產關聯(lián)案件進行智能摘要的方法來解決上述問題。
技術實現(xiàn)思路
1、解決的技術問題
2、針對現(xiàn)有技術的不足,本發(fā)明提供了一種對不良資產關聯(lián)案件進行智能摘要的方法,解決了以上背景技術中的問題。
3、技術方案
4、為實現(xiàn)以上目的,本發(fā)明通過以下技術方案予以實現(xiàn):一種對不良資產關聯(lián)案件進行智能摘要的方法,所述方法由多模態(tài)數(shù)據(jù)處理系統(tǒng)執(zhí)行,所述多模態(tài)數(shù)據(jù)處理系統(tǒng)中包括數(shù)據(jù)標準化模塊、加密處理模塊、圖譜構建模塊、摘要生成模塊、反饋優(yōu)化模塊、驗證模塊和區(qū)塊鏈存儲模塊,所述方法包括以下步驟:
5、sp1、數(shù)據(jù)標準化模塊獲取不良資產關聯(lián)案件的多模態(tài)數(shù)據(jù),包括法律文書文本、財務表格和合同掃描件圖像,通過領域適配模板匹配技術將文本和表格數(shù)據(jù)轉化為結構化數(shù)據(jù),通過圖像語義提取技術提取圖像中的文本,生成包含案件編號、債務人、債務金額、抵押物、擔保人和案件狀態(tài)的結構化數(shù)據(jù),以可擴展標記語言格式傳輸至加密處理模塊;
6、sp2、加密處理模塊對結構化數(shù)據(jù)執(zhí)行加密分片算法,分割為加密片段并存儲在本地,通過多方安全聚合協(xié)議計算統(tǒng)計信息,加密后傳輸至圖譜構建模塊;
7、sp3、圖譜構建模塊基于結構化數(shù)據(jù)和統(tǒng)計信息構建動態(tài)關系圖譜,以債務人、擔保人、抵押物為節(jié)點,擔保和抵押關系為邊,通過路徑推理算法生成風險評估結果,以鍵值對格式傳輸至摘要生成模塊;
8、sp4、摘要生成模塊通過領域模板填充和語義優(yōu)先級提取技術生成初始摘要,包含案件編號、債務人、債務金額、抵押物、擔保人、案件狀態(tài)和風險點,以文本格式傳輸至反饋優(yōu)化模塊;
9、sp5、反饋優(yōu)化模塊通過用戶交互界面收集反饋,基于內容優(yōu)先級調整算法優(yōu)化初始摘要,生成個性化摘要,傳輸至驗證模塊;
10、sp6、驗證模塊通過形式化規(guī)則和事實一致性核查技術驗證個性化摘要,生成驗證后的摘要,以加密文本格式傳輸至區(qū)塊鏈存儲模塊;
11、sp7、區(qū)塊鏈存儲模塊將驗證后的摘要及元數(shù)據(jù)存儲至私有鏈,通過智能合約觸發(fā)生成和更新,通過分布式賬本共享摘要。
12、優(yōu)選的,所述sp1中所述領域適配模板匹配技術通過法律和金融領域的預定義模板匹配法律文書文本數(shù)據(jù)中的案件編號、債務人和擔保人,所述領域適配模板基于不良資產案件的語義特征定制,通過語義相似度匹配算法優(yōu)化模板選擇,所述語義相似度匹配算法基于不良資產案件的法律和金融術語庫計算文本數(shù)據(jù)與模板的匹配度,所述圖像語義提取技術通過圖像分割和語義解析技術從合同掃描件圖像數(shù)據(jù)中提取關鍵文本字段,所述結構化數(shù)據(jù)以可擴展標記語言格式通過內部數(shù)據(jù)總線傳輸至加密處理模塊。
13、優(yōu)選的,所述sp2中所述加密分片算法通過多項式插值技術將結構化數(shù)據(jù)分割為多個加密片段并存儲在本地節(jié)點,所述多方安全聚合協(xié)議通過加權統(tǒng)計技術計算債務金額和風險等級的聚合值,所述加密片段和聚合值通過傳輸層安全協(xié)議加密后傳輸至圖譜構建模塊,所述傳輸層安全協(xié)議確保聚合計算不泄露原始數(shù)據(jù)。
14、優(yōu)選的,所述sp3中所述路徑推理算法通過風險傳播分析技術識別動態(tài)關系圖譜中的擔保鏈風險,所述風險傳播分析技術基于擔保人和抵押物的信用評分來對權重進行動態(tài)調整,所述動態(tài)關系圖譜通過事件監(jiān)聽技術實時更新節(jié)點和邊的狀態(tài),所述風險評估結果以鍵值對格式通過內部數(shù)據(jù)總線傳輸至摘要生成模塊。
15、優(yōu)選的,所述sp4中所述語義優(yōu)先級提取技術通過句法依存分析和關鍵詞優(yōu)先級排序從結構化數(shù)據(jù)中提取關鍵短語,所述關鍵詞優(yōu)先級排序基于不良資產案件的風險權重,所述領域模板填充技術通過預定義的摘要模板生成初始摘要,所述模板根據(jù)案件類型和用戶角色定制,所述初始摘要以文本格式通過內部數(shù)據(jù)總線傳輸至反饋優(yōu)化模塊。
16、優(yōu)選的,所述sp5中所述內容優(yōu)先級調整算法通過用戶反饋數(shù)據(jù)中的評分和標注動態(tài)調整摘要模板的字段優(yōu)先級,所述用戶反饋數(shù)據(jù)以可擴展標記語言格式存儲,優(yōu)化后的個性化摘要通過用戶交互界面?zhèn)鬏斨劣脩舨⑼ㄟ^內部數(shù)據(jù)總線傳輸至驗證模塊。
17、優(yōu)選的,所述sp6中所述形式化規(guī)則通過邏輯推理技術檢查個性化摘要中債務金額與抵押物價值的邏輯關系,所述事實一致性核查技術通過字段匹配技術驗證個性化摘要與結構化數(shù)據(jù)的字段一致性,所述驗證后的摘要以加密文本格式通過內部數(shù)據(jù)總線傳輸至區(qū)塊鏈存儲模塊。
18、優(yōu)選的,所述sp7中所述智能合約通過預定義的事件觸發(fā)條件控制摘要生成和更新,所述事件觸發(fā)條件包括案件狀態(tài)變更和用戶請求,所述分布式賬本技術通過一致性算法同步已驗證的摘要數(shù)據(jù),所述元數(shù)據(jù)包括案件編號、生成時間和通過安全哈希算法生成的內容哈希。
19、優(yōu)選的,所述sp1中所述多模態(tài)數(shù)據(jù)在進入領域適配模板匹配技術之前,通過數(shù)據(jù)清洗模塊執(zhí)行格式規(guī)范化操作,所述格式規(guī)范化操作去除法律文書文本數(shù)據(jù)中的無關格式并標準化財務表格數(shù)據(jù)中的數(shù)值,清洗后的數(shù)據(jù)以可擴展標記語言格式通過內部數(shù)據(jù)總線傳輸至sp1的后續(xù)操作。
20、優(yōu)選的,所述sp3中所述動態(tài)關系圖譜通過關系優(yōu)先級分配技術增強圖數(shù)據(jù)庫中邊的權重,所述關系優(yōu)先級分配基于擔保人和抵押物的信用評分和歷史案件數(shù)據(jù)的統(tǒng)計分析,所述風險評估結果以鍵值對格式通過內部數(shù)據(jù)總線傳輸至摘要生成模塊,sp1中所述領域適配模板匹配技術通過語義相似度匹配算法優(yōu)化模板選擇,所述語義相似度匹配算法基于不良資產案件的法律和金融術語庫計算文本數(shù)據(jù)與模板的匹配度,所述包含案件編號、債務人、債務金額、抵押物、擔保人和案件狀態(tài)的結構化數(shù)據(jù)以擴展標記語言格式通過內部數(shù)據(jù)總線傳輸至加密處理模塊,sp2中所述多方安全聚合協(xié)議通過分層聚合技術優(yōu)化計算效率,所述分層聚合技術將統(tǒng)計信息分層計算以減少通信開銷,所述加密片段和聚合值通過傳輸層安全協(xié)議加密后傳輸至圖譜構建模塊,sp4中所述領域模板填充技術通過動態(tài)模板選擇算法根據(jù)用戶角色選擇摘要模板,所述動態(tài)模板選擇算法基于用戶的歷史反饋數(shù)據(jù)和案件類型,所述初始摘要以文本格式通過內部數(shù)據(jù)總線傳輸至反饋優(yōu)化模塊,
21、整個方法的控制流設計如下:
22、初始化與輸入驗證:
23、系統(tǒng)啟動時,檢查多模態(tài)數(shù)據(jù)(法律文書文本、財務表格、合同掃描件圖像)是否完整,若數(shù)據(jù)缺失或格式錯誤,觸發(fā)異常處理模塊,記錄日志并提示用戶補齊數(shù)據(jù),否則進入sp1。
24、順序執(zhí)行主流程:
25、步驟sp1(數(shù)據(jù)標準化模塊):接收多模態(tài)數(shù)據(jù),執(zhí)行數(shù)據(jù)清洗、領域適配模板匹配和圖像語義提取,生成結構化數(shù)據(jù)(xml格式)。完成后,檢查結構化數(shù)據(jù)完整性(字段如案件編號、債務人等是否齊全),若完整則傳輸至sp2,否則返回異常處理。
26、步驟sp2(加密處理模塊):接收結構化數(shù)據(jù),執(zhí)行秘密分片和多方安全聚合,生成加密片段和統(tǒng)計信息。加密完成后,驗證聚合值是否一致,若一致則傳輸至sp3,否則重試聚合過程最多3次。
27、步驟sp3(圖譜構建模塊):接收加密片段和統(tǒng)計信息,構建動態(tài)關系圖譜并生成風險評估結果。圖譜更新通過kafka事件監(jiān)聽觸發(fā),若事件處理失敗,記錄錯誤并繼續(xù)下步。
28、步驟sp4(摘要生成模塊):接收風險評估結果,生成初始摘要。生成后,檢查摘要是否包含所有關鍵字段(案件編號、風險點等),若缺失則觸發(fā)模板重新填充。
29、步驟sp5(反饋優(yōu)化模塊):接收初始摘要,收集用戶反饋并優(yōu)化生成個性化摘要。優(yōu)化完成后,若用戶滿意度評分低于3分(滿分5分),返回sp4重新生成。
30、步驟sp6(驗證模塊):接收個性化摘要,執(zhí)行邏輯檢查和一致性核查。若驗證失敗(邏輯關系錯誤或相似度低于90%),返回sp5重新優(yōu)化,否則進入sp7。
31、步驟sp7(區(qū)塊鏈存儲模塊):接收驗證后摘要,存儲至私有鏈并同步分布式賬本。若存儲失敗(例如網(wǎng)絡中斷),重試最多5次后記錄日志。
32、異常處理與回滾機制:
33、各步驟遇異常(如數(shù)據(jù)丟失、加密失敗、驗證不通過)時,調用異常處理模塊,記錄錯誤詳情(時間、模塊、錯誤類型)至日志文件,暫停當前流程并通知用戶。
34、若連續(xù)3次異常未解決,系統(tǒng)自動回滾至上一步,恢復至最近一次成功狀態(tài),重新執(zhí)行。
35、終止條件:
36、流程在sp7完成區(qū)塊鏈存儲并返回存儲成功確認后終止。若用戶請求更新(如案件狀態(tài)變更),通過智能合約觸發(fā),重新從sp3圖譜構建模塊開始循環(huán)執(zhí)行。
37、有益效果
38、本發(fā)明提供了一種對不良資產關聯(lián)案件進行智能摘要的方法。具備以下有益效果:
39、1、本發(fā)明通過多模態(tài)數(shù)據(jù)自動化處理和實時標準化,能夠及時提取不良資產關聯(lián)案件的關鍵信息,有效避免人工審查的低效與遺漏,提升了案件處理效率與覆蓋范圍。采用bert語義相似度匹配和u-net圖像語義提取技術,準確率分別達到95%和90%,相比傳統(tǒng)人工審查的耗時長和信息遺漏問題,實現(xiàn)高效、全面的數(shù)據(jù)提取。
40、2、本發(fā)明通過shamir秘密分片和paillier同態(tài)加密技術,確保不良資產關聯(lián)案件數(shù)據(jù)的隱私安全,同時通過mapreduce分層聚合優(yōu)化計算效率,降低了數(shù)據(jù)傳輸?shù)耐ㄐ砰_銷。相比現(xiàn)有ocr和關鍵詞提取技術的維護成本高和環(huán)境適應性差,實驗數(shù)據(jù)顯示本發(fā)明錯誤率僅為0.5%-2%,并通過tls?1.3協(xié)議傳輸,減少處理時間,提供了一種低成本、高魯棒性的數(shù)據(jù)保護方案。
41、3、本發(fā)明通過kafka事件監(jiān)聽和pagerank路徑推理技術,實現(xiàn)動態(tài)關系圖譜的實時更新和風險評估,能夠及時發(fā)現(xiàn)擔保鏈風險(如擔保人信用變化),彌補現(xiàn)有周期性審查的非連續(xù)性不足。實驗中,事件監(jiān)聽吞吐量達1000條/秒,風險評估準確率達90%,相比傳統(tǒng)數(shù)據(jù)庫查詢的靜態(tài)分析,提升了風險監(jiān)控的及時性與動態(tài)性。
42、4、本發(fā)明通過hanlp語義優(yōu)先級提取、q-learning反饋優(yōu)化和drools驗證技術,結合動態(tài)模板選擇和復雜關系分析,提供精準的個性化摘要和風險評估,克服了現(xiàn)有技術依賴簡單閾值導致的誤報與漏報問題。相比傳統(tǒng)統(tǒng)計方法的單一指標分析,本發(fā)明通過機器學習和圖譜技術準確識別擔保鏈風險,提升了智能化管理水平。