本公開涉及移動終端安全,尤其涉及一種應用程序授權協議解析方法、計算機裝置、介質、產品。
背景技術:
1、在現有的移動應用權限管理技術中,當應用向用戶申請權限(像相機、相冊、位置等權限)時,通常只是簡單提示權限類型,例如僅告知用戶“訪問相冊”,對于這些權限所關聯的用戶協議里的具體條款,缺乏有效展示與關聯,這些具體條款包含了諸如數據存儲的位置、數據共享給第三方的范圍以及數據保留的時長等關鍵信息。
2、同時,用戶協議本身存在條款冗長、專業術語復雜的問題,導致用戶難以快速理解其數據在被應用獲取后實際的使用范圍以及可能面臨的潛在風險,用戶只能手動點擊授權,卻無法在授權過程中清晰知曉相關權限背后的數據使用細節,這給用戶在保障個人數據安全和隱私方面帶來了極大的困擾。
技術實現思路
1、有鑒于此,本公開實施例提供了一種應用程序授權協議解析方法、計算機裝置、介質、產品,能夠解決現有技術中存在的應用申請權限時僅簡單提示權限類型,缺乏對關聯用戶協議具體條款的有效展示與關聯,且用戶協議條款冗長、術語復雜,導致用戶難以快速理解數據使用范圍和潛在風險,無法在授權時知曉數據使用細節,給個人數據安全和隱私保障帶來極大困擾等問題。
2、第一方面,本公開實施例提供了一種應用程序授權協議解析方法,包括:
3、實時捕捉應用發起的權限請求,識別所述權限請求對應的權限類型,并獲取所述權限類型的關聯用戶協議;
4、基于目標領域的多源文本信息構建預設法律文本,并采用所述預設法律文本訓練目標ai模型,將訓練好的目標ai模型作為目標領域微調模型;
5、將所述關聯用戶協議輸入所述目標領域微調模型,獲得所述關聯用戶協議中的命名實體、所涉及的法律條款、每條所述法律條款對應的預測風險等級;
6、根據所述關聯用戶協議中的命名實體、所涉及的法律條款、每條所述法律條款對應的預測風險等級生成協議解析信息;
7、將所述協議解析信息以多層展示體系向用戶展示。
8、可選地,所述基于目標領域的多源文本信息構建預設法律文本,包括:
9、構建基礎語料庫;所述基礎語料庫包括全球隱私政策、移動應用用戶協議、法院判例中關于數據濫用的司法解釋中的一種或多種;
10、對所述基礎語料庫中的法律術語進行動態掩碼,獲得第一文本集;
11、對所述第一文本集進行數據增強處理,將處理后的所述第一文本集作為預設法律文本。
12、可選地,所述目標ai模型的構建方法,包括:
13、確定預訓練語言模型,所述預訓練語言模型包括lawformer、multilegalpile或者千問ai大模型;
14、通過目標領域預設文本對所述預訓練語言模型進行訓練,將訓練好的所述預訓練語言模型作為底層共享編碼器;
15、在所述底層共享編碼器的頂部構建命名實體識別任務特異性頭部、基于注意力機制的分類任務特異性頭部、風險預測任務特異性頭部;
16、所述命名實體識別任務特異性頭部采用條件隨機場層,用于提取出關聯用戶協議中的命名實體;
17、所述分類任務特異性頭部用于輸出條款類別,
18、所述風險預測任務特異性頭部用于輸出對應條款的預測風險等級;
19、配置加權損失函數;
20、所述加權損失函數為:,其中,,α為識別命名實體的權重、β為條款分類的權重,γ為風險預測的權重,是命名實體損失值,是條款分類損失值;是風險預測損失值;
21、所述目標ai模型包括所述底層共享編碼器、所述命名實體識別任務特異性頭部、所述分類任務特異性頭部、所述風險預測任務特異性頭部以及所述損失函數。
22、可選地,所述關聯用戶協議中的命名實體的獲取方法,包括:
23、將所述關聯用戶協議輸入所述底層共享編碼器中,獲取關聯用戶協議的通用語義表示;
24、將所述通用語義表示輸入到所述命名實體識別任務特異性頭部中進行處理,識別出所述關聯用戶協議中的命名實體。
25、可選地,所述所涉及的法律條款的獲取方法,包括:
26、將所述關聯用戶協議輸入所述底層共享編碼器中,獲取關聯用戶協議的通用語義表示;
27、將所述通用語義表示輸入到基于注意力機制的分類任務特異性頭部中,獲得所涉及的法律條款。
28、可選地,所述每條所述法律條款對應的預測風險等級的獲取方法,包括:
29、將所述關聯用戶協議輸入所述底層共享編碼器中,獲取關聯用戶協議的通用語義表示;
30、獲取基于法律規定或行業標準制定的標準規則信息;
31、通過所述風險預測任務特異性頭部對所述標準規則信息、所述通用語義表示進行聯合訓練,并基于訓練結果對每條法律條款所涉及的風險進行預測,確定每條法律條款對應的預測風險等級。
32、可選地,所述多層展示體系包括摘要層、詳情層和原文層;
33、所述將所述協議解析信息以多層展示體系向用戶展示,包括:
34、根據所述協議解析信息,通過自然語言生成摘要,并將所述摘要在摘要層展示;所述摘要包括關鍵信息和風險等級信息,所述關鍵信息包括數據用途信息、共享對象信息、存儲位置信息中的一種或多種;
35、獲取所述權限請求與所涉及的法律條款的語義相似度,將所述語義相似度大于預設閾值的法律條款在詳情層按照預設可視化配置展示;
36、識別所述協議解析信息中的專業法律術語,并獲取所述專業法律術語的通俗解釋;
37、定位原文層中的所述專業法律術語,配置高亮并懸浮對應的所述通俗解釋;
38、獲取所述協議解析信息中與通用數據保護條例相沖突的協議條款,記為不合規條款;
39、定位原文層中的不合規條款,并配置警示標志。
40、可選地,在生成協議解析信息之前,還包括:
41、判斷獲得的每條所述法律條款對應的預測風險等級是否與預設風險規則庫一致,若不一致,以預設風險規則庫中的結果作為對應法律條款的預測風險等級;
42、所述預設風險規則庫存儲有若干條法律條款及其對應的預設風險等級。
43、第二方面,本公開實施例還提供了一種應用程序授權協議解析系統,包括:
44、監控模塊,用于實時捕捉應用發起的權限請求,識別所述權限請求對應的權限類型,并獲取所述權限類型的關聯用戶協議;
45、模型訓練模塊,用于基于目標領域的多源文本信息構建預設法律文本,并采用所述預設法律文本訓練目標ai模型,將訓練好的目標ai模型作為目標領域微調模型;
46、解析模塊,用于將所述關聯用戶協議輸入所述目標領域微調模型,獲得所述關聯用戶協議中的命名實體、所涉及的法律條款、每條所述法律條款對應的預測風險等級;
47、交互模塊,用于根據所述關聯用戶協議中的命名實體、所涉及的法律條款、每條所述法律條款對應的預測風險等級生成協議解析信息,并將所述協議解析信息以多層展示體系向用戶展示。
48、第三方面,本公開實施例還提供了一種計算機裝置,采用如下技術方案:
49、所述計算機裝置包括:
50、至少一個處理器;以及,
51、與所述至少一個處理器通信連接的存儲器;其中,
52、所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行以上任一所述的應用程序授權協議解析方法。
53、第四方面,本公開實施例還提供了一種計算機可讀存儲介質,該計算機可讀存儲介質存儲計算機指令,該計算機指令用于使計算機執行以上任一所述的應用程序授權協議解析方法。
54、第五方面,本公開實施例還提供了一種計算機程序產品,包括計算機程序/指令,該計算機程序/指令被處理器執行時實現以上任一項所述方法的步驟。
55、本技術公開的應用程序授權協議解析方法,包括:實時捕捉應用發起的權限請求,識別權限請求對應的權限類型,并獲取權限類型的關聯用戶協議;基于目標領域的多源文本信息構建預設法律文本,并采用預設法律文本訓練目標ai模型,將訓練好的目標ai模型作為目標領域微調模型,將關聯用戶協議輸入目標領域微調模型,獲得關聯用戶協議中的命名實體、所涉及的法律條款、每條法律條款對應的預測風險等級,根據關聯用戶協議中的命名實體、所涉及的法律條款、每條法律條款對應的預測風險等級生成協議解析信息,將協議解析信息以多層展示體系向用戶展示;通過實時捕捉權限請求和解析關聯用戶協議,能夠清楚地了解應用程序想要獲取的權限以及協議中涉及的法律條款和風險,從而做出更明智的授權決策,通過目標領域微調模型進行多任務執行,可以解決通用模型對法律術語誤判的問題,避免因術語理解錯誤導致的對協議條款的誤判,從而更精準地識別關聯用戶協議中的命名實體、所涉及的法律條款以及預測風險等級,大大提高協議解析的準確性,一次性完成多個任務無需像傳統方法那樣對每個任務分別進行推理,從而顯著縮短協議解析的時間,提高整體的解析效率,能夠快速為用戶提供協議解析結果;基于法律法規進行協議解析,能夠幫助應用開發者發現協議中可能存在的法律問題,促使其遵守相關法律法規,保障用戶的合法權益;多層展示體系的信息展示方式讓用戶能夠根據自己的需求獲取不同詳細程度的信息,提高信息獲取的效率和便捷性,從而提升用戶體驗,該方案有助于規范應用程序的授權行為,減少違規操作,促進應用市場的健康、有序發展。
56、上述說明僅是本公開技術方案的概述,為了能更清楚了解本公開的技術手段,而可依照說明書的內容予以實施,并且為讓本公開的上述和其他目的、特征和優點能夠更明顯易懂,以下特舉較佳實施例,并配合附圖,詳細說明如下。