本發明屬于人工智能,更具體的說是涉及一種工業場景中大模型提示詞設計方法、系統、設備及介質。
背景技術:
1、在工業4.0浪潮的推動下,大模型憑借其強大的語言理解和生成能力,在工業領域的多個關鍵場景中展現出巨大的應用潛力,特別是在工藝優化和故障診斷等方面。工藝優化能夠借助大模型對海量生產數據進行分析,挖掘潛在的生產改進點,從而提升生產效率和產品質量;故障診斷則可利用大模型對設備運行數據的實時監測與分析,提前發現設備異常,降低停機時間和維修成本。然而,隨著大模型在這些場景中的應用日益廣泛,其背后的提示詞設計技術所暴露出的缺陷也愈發明顯,嚴重制約了大模型在工業場景中性能的充分發揮。
2、當前的提示詞設計技術主要依賴通用自然語言處理(nlp)技術,如tf-idf統計法提取提示詞。然而,工業領域專業性強,存在大量獨特本體與規范。例如航空航天材料標準asmebpvc規定了材料性能、檢測方法等關鍵信息,汽車制造iatf16949規范對質量管理體系、生產過程控制等有嚴格要求。這些專業知識和規范包含豐富語義信息,對準確理解工業任務需求至關重要。但現有技術缺乏對工業領域本體的深度語義解析能力,生成的提示詞難以精準映射專業任務需求。
3、由于工業生產任務具有流程動態性和數據異構性特點。柔性制造產線生產任務常根據市場需求和訂單情況頻繁切換,不同任務對提示詞需求不同;工業生產過程中還會產生plc日志、cad圖紙文本等異構數據,不同類型數據格式和語義結構各異。但傳統提示詞設計方法未建立任務特征與提示詞結構的映射模型,無法根據實時變化的生產任務和數據特點動態調整提示詞。面對復雜多變的工業生產環境,大模型性能大幅下降,難以滿足實時生產需求。
4、另外,現有提示詞設計方案多基于經驗驅動,呈碎片化特點,缺乏對任務目標、操作流程和輸出規范的分層建模。這導致提示詞無法準確引導大模型推理生成,操作流程易出現信息傳遞不暢和失誤,輸出指令存在歧義,大模型執行效率低下。
技術實現思路
1、針對以上問題,本發明的目的在于提供一種工業場景中大模型提示詞設計方法、系統、設備及介質,針對工業場景中復雜任務需求構建基于分層結構的提示詞設計與優化體系,提升了大模型在工業生產、質量檢測、設備運維等場景的任務處理性能。
2、本發明為實現上述目的,通過以下技術方案實現:
3、第一方面,本技術實施例提供一種工業場景中大模型提示詞設計方法,包括:
4、運用網絡爬蟲收集工業領域文本數據,通過去噪和分詞處理,并進行數據分類后,通過bert模型生成私有提示詞模板庫;
5、借助領域知識圖譜構建技術、tf-idf算法、專家系統進行任務總覽層設計,構建任務約束條件集合;
6、獲取工業場景任務,利用基于petri網的流程建模方法將工業場景任務分解為子任務,構建任務鏈并進行子任務的排序優化;
7、針對每個子任務,基于私有提示詞模板庫,采用卷積神經網絡架構設計提示詞模板,生成每個子任務的提示詞;
8、構建大模型的輸出格式約束規則,將每個子任務的提示詞輸入大模型中,并采用bleu評分機制和領域特定評估指標評估大模型輸出的質量;
9、運用文本聚類算法和詞嵌入技術對進行私有提示詞模板庫進行管理;通過情感分析算法和命名實體識別算法處理用戶反饋,構建多維度評估指標對私有提示詞模板庫進行性能評估,利用apriori算法分析日志記錄以實現提示詞管理與迭代優化。
10、在一個可選的實施方式中,所述運用網絡爬蟲收集工業領域文本數據,通過去噪和分詞處理,并進行數據分類后,通過bert模型生成私有提示詞模板庫,包括:
11、運用網絡爬蟲算法從工業技術文獻數據庫、行業設備廠商官網、工業論壇中抓取工業領域專業詞匯、行業標準規范、工廠私有知識資料,作為工業領域文本數據;
12、利用正則表達式去除工業領域文本數據中的噪聲數據,采用結巴分詞、nltk庫對工業領域文本數據進行分詞處理;
13、利用k-means聚類算法對分詞處理后的工業領域文本數據進行數據分類;
14、基于分類后的工業領域文本數據,采用基于transformer架構的bert模型提取出相應指令的意圖,采用bilstm-crf模型進行實體提取;
15、基于提取出的意圖和實體歸納出通用的提示詞模板,存儲到私有提示詞模板庫中。
16、在一個可選的實施方式中,所述借助領域知識圖譜構建技術、tf-idf算法、專家系統進行任務總覽層設計,構建任務約束條件集合,包括:
17、運用領域知識圖譜構建技術,從工業標準文檔、設備手冊中提取關鍵概念及其關系,構建知識網絡;
18、采用tf-idf算法對歷史工單、故障報告進行關鍵詞提取,確定任務的核心主題詞分布;
19、通過專家系統融合領域專家經驗,構建任務約束條件集合。
20、在一個可選的實施方式中,所述獲取工業場景任務,利用基于petri網的流程建模方法將工業場景任務分解為子任務,構建任務鏈并進行子任務的排序優化,包括:
21、獲取工業場景任務,采用基于?petri?網的流程建模方法,將工業場景任務分解為子任務網絡;
22、如果工業場景任務為設備預測性維護任務,通過?alpha?算法從歷史維護日志中挖掘出典型流程路徑,構建任務鏈;
23、為每個子任務定義輸入輸出接口規范,并應用馬爾可夫決策過程進行子任務排序優化,通過狀態轉移概率矩陣計算任務的最優執行路徑。
24、在一個可選的實施方式中,所述針對每個子任務,基于私有提示詞模板庫,采用卷積神經網絡架構設計提示詞模板,生成每個子任務的提示詞,包括:
25、針對每個特征提取子任務,基于私有提示詞模板庫,采用卷積神經網絡架構設計提示詞,并定義卷積核參數集合;
26、在提示詞中嵌入激活函數選擇指令,通過激活函數進行提示詞的非線性變換,生成子任務的提示詞;
27、針對每個模型訓練子任務,采用梯度下降優化算法優化模型參數,生成子任務的提示詞,并在提示詞中明確學習率調度策略。
28、在一個可選的實施方式中,所述運用文本聚類算法和詞嵌入技術對進行私有提示詞模板庫進行管理,包括:
29、運用dbscan?密度聚類算法對私有提示詞模板庫中的提示詞模板按領域、任務類型進行分類;
30、采用word2vec算法計算提示詞模板間的語義相似度,依據相似度結果對模板進行合并或拆分優化;
31、定期利用網絡爬蟲技術從行業論壇、技術文檔中抓取新的工業領域文本數據,經數據預處理后補充到私有提示詞模板庫中。
32、在一個可選的實施方式中,所述通過情感分析算法和命名實體識別算法處理用戶反饋,構建多維度評估指標對私有提示詞模板庫進行性能評估,利用apriori算法分析日志記錄以實現提示詞管理與迭代優化,包括:
33、利用基于?lstm?的情感分析模型判斷用戶反饋文本的情感傾向,將用戶反饋文本分為積極反饋文本、消極反饋文本、中性反饋文本;對于消極反饋文本,使用命名實體識別算法提取反饋中涉及的提示詞、任務場景信息,構建反饋問題集合,并針對反饋問題集中的問題對提示詞進行針對性調整;
34、構建多維度評估指標體系,基于提示詞和相應的大模型輸出,通過計算對應的準確率、召回率、f1?值,以評估提示詞的性能;對于生成式提示詞,采用困惑度評估提示詞性能;根據評估指標結果,識別出性能不佳的提示詞,并進行迭代改進;
35、記錄提示詞的使用時間、調用的任務場景、輸入參數、輸出結果,構建日志數據庫;利用關聯規則挖掘算法對日志數據進行分析,挖掘出提示詞組合與結果的關聯規則,以優化私有提示詞模板庫。
36、第二方面,本技術實施例還提供了一種工業場景中大模型提示詞設計系統,包括:
37、私有提示詞模板庫構建模塊,用于運用網絡爬蟲收集工業領域文本數據,通過去噪和分詞處理,并進行數據分類后,通過bert模型生成私有提示詞模板庫;
38、任務總覽層構建模塊,用于借助領域知識圖譜構建技術、tf-idf算法、專家系統進行任務總覽層設計,構建任務約束條件集合;
39、步驟拆解層構建模塊,用于獲取工業場景任務,利用基于petri網的流程建模方法將工業場景任務分解為子任務,構建任務鏈并進行子任務的排序優化;
40、指令細化層構建模塊,用于針對每個子任務,基于私有提示詞模板庫,采用卷積神經網絡架構設計提示詞模板,生成每個子任務的提示詞;
41、輸出規范層構建模塊,用于構建大模型的輸出格式約束規則,將每個子任務的提示詞輸入大模型中,并采用bleu評分機制和領域特定評估指標評估大模型輸出的質量;
42、提示詞管理與迭代優化模塊,用于運用文本聚類算法和詞嵌入技術對進行私有提示詞模板庫進行管理;通過情感分析算法和命名實體識別算法處理用戶反饋,構建多維度評估指標對私有提示詞模板庫進行性能評估,利用apriori算法分析日志記錄以實現提示詞管理與迭代優化。
43、第三方面,本技術實施例還提供了一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執行所述程序時實現如上文任一項所述工業場景中大模型提示詞設計方法的步驟。
44、第四方面,本技術實施例還提供了一種存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現如上文任一項所述工業場景中大模型提示詞設計方法的步驟。
45、從以上技術方案可以看出,本發明具有以下優點:
46、本技術提供的工業場景中大模型提示詞設計方法中,通過構建工業級提示詞工程體系解決通用提示詞在專業場景中的適配性難題,具體實現了分層結構化設計,通過任務總覽、步驟拆解、指令細化、輸出規范四層模板建立從宏觀目標到微觀操作的映射關系;基于元學習與強化學習技術實現提示詞參數的自動化調優與跨任務遷移;通過多源反饋數據即用戶交互日志、任務執行結果驅動模板庫持續進化,適應工業場景的復雜動態變化。
47、本技術通過網絡爬蟲采集工業技術文獻、設備手冊等垂直領域數據,經去噪、分詞和分類處理后,利用bert模型提取意圖和實體,生成貼合工業場景的私有提示詞模板庫。這一過程確保提示詞深度融合行業術語、標準規范和企業私有知識,顯著提升大模型在工業任務中的語義理解準確性和領域適配性。
48、本技術借助領域知識圖譜提取工業概念關系、tf-idf算法分析歷史工單關鍵詞、專家系統融合經驗,構建任務總覽層和約束條件集合。該方法將隱性領域知識顯性化,明確任務核心主題與執行邊界,使大模型在處理工業任務時能遵循標準化流程,減少因信息缺失或理解偏差導致的錯誤。
49、本技術采用petri網將復雜工業任務(如設備預測性維護)分解為子任務網絡,結合alpha算法挖掘歷史流程路徑、馬爾可夫決策過程優化子任務排序。這一機制實現了任務鏈的結構化拆分與動態優化,確保大模型按最優路徑執行任務,縮短處理周期,降低工業場景中的時間與資源成本。
50、本技術針對不同子任務(如特征提取、模型訓練),利用卷積神經網絡架構設計提示詞模板,嵌入激活函數選擇指令和優化算法參數(如梯度下降策略)。該設計使提示詞具備任務特異性,通過非線性變換和參數調優引導大模型生成符合工業需求的精準輸出,提升任務處理的專業性和結果可靠性。
51、本技術通過dbscan聚類和word2vec算法實現提示詞模板的分類與語義優化,結合情感分析、命名實體識別處理用戶反饋,利用apriori算法挖掘日志關聯規則。這一閉環機制可實時發現提示詞性能短板,針對性調整模板并補充行業新詞,確保提示詞庫隨工業場景需求動態進化,長期維持大模型輸出質量與用戶滿意度。