基于語音控制的任務執行方法及裝置與流程

文檔序號：42326893發布日期：2025-07-01 19:46閱讀：18來源：國知局

本技術涉及任務管理，具體而言，涉及一種基于語音控制的任務執行方法及裝置。

背景技術：

1、在現代工作和生活環境中，任務的快速切換執行與高效管理成為了提高生產力和用戶體驗的關鍵因素，無論是軟件應用中的功能模塊切換執行、設備操作中的流程轉移，還是日常生活中不同事務的快速切換執行，都需要一個既高效又直觀的交互方式，傳統的鍵盤、鼠標等物理輸入方式雖然可靠，但在某些場景下，如雙手忙碌、環境噪音大或需要即時響應的情況下，存在明顯的局限性，尤其在數值計算和仿真軟件這類專業應用領域，用戶通常需要頻繁切換不同的界面或模塊來完成一系列復雜任務，如數據分析、模型構建、結果可視化等，傳統的操作方式，如使用鼠標和鍵盤，雖然直觀，但在執行多步驟或精細操作時，效率較低，且在特定環境下(如嘈雜的實驗室或需要雙手操作的場景)使用不便，而使用物理輸入設備進行任務切換執行，尤其是在多任務并行或頻繁切換執行的場景下，操作繁瑣且耗時，降低了工作效率，在特定環境下，如工業現場等，物理設備的操控可能變得困難甚至危險，而現有技術未能提供足夠適應這些環境的控制手段，除此之外，當前的任務切換執行機制缺乏有效的身份驗證和權限控制，任意用戶可能因誤操作或惡意行為而導致任務執行混亂，并且，現有技術中，任務切換執行的交互方式單一，缺乏智能化的反饋和操作指導，用戶可能需要多次嘗試才能成功切換執行任務，降低了交互的順暢性和滿意度。

2、針對上述的問題，目前尚未提出有效的解決方案。

技術實現思路

1、本技術實施例提供了一種基于語音控制的任務執行方法及裝置，以至少解決對于任務執行的控制過程中用戶操作復雜、安全性低以及任務沖突處理效率低的技術問題。

2、根據本技術實施例的一個方面，提供了一種基于語音控制的任務執行方法，包括：接收目標對象輸入的語音控制指令；利用預訓練的語音識別模型對語音控制指令進行分析，得到目標文本指令；利用預訓練的聲紋識別模型對語音控制指令進行分析，得到目標對象的目標身份信息，并確定目標身份信息對應的目標控制權限；從預設的指令庫中確定與目標控制權限和目標文本指令相匹配的目標操作指令，其中，指令庫中存儲有多個操作指令及對應的控制權限，操作指令中至少包括待執行的任務；檢測當前任務執行狀態，依據當前任務執行狀態和目標操作指令確定目標操作策略；執行目標操作策略，并展示任務執行界面。

3、可選地，接收目標對象輸入的語音控制指令，包括：接收目標對象通過語音輸入設備輸入的語音控制信號；對語音控制信號進行降噪處理，得到語音控制指令，其中，降噪處理包括以下至少之一：動態噪聲抑制、回聲消除。

4、可選地，利用預訓練的語音識別模型對語音控制指令進行分析，得到目標文本指令，包括：利用語音識別模型提取語音控制指令對應的梅爾頻率倒譜系數特征向量，并對梅爾頻率倒譜系數特征向量進行分析，得到初始文本指令；利用遷移學習技術對初始文本指令進行上下文糾錯，得到目標文本指令。

5、可選地，利用預訓練的聲紋識別模型對語音控制指令進行分析，得到目標對象的目標身份信息，并確定目標身份信息對應的目標控制權限，包括：利用聲紋識別模型提取語音控制指令對應的目標聲紋特征向量；從預設的聲紋庫中確定與目標聲紋特征向量對應的目標身份信息，其中，聲紋庫中存儲有多個聲紋特征向量與多個身份信息之間的映射關系；從預設的權限表中確定與目標身份信息對應的目標控制權限，其中，權限表中存儲有多個身份信息對應的控制權限。

6、可選地，從預設的指令庫中確定與目標控制權限和目標文本指令相匹配的目標操作指令，包括：分別確定目標文本指令與指令庫中的各個操作指令之間的文本相似度；在最大文本相似度不小于預設相似度閾值、且目標控制權限不低于最大文本相似度對應的操作指令的控制權限的情況下，確定最大文本相似度對應的操作指令為目標操作指令。

7、可選地，方法還包括：在最大文本相似度小于預設相似度閾值的情況下，生成第一提示信息，其中，第一提示信息用于提示語音控制指令不明確需重新輸入；在最大文本相似度不小于預設相似度閾值、但目標控制權限低于最大文本相似度對應的操作指令的控制權限的情況下，生成第二提示信息，其中，第二提示信息用于提示控制權限不足。

8、可選地，檢測當前任務執行狀態，并依據當前任務執行狀態和目標操作指令確定目標操作策略，包括：檢測當前任務執行狀態，并確定目標操作指令指示的待執行的第一任務；在當前未執行任務的情況下，確定目標操作策略為直接執行第一任務；在當前正在執行第二任務的情況下，確定第二任務與第一任務之間的任務關系，并依據任務關系確定目標操作策略，其中，任務關系至少用于反映第二任務與第一任務之間是否存在沖突。

9、可選地，依據任務關系確定目標操作策略，包括：在第二任務與第一任務之間存在沖突的情況下，確定目標操作策略包括：向目標對象發送問詢信息，并依據目標對象反饋的選擇指令確定繼續執行第二任務或停止執行第二任務并開始執行第一任務，其中，問詢信息用于提示第二任務與第一任務之間存在沖突，需要擇一執行；在第二任務與第一任務之間不存在沖突的情況下，確定目標操作策略包括：將第二任務切換至后臺運行，開始執行第一任務并展示第一任務對應的任務執行界面。

10、可選地，方法還包括：在第二任務與第一任務之間不存在沖突且存在關聯關系的情況下，確定目標操作策略包括：同時執行第二任務和第一任務，并將第二任務與第一任務的任務執行界面按照預設比例進行展示。

11、根據本技術實施例的另一方面，還提供了一種基于語音控制的任務執行裝置，包括：接收模塊，用于接收目標對象輸入的語音控制指令；第一分析模塊，用于利用預訓練的語音識別模型對語音控制指令進行分析，得到目標文本指令；第二分析模塊，用于利用預訓練的聲紋識別模型對語音控制指令進行分析，得到目標對象的目標身份信息，并確定目標身份信息對應的目標控制權限；指令確定模塊，用于從預設的指令庫中確定與目標控制權限和目標文本指令相匹配的目標操作指令，其中，指令庫中存儲有多個操作指令及對應的控制權限，操作指令中至少包括待執行的任務；策略確定模塊，用于檢測當前任務執行狀態，并依據當前任務執行狀態和目標操作指令確定目標操作策略；執行模塊，用于執行目標操作策略，并展示任務執行界面。

12、根據本技術實施例的另一方面，還提供了一種計算機程序產品，該計算機程序產品包括：計算機程序，其中，計算機程序被處理器執行時實現上述的基于語音控制的任務執行方法。

13、根據本技術實施例的另一方面，還提供了一種電子設備，該電子設備包括：存儲器和處理器，其中，存儲器中存儲有計算機程序，處理器被配置為通過計算機程序執行上述的基于語音控制的任務執行方法。

14、在本技術實施例中，通過融合語音識別技術和聲紋識別技術，本發明實現了精準、快捷的任務控制和用戶身份驗證，用戶均能通過自然語言指令啟動、調節或終止任務，同時確保只有被授權的個體才能執行控制，利用聲紋識別驗證用戶身份后，智能分析并確定用戶對應的操作權限，確保了在任何任務執行場景中，參與者只能根據其權限執行相應的操作，本方法預設了包含豐富任務指令的指令庫，涵蓋了從基礎命令到復雜操作的全面內容，并與用戶權限相掛鉤，當接收到語音指令時，能夠迅速匹配到相應的任務指令，實現了從語音到任務操作的無縫轉換，不僅能夠識別并解析語音指令，還能夠實時監測當前任務的執行狀態，根據任務狀態和用戶指令智能制定后續的操作策略，這一特性允許系統靈活應變，避免了任務執行過程中的沖突和中斷，確保了任務的連貫性和高效率執行，進而解決了對于任務執行的控制過程中用戶操作復雜、安全性低以及任務沖突處理效率低的技術問題。

完整全部詳細技術資料下載

當前第1頁1 2

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：全首至,廖光熠,歐陽曉臻
技術所有人：北太振寰（重慶）科技有限公司
我是此專利的發明人

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！