語音識別和控制方法、裝置、系統、電子設備及存儲介質與流程

文檔序號：42326101發布日期：2025-07-01 19:44閱讀：15來源：國知局

本申請涉及一種語音識別和控制領域，特別涉及一種語音識別和控制方法、裝置、系統、電子設備及計算機可讀存儲介質。

背景技術：

1、隨著科學技術和城市建設的發展，語音識別技術逐步應用到人們生活的各個方面，例如在寫字樓、公寓、學校、商場等場所中，能夠基于語音進行控制的設備，例如基于語音控制的空氣處理設備等逐漸普及。

2、目前，在基于語音進行設備控制的現有技術中，基于用戶發出的語音生成控制指令，從而實現對設備的控制。例如，獲取用戶的語音數據，并對該語音數據進行識別，得到與設備的控制相對應的語音指令，然后基于該語音指令直接對設備執行相應的控制。

3、應該注意，上面對技術背景的介紹只是為了方便對本申請的技術方案進行清楚、完整的說明，并方便本領域技術人員的理解而闡述的。不能僅僅因為這些方案在本申請的背景技術部分進行了闡述而認為上述技術方案為本領域技術人員所公知。

技術實現思路

1、發明人發現，在上述現有技術中，在某些情況下，可能對用戶的語音數據進行了錯誤的識別，進而導致對空氣處理設備執行的控制指令也可能是錯誤的。例如，當用戶的普通話不標準，或者方言不標準，或者用戶有口音，或者用戶有獨特的發聲習慣或表述方式時，用戶的語音數據中的部分數據無法識別或無法被正確識別，此時，用戶的意圖可能無法被順利的執行，用戶想控制的設備也無法及時執行相應的動作；另外，用戶可能需要再次說出語音指令，或者用戶需要通過其他方式對設備進行操作，例如用戶需要再通過遙控器或線控器對空調進行操作，從而降低控制效率，影響用戶的使用體驗。

2、另外，在用戶的語音數據無法識別或無法被正確識別的情況下，如果直接根據識別結果執行相應的控制指令，可能會對設備進行錯誤地控制，從而進一步降低控制效率，影響用戶的使用體驗；

3、另外，在用戶的語音數據始終無法識別或者基于語音識別結果無法生成控制指令的情況下，用戶可能產生困擾，影響用戶的使用體驗。

4、為了解決上述問題中的一個或多個，本申請實施例提供一種語音識別和控制方法、裝置、系統、電子設備及計算機可讀存儲介質。

5、根據本申請實施例的第一方面，提供了一種語音識別和控制方法，所述方法包括：

6、獲取用戶的第一語音數據；對所述第一語音數據進行識別，當所述第一語音數據中存在第一模糊語音數據時，確定是否預先存儲有所述用戶的與所述第一模糊語音數據對應的第一替換數據；當存在所述第一替換數據時，根據所述第一替換數據以及所述第一語音數據生成第二語音數據；根據所述第二語音數據生成第一控制指令；向所述用戶語音播報所述第一控制指令的第一確認信息，并且當所述第一控制指令被確認正確時，執行與所述第一控制指令對應的操作。

7、根據本申請實施例的第二方面，提供了一種語音識別和控制系統，所述系統包括控制設備、語音交互設備以及至少一個被控設備；所述控制設備用于根據本申請實施例的第一方面所述的語音識別和控制方法對所述至少一個被控設備進行控制。

8、根據本申請實施例的第三方面，提供了一種語音識別和控制裝置，所述裝置包括：

9、獲取單元，其用于獲取用戶的第一語音數據；識別單元，其用于對所述第一語音數據進行識別；確定單元，其用于當所述第一語音數據中存在第一模糊語音數據時，確定是否預先存儲有所述用戶的與所述第一模糊語音數據對應的第一替換數據；語音生成單元，其用于當存在所述第一替換數據時，根據所述第一替換數據以及所述第一語音數據生成第二語音數據；控制指令生成單元，其用于根據所述第二語音數據生成第一控制指令；確認單元，其用于向所述用戶語音播報所述第一控制指令的第一確認信息；執行單元，其用于當所述第一控制指令被確認正確時，執行與所述第一控制指令對應的操作。

10、根據本申請實施例的第四方面，提供了一種電子設備，所述電子設備包括：存儲器，其存儲有計算機程序；以及處理器，其執行所述計算機程序時實現本申請實施例的第一方面所述的語音識別和控制方法。

11、根據本申請實施例的第五方面，提供了一種計算機可讀存儲介質，其上存儲有計算機程序，所述計算機程序被處理器執行時實現本申請實施例的第一方面所述的語音識別和控制方法。

12、本申請實施例的有益效果之一在于：在對用戶的語音數據進行識別時，在用戶的語音數據中存在無法識別的模糊語音數據，并且預先存儲有該用戶的與該模糊語音數據對應的替換數據的情況下，基于該替換數據生成替換后的語音數據。由此，能夠對用戶語音數據中的模糊語音數據進行個性化補全，提高語音識別的準確率；同時能夠減少或避免用戶再次發出語音指令或需要再通過其他方式對設備進行控制，提高用戶的使用體驗和設備控制效率；

13、并且，基于替換后的語音數據生成控制指令，并向用戶語音播報確認信息，在用戶確認正確的情況下再執行該控制指令。由此，能夠避免執行錯誤的控制指令，提高控制效率，進一步提高用戶的使用體驗；

14、另外，由于向用戶語音播報確認信息，即，對用戶的語音控制進行反饋，因此用戶能夠意識到其意圖被積極的響應，從而能夠獲得用戶的理解和好感，進一步提高用戶體驗。

15、參照后文的說明和附圖，詳細公開了本申請的特定實施方式，指明了本申請的原理可以被采用的方式。應該理解，本申請的實施方式在范圍上并不因而受到限制。在所附權利要求的精神和條款的范圍內，本申請的實施方式包括許多改變、修改和等同。

16、針對一種實施方式描述以及示出的特征信息可以以相同或類似的方式在一個或更多個其它實施方式中使用，與其它實施方式中的特征信息相組合，或替代其它實施方式中的特征信息。

17、應該強調，術語“包括/包含”在本文使用時指特征信息、整件、步驟或組件的存在，但并不排除一個或更多個其它特征信息、整件、步驟或組件的存在或附加。

技術特征：

1.一種語音識別和控制方法，其特征在于，所述方法包括：

2.根據權利要求1所述的方法，其特征在于，

3.根據權利要求1所述的方法，其特征在于，確定是否預先存儲有所述用戶的與所述第一模糊語音數據對應的第一替換數據，包括：

4.根據權利要求3所述的方法，其特征在于，

5.根據權利要求3所述的方法，其特征在于，當在數據庫中不存在與所述用戶的識別信息對應的模糊語音數據集，或者與所述用戶的識別信息對應的模糊語音數據集中不存在所述第一模糊語音數據時，確定不存在與所述第一模糊語音數據對應的所述第一替換數據。

6.根據權利要求1或5所述的方法，其特征在于，所述方法還包括：

7.根據權利要求6所述的方法，其特征在于，所述方法還包括：

8.根據權利要求7所述的方法，其特征在于，所述方法還包括：

9.根據權利要求1所述的方法，其特征在于，所述方法還包括：

10.根據權利要求1所述的方法，其特征在于，所述方法還包括：

11.一種語音識別和控制系統，其特征在于，所述系統包括控制設備、語音交互設備以及至少一個被控設備；

12.根據權利要求11所述的系統，其特征在于，

13.根據權利要求12所述的系統，其特征在于，

14.根據權利要求11所述的系統，其特征在于，

15.一種語音識別和控制裝置，其特征在于，所述裝置包括：

16.一種電子設備，其特征在于，所述電子設備包括：

17.一種計算機可讀存儲介質，其上存儲有計算機程序，其特征在于，所述計算機程序被處理器執行時實現權利要求1-10中的任一項所述的語音識別和控制方法。

技術總結
本申請提供一種語音識別和控制方法、裝置、系統、電子設備及存儲介質，該方法包括：獲取用戶的第一語音數據；對該第一語音數據進行識別，當該第一語音數據中存在第一模糊語音數據時，確定是否預先存儲有該用戶的與該第一模糊語音數據對應的第一替換數據；當存在該第一替換數據時，根據該第一替換數據以及該第一語音數據生成第二語音數據；根據該第二語音數據生成第一控制指令；向該用戶語音播報該第一控制指令的第一確認信息，并且當該第一控制指令被確認正確時，執行與該第一控制指令對應的操作。由此，針對用戶的語音數據中模糊的部分進行個性化補全，能夠提高語音識別的準確率以及語音控制效率，提高用戶體驗。

技術研發人員：陳浩,劉進雪,閆滿意,劉晨皓,陳志江
受保護的技術使用者：大金工業株式會社
技術研發日：
技術公布日：2025/6/30

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：陳浩,劉進雪,閆滿意,劉晨皓,陳志江
技術所有人：大金工業株式會社
我是此專利的發明人

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！