本發明涉及基于人工智能的在線面試,特別涉及一種用于提升智能面試評測準確率的方法及裝置。
背景技術:
1、隨著人才市場的活躍程度不斷增加,視頻面試的局限性開始不斷暴露,沒有解決hr在傳統意義上需要花費大量時間進行批量的人才初篩工作。得益于ai技術的不斷發展,以“ai+視頻面試”進行人才初篩甄選的方式應運而生,并逐漸成為市場主流。大量的雇主開始采用智能面試的方式,打造面試機器人,預設面試問題對候選人的面試視頻進行人才測評判斷。
2、然而,ai技術在進行人才測評上仍存在一系列的問題。大模型的幻覺問題依然比較嚴重,如果直接使用大模型等判分系統對候選人的回答進行評分,對于相同的回答經多次調用所產出的評分結果會有比較大的差異,每次的結果會不一致,比如候選人的分值可能在5分、6分、7分之間波動。這個分值的波動會帶來一系列后續問題,比如候選人a的真實得分是5分,但是大模型波動至7分;候選人b的真實得分是7分,但是大模型波動至5分。在真實的招聘場景中就會因此而錯誤地招聘了候選人a而非候選人b。
3、一般對上述現象有以下幾種優化方式:一是使用少樣本學習方式,即增加示例讓大模型能更為理解人類意圖。二是多次調用取平均值,以降低大模型出錯的概率。這幾種傳統優化方式都是將大模型等判分系統當做黑盒在處理,只能在一定程度上降低判分系統出錯的概率,實際上技術人員并不了解大模型等判分系統在哪種情況下更容易出錯,因此很難針對性地進行優化。
技術實現思路
1、鑒于現有技術中的上述缺陷或不足,本發明提供了一種用于提升智能面試評測準確率的方法及裝置,在人才測評場景下通過先驗知識和基礎假設去預測大模型等判分系統在各種情況下出錯的概率,從而提升整體的正確率。
2、本發明的一個方面,提供了一種用于提升智能面試評測準確率的方法,包括如下步驟:獲取候選人的面試會話數據,所述面試會話數據包括每個考察維度下的面試問題和候選人對每個問題的作答;比較候選人對面試問題的作答和該問題對應的多個典型回答,得到候選人的作答與每個典型回答的對比結果和每個典型回答對應的能力評分,所述對比結果的值域為0或1;基于候選人的作答與每個典型回答的對比結果和每個典型回答對應的能力評分,估計候選人在每個考察維度下的原始能力評分;基于候選人在每個考察維度下的原始能力評分,計算候選人在常模人群中的排名;將所述排名轉換為候選人在每個考察維度下的標準能力評分。
3、本發明的另一方面,還提供了一種用于提升智能面試評測準確率的裝置,包括:數據獲取模塊,被配置為獲取候選人的面試會話數據,所述面試會話數據包括每個考察維度下的面試問題和候選人對每個問題的作答;比較模塊,被配置為比較候選人對面試問題的作答和該問題對應的多個典型回答,得到候選人的作答與每個典型回答的對比結果和每個典型回答對應的能力評分,所述對比結果的值域為0或1;估計模塊,被配置為基于候選人的作答與每個典型回答的對比結果和每個典型回答對應的能力評分,估計候選人在每個考察維度下的原始能力評分;排名計算模塊,被配置為基于候選人在每個考察維度下的原始能力評分,計算候選人在常模人群中的排名;評分模塊,被配置為將所述排名轉換為候選人在每個考察維度下的標準能力評分。
4、本發明提供的一種用于提升智能面試評測準確率的方法及裝置,在人才測評場景下通過先驗知識和基礎假設去預測大模型等判分系統在各種情況下出錯的概率,從而明確判分系統在哪種情況下更容易出錯,以便有針對性的進行優化,最終提升了智能面試評測的整體正確率。
1.一種用于提升智能面試評測準確率的方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的一種用于提升智能面試評測準確率的方法,其特征在于,所述基于候選人的作答與每個典型回答的對比結果和每個典型回答對應的能力評分,估計候選人在每個考察維度下的原始能力評分的步驟,包括:
3.根據權利要求2所述的一種用于提升智能面試評測準確率的方法,其特征在于,所述迭代優化算法包括:
4.根據權利要求1所述的一種用于提升智能面試評測準確率的方法,其特征在于,所述基于候選人在每個考察維度下的原始能力評分,計算候選人在常模人群中的排名的步驟,包括:
5.根據權利要求1所述的一種用于提升智能面試評測準確率的方法,其特征在于,將所述排名轉換為候選人在每個考察維度下的標準能力評分的步驟,包括:
6.一種用于提升智能面試評測準確率的裝置,其特征在于,包括:
7.根據權利要求6所述的一種用于提升智能面試評測準確率的裝置,其特征在于,所述估計模塊被進一步配置為:
8.根據權利要求7所述的一種用于提升智能面試評測準確率的裝置,其特征在于,所述估計模塊被進一步配置為:
9.根據權利要求6所述的一種用于提升智能面試評測準確率的裝置,其特征在于,所述排名計算模塊被進一步配置為:
10.根據權利要求6所述的一種用于提升智能面試評測準確率的裝置,其特征在于,所述評分模塊被進一步配置為:將候選人在常模人群中的排名按照正態分布轉換為標準能力評分。