一種基于隨機森林的鈔票鑒偽方法
【專利摘要】本發明涉及鈔票防偽研究領域,具體涉及一種基于隨機森林的鈔票鑒偽方法,基于傳感器獲取的鈔票的多光譜圖像,利用嵌入式設備芯片進行處理,包括:由采集到的原始圖像及其梯度圖像截取特定區域進行特征提取,獲得分類所需的多個特征;創建單棵決策樹,從根節點開始節點拆分,直至到達葉子節點;建立多棵決策樹的隨機森林。通過上述方式,建立了可在嵌入式設備上實現的隨機森林分類器,能夠在使用如DSP芯片作為處理器的點鈔機上實現鈔票的鑒偽工作,提高了點鈔機中鈔票鑒偽的性能,能夠準確鑒別真鈔中混雜的假鈔并分類,而且計算速度快,能滿足設備的實時性要求??朔藗鹘y的鑒偽方法識別未知假幣和新幣種的能力較弱的缺陷。
【專利說明】
一種基于隨機森林的鈔票鑒偽方法
技術領域
[0001] 本發明屬于鈔票防偽研究領域,特別是涉及一種基于隨機森林的鈔票鑒偽方法。
【背景技術】
[0002] 點鈔機是一種自動清點鈔票數目和識別假幣的機電一體化裝置,在現金流通量較 大的辦公處,點鈔機已經成為不可或缺的設備。偽鈔識別是點鈔機至關重要的功能。紙幣上 有多種防偽信息,傳統的點鈔機利用磁性分布、紅外線穿透、紙張熒光反應等特征來鑒偽。 隨著印刷技術、復印技術和電子掃描技術的發展,偽鈔制造水平越來越高,點鈔機傳統的鑒 別技術已不能滿足。而利用多光譜圖像鑒偽,不但能提高性能跟鑒別能力,并能得到許多其 他鑒偽系統無法獲取的信息。
[0003] 多光譜圖像檢測技術對鈔票進行多個波段獨自全幅成像、采集,得到鈔票的紫外 圖像、白光圖像和紅外圖像,分析、記錄而實現鈔票的真偽鑒別。鈔票的多光譜圖像鑒偽技 術是鈔票防偽研究領域的熱門問題,它與國家的金融安全息息相關,具有重要的理論價值 和廣闊的應用前景。傳統的多光譜圖像鑒偽技術中,利用鈔票圖像的統計信息如像素直方 圖、均值、方差等進行鑒別的方法,應用傳統的"以假鑒真"技術,這種鑒偽方法容易受不同 點鈔機設備采圖環境的影響,鑒別結果受經驗值設定的限制,因此識別未知假幣和新幣種 的能力較弱?;跈C器學習的方法,通過較低級的分類器設計達到鈔票分類目的的方法,采 用"以真鑒假"的策略,在每臺點鈔機機器初次使用時都需要進行訓練以補償機器差異造成 的影響,這些方法也容易受不同幣種的不同光照、新舊、噪聲污染等因素的影響。
【發明內容】
[0004] 本發明的目的是提供一種鈔票鑒偽方法,以嵌入式數字信號處理器平臺為基礎, 實現了隨機森林算法在嵌入式設備上的應用,能實現"以真鑒真、借假鑒假",避免不同機器 的差異性造成的影響,該方法只需要進行一次訓練而無需對每臺新的設備都進行初始化, 能夠可靠地對紙幣進行分類,并穩定地檢測出傳統防偽技術無法識別的假幣、變造幣以及 不易流通的紙幣。
[0005] 為實現上述目的,本發明采用的技術方案是:一種基于隨機森林的鈔票鑒偽方法, 包括以下步驟:
[0006] SI.鈔票圖像的特征提取:
[0007] 采集鈔票的多光譜圖像,截取特定區域,采用SSIM方法,得到多個鑒偽指標,多個 鑒偽指標通過線性組合得到真假鈔分類所需的η個特征;
[0008] S2.樣本訓練:
[0009] 依據所提取的特征F1、F2、···、Fm和待鑒鈔票的訓練樣本,采用隨機森林方法進行 訓練;創建決策樹,對訓練樣本有放回地隨機抽樣得到N個樣本及其響應,真鈔為1,假鈔為 〇;
[0010] S3.節點拆分:
[0011] S31.從根節點開始節點拆分,拆分的終止條件為樹到達最大深度或節點樣本數到 達最小,若為根節點,重新計算正、負樣本的概率prior,與正、負樣本數加權,并歸一化,得 到新的pr i or,計算每個節點的va I ue,
[0012] (1):
[0013] (1)式中Pl為正樣本概率,PO為負樣本概率,N正為正樣本數,N負為負樣本數;
[0014] 隨機抽取M個不重復的特征并確定每個特征的最佳拆分閾值;具體包括以下步驟:
[0015] S311.對抽取到的每個特征,將訓練數據由小到大排序,從最左邊的數據起作為拆 分點,計算分裂質量,找出分裂質量最高的點并得到拆分閾值,由此選定具有最高分裂質量 的特征作為分裂特征;
[0016] S32.對所述選定的分裂特征,小于其拆分閾值的樣本歸入左節點,大于或等于其 拆分閾值的樣本歸入右節點,遞歸運算繼續進行節點拆分直至達到終止條件;
[0017] S4.誤差估計:
[0018] -棵樹訓練完成后進行oob誤差估計,將訓練樹時沒有被抽到的訓練樣本作為oob 樣本,放剎該樹中預涮分類,
[0019]
[0020] 若oob誤差率太大則丟棄當前樹,重新訓練一棵樹;
[0021] S5.鈔票鑒偽結果:
[0022] 所有樹訓練完成后,得到隨機森林,待鑒鈔票的測試樣本作為輸入,放到隨機森林 中預測分類得到分類結果,實現鈔票的鑒偽功能。
[0023] 進一步地,實現步驟Sl中采集鈔票的多光譜圖像,截取特定區域還包括以下步驟:
[0024] 通過點鈔機中的傳感器獲取鈔票的自然光圖像與紅外圖像,由sobel算子進行邊 緣檢測獲取兩幅圖像的梯度圖像,截取以上四幅圖像的特定鑒偽區域。
[0025] 進一步地,所述點鈔機中傳感器采用CMOS或CIS傳感器。
[0026] 進一步地,步驟Sl中所述SSIM為衡量兩幅圖像相似度的指標,其值越大相似度越 高,最大為1。
[0027] 進一步地,所述鈔票鑒偽方法利用嵌入式設備芯片進行處理,在嵌入式設備上建 立隨機森林分類器,實現真假鈔鑒定分類。
[0028]進一步地,在采用DSP芯片作為處理器的點鈔機上使用所述鈔票鑒偽方法進行真 假鈔鑒定分類。
[0029] 更進一步地,所述采集鈔票的多光譜圖像,包括采集真鈔和假鈔的多光譜圖像。
[0030] 以下就上述的鈔票鑒偽方法中相關概念進行闡述或者定義:
[0031]定義一:SSIM,一種衡量兩幅圖像相似度的新指標,其值越大相似度越高,最大為 Io
[0032] 定義二:〇〇b誤差估計,oob數據即袋外數據,是訓練中沒有被采集到的樣本集合, 它們可以用來取代測試集誤差估計方法。
[0033] 上述的鈔票鑒偽方法由采集到的原始圖像及其梯度圖像截取特定區域進行特征 提取,獲得分類所需的多個特征;創建單棵決策樹,從根節點開始節點拆分,直至到達葉子 節點;建立多棵決策樹的隨機森林。通過以上方式建立了可在嵌入式設備上實現的隨機森 林分類器。
[0034]上述的鈔票鑒偽方法是基于點鈔機中CMOS傳感器獲取的多光譜圖像,主要是紅外 圖像和自然光圖像,利用DSP芯片進行處理得到鈔票鑒偽結果,能夠在使用DSP芯片作為處 理器的點鈔機上實現鈔票的鑒偽工作,提高了點鈔機中鈔票鑒偽的性能,能夠準確鑒別真 鈔中混雜的假鈔并分類,而且計算速度快,能滿足設備的實時性要求。
[0035]上述的鈔票鑒偽方法使用多光譜圖像傳感器得到的高分辨率的自然光圖像和紅 外圖像,自動獲取鈔票圖像中具有鑒別性的特征,以同一張鈔票帶有防偽信息的區域在自 然光下和紅外光下的圖像相似度為衡量指標,"以真鑒真、借假鑒假",避免了不同機器的差 異性造成的影響。
[0036] 上述的鈔票鑒偽方法利用獲得的真鈔特征樣本和假鈔特征樣本,訓練生成隨機森 林的決策樹,新的鈔票樣本到來時,投入已生成的隨機森林中,即可得到可靠的樣本分類結 果。由于避免了機器差異性的影響,該方法只需要進行一次訓練而無需對每臺新的設備都 進行初始化。
[0037] 上述的鈔票鑒偽方法可以實現在各類嵌入式設備包括點鈔機中的真假鈔鑒定分 類。
[0038] 本發明的有益效果:上述的鈔票鑒偽方法大大地提升了識別未知假幣和新幣種的 能力,能夠高可靠地對紙幣進行分類,并且能夠穩定地檢測出傳統防偽技術無法識別的假 幣、變造幣以及不易流通的紙幣,保證流通紙幣的安全性和可靠性。提高了點鈔機中鈔票鑒 偽的性能,能夠準確鑒別真鈔中混雜的假鈔并分類,而且計算速度快,能滿足設備的實時性 要求。該鈔票鑒偽方法采用"以真鑒真、借假鑒假",避免了不同機器的差異性造成的影響; 只需要進行一次訓練而無需對每臺新的設備都進行初始化。
【附圖說明】
[0039] 圖1為本發明一個實施例的圖像鑒偽流程示意圖;
[0040] 圖2為本發明一個實施例的隨機森林示意圖。
【具體實施方式】
[0041] 下面結合附圖對本發明的實施方式進行詳細描述。
[0042 ]如圖1、圖2所示,為本發明的一個實施例。
[0043] 實施例的技術方案如下:一種基于隨機森林的鈔票鑒偽方法,包括以下步驟:
[0044] Sl.鈔票圖像的特征提取:
[0045] 采集鈔票的多光譜圖像,截取特定區域,采用SSIM方法,得到多個鑒偽指標,多個 鑒偽指標通過線性組合得到真假鈔分類所需的η個特征;
[0046] S2.樣本訓練:
[0047]依據所提取的特征F1、F2、···、Fm和待鑒鈔票的訓練樣本,采用隨機森林方法進行 訓練;創建決策樹,對訓練樣本有放回地隨機抽樣得到N個樣本及其響應,真鈔為1,假鈔為 〇;
[0048] S3.節點拆分:
[0049] S31.從根節點開始節點拆分,拆分的終止條件為樹到達最大深度或節點樣本數到 達最小,若為根節點,重新計算正、負樣本的概率prior,與正、負樣本數加權,并歸一化,得 到新的pr i or,計算每個節點的va I ue,
[0050] Cl)
[0051] (1)式中Pl為正樣本概率,PO為負樣本概率,N正為正樣本數,N負為負樣本數;
[0052] 隨機抽取M個不重復的特征并確定每個特征的最佳拆分閾值;具體包括以下步驟:
[0053] S311.對抽取到的每個特征,將訓練數據由小到大排序,從最左邊的數據起作為拆 分點,計算分裂質量,找出分裂質量最高的點并得到拆分閾值,由此選定具有最高分裂質量 的特征作為分裂特征;
[0054] S32.對所述選定的分裂特征,小于其拆分閾值的樣本歸入左節點,大于或等于其 拆分閾值的樣本歸入右節點,遞歸運算繼續進行節點拆分直至達到終止條件;
[0055] S4.誤差估計:
[0056] -棵樹訓練完成后進行oob誤差估計,將訓練樹時沒有被抽到的訓練樣本作為oob 樣本,放到該樹中預測分類, 「 ^ C+分奚鐠誤_ O幽樣本數
[0057] 誒全犖=---_TT;------------------τ二--: 總_論鋅本數
[0058]若oob誤差率太大則丟棄當前樹,重新訓練一棵樹;
[0059] S5.鈔票鑒偽結果:
[0060] 所有樹訓練完成后,得到隨機森林,待鑒鈔票的測試樣本作為輸入,放到隨機森林 中預測分類得到分類結果,實現鈔票的鑒偽功能。
[0061] 在上述的鈔票鑒偽方法中,實現步驟Sl中采集鈔票的多光譜圖像,截取特定區域 還包括以下步驟:通過點鈔機中的傳感器獲取鈔票的自然光圖像與紅外圖像,由sobel算子 進行邊緣檢測獲取兩幅圖像的梯度圖像,截取以上四幅圖像的特定鑒偽區域。
[0062] 上述的鈔票鑒偽方法中所述點鈔機中傳感器采用CMOS或CIS傳感器。步驟Sl中所 述SSIM為衡量兩幅圖像相似度的指標,其值越大相似度越高,最大為1。所述鈔票鑒偽方法 利用嵌入式設備芯片進行處理,在嵌入式設備上建立隨機森林分類器,實現真假鈔鑒定分 類。在采用DSP芯片作為處理器的點鈔機上使用所述鈔票鑒偽方法進行真假鈔鑒定分類。所 述采集鈔票的多光譜圖像,包括采集真鈔和假鈔的多光譜圖像。
[0063] 根據上述實施例闡述的技術方案,具體描述如下:一種基于隨機森林的鈔票鑒偽 方法,基于點鈔機中CMOS或CIS傳感器獲取的多光譜圖像,主要是紅外圖像和自然光圖像以 及R、G、B圖像等,包括以下步驟:
[0064] 第一步:鈔票圖像的特征提取,通過點鈔機中的CMOS傳感器獲取鈔票的自然光圖 像與紅外圖像,由sobel算子進行邊緣檢測獲取兩幅圖像的梯度圖像,截取以上四幅圖像的 特定鑒偽區域并采用SSIM方法,得到多個鑒偽指標,多個鑒偽指標通過線性組合得到真假 鈔分類所需的η個特征;
[0065]第二步:依據提取的特征Fl、F2、…、Fm和鈔票的訓練樣本,首先,創建單棵決策樹, 對訓練樣本有放回地隨機抽樣得到N個樣本及其響應;真鈔為I,假鈔為O;
[0066] 第三步:從根節點開始節點拆分,拆分的終止條件為樹到達最大深度或節點樣本 數到達最小,若為根節點,重新計算正、負樣本的概率prior,與正、負樣本數加權,并歸一 化,得到新的prior,計算每個節點的value,
[0067] ⑴
[0068] (1)式中正樣本概率為Pl,負樣本概率為PO,N正為正樣本數,N負為負樣本數;
[0069] 隨機抽取M個不重復的特征并找到每個特征的最好拆分閾值,具體為:
[0070] 對抽取到的每個特征,將訓練數據由小到大排序,從最左邊的數據起作為拆分點, 計算分裂質量,找到分裂質量最高的點并得到拆分閾值,由此選出具有最高分裂質量的特 征作為分裂特征;
[0071] 第四步:節點拆分,對選定的分裂特征,小于其拆分閾值的樣本歸入左節點,大于 或等于拆分閾值的樣本歸入右節點,遞歸運算繼續進行節點拆分直至達到終止條件;
[0072] 第五步:一棵樹訓練完成后進行oob誤差估計,將訓練樹時沒有被抽到的訓練樣本 作為oob樣本,放到該樹中預測分類, 「 ^ 城.+分類鐵誤_ 樣本數
[0073 ]·|>!餐煙舉=---------------------------------ΓΓΤ--Τ:--- 總_ 〇說5禪本數
[0074] 若oob誤差率太大則丟棄當前樹,重新訓練;
[0075] 第六步:所有樹訓練完成后,得到隨機森林,待鑒鈔票的測試樣本作為輸入,放到 森林中預測分類得到分類結果,實現鈔票的鑒偽功能;
[0076] 該方法可以實現在點鈔機中的真假鈔鑒定分類。
[0077] 本實施例以同一張鈔票帶有防偽信息的區域在自然光光下和紅外光下的圖像相 似度為衡量指標,"以真鑒真、借假鑒假",避免了不同機器的差異性造成的影響。利用獲得 的真鈔特征樣本和假鈔特征樣本,訓練生成隨機森林的決策樹,新的鈔票樣本到來時,投入 以生成的隨機森林中,即可得到可靠的樣本分類結果。由于避免了機器差異性的影響,只需 要進行一次訓練而無需對每臺新的設備都進行初始化。從而大大地提升了點鈔機識別未知 假幣和新幣種的能力,能夠高可靠地對紙幣進行分類,并且能夠穩定地檢測出傳統防偽技 術無法識別的假幣、變造幣以及不易流通的紙幣,保證流通紙幣的安全性和可靠性。
[0078] 應當理解的是,本說明書未詳細闡述的部分均屬于現有技術。
[0079]雖然以上結合附圖描述了本發明的【具體實施方式】,但是本領域普通技術人員應當 理解,這些僅是舉例說明,可以對這些實施方式做出多種變形或修改,而不背離本發明的原 理和實質。本發明的范圍僅由所附權利要求書限定。
【主權項】
1. 一種基于隨機森林的鈔票鑒偽方法,其特征在于:包括以下步驟:51. 鈔票圖像的特征提?。?采集鈔票的多光譜圖像,截取特定區域,采用SSM方法,得到多個鑒偽指標,多個鑒偽 指標通過線性組合得到真假鈔分類所需的η個特征;52. 樣本訓練: 依據所提取的特征FI、F2、…、Fm和待鑒鈔票的訓練樣本,采用隨機森林方法進行訓練; 創建決策樹,對訓練樣本有放回地隨機抽樣得到N個樣本及其響應,真鈔為1,假鈔為0;53. 節點拆分:531. 從根節點開始節點拆分,拆分的終止條件為樹到達最大深度或節點樣本數到達最 小,若為根節點,重新計算正、負樣本的概率prior,與正、負樣本數加權,并歸一化,得到新 的prior,計算每個節點的value,(1)式中P1為正樣本概率,P0為負樣本概率,N正為正樣本數,N負為負樣本數; 隨機抽取Μ個不重復的特征并確定每個特征的最佳拆分閾值;具體包括以下步驟: S311.對抽取到的每個特征,將訓練數據由小到大排序,從最左邊的數據起作為拆分 點,計算分裂質量,找出分裂質量最高的點并得到拆分閾值,由此選定具有最高分裂質量的 特征作為分裂特征;532. 對所述選定的分裂特征,小于其拆分閾值的樣本歸入左節點,大于或等于其拆分 閾值的樣本歸入右節點,遞歸運算繼續進行節點拆分直至達到終止條件;54. 誤差估計: 一棵樹訓練完成后進行〇〇b誤差估計,將訓練樹時沒有被抽到的訓練樣本作為〇〇b樣 本,放到該樹中預測分類,若oob誤差率太大則丟棄當前樹,重新訓練一棵樹;55. 鈔票鑒偽結果: 所有樹訓練完成后,得到隨機森林,待鑒鈔票的測試樣本作為輸入,放到隨機森林中預 測分類得到分類結果,實現鈔票的鑒偽功能。2. 如權利要求1所述的鈔票鑒偽方法,其特征在于:實現步驟S1中采集鈔票的多光譜圖 像,截取特定區域還包括以下步驟: 通過點鈔機中的傳感器獲取鈔票的自然光圖像與紅外圖像,由sobel算子進行邊緣檢 測獲取兩幅圖像的梯度圖像,截取以上四幅圖像的特定鑒偽區域。3. 如權利要求2所述的鈔票鑒偽方法,其特征在于:所述點鈔機中傳感器采用CMOS或 CIS傳感器。4. 如權利要求1所述的鈔票鑒偽方法,其特征在于:步驟S1中所述SS頂為衡量兩幅圖像 相似度的指標,其值越大相似度越高,最大為1。5. 如權利要求1所述的鈔票鑒偽方法,其特征在于:所述鈔票鑒偽方法利用嵌入式設備 芯片進行處理,在嵌入式設備上建立隨機森林分類器,實現真假鈔鑒定分類。6. 如權利要求2所述的鈔票鑒偽方法,其特征在于:在采用DSP芯片作為處理器的點鈔 機上使用所述鈔票鑒偽方法進行真假鈔鑒定分類。7. 如權利要求2所述的鈔票鑒偽方法,其特征在于:所述采集鈔票的多光譜圖像,包括 采集真鈔和假鈔的多光譜圖像。
【文檔編號】G07D7/20GK106056752SQ201610352247
【公開日】2016年10月26日
【申請日】2016年5月25日
【發明人】馮天鵬, 江燕婷, 顏佳, 林金勇
【申請人】武漢大學