可隨時隨地進行的識別:基於安卓手機的液晶屏數字識別係統
發布時間:2016-02-15 責任編輯:susan
【導讀】本(ben)文(wen)針(zhen)對(dui)帶(dai)有(you)七(qi)段(duan)碼(ma)的(de)數(shu)字(zi)液(ye)晶(jing)屏(ping),設(she)計(ji)了(le)一(yi)種(zhong)基(ji)於(yu)安(an)卓(zhuo)手(shou)機(ji)的(de)液(ye)晶(jing)屏(ping)數(shu)字(zi)識(shi)別(bie)係(xi)統(tong)。實(shi)際(ji)檢(jian)測(ce)結(jie)果(guo)表(biao)明(ming)識(shi)別(bie)率(lv)很(hen)高(gao),而(er)且(qie)識(shi)別(bie)速(su)度(du)很(hen)快(kuai),該(gai)係(xi)統(tong)基(ji)於(yu)安(an)卓(zhuo)手(shou)機(ji),使(shi)用(yong)方(fang)便(bian),便(bian)於(yu)攜(xie)帶(dai),可(ke)以(yi)實(shi)時(shi)操(cao)作(zuo)。
通過手機拍照獲取液晶屏圖像,利用安卓本地接口功能調用計算機視覺庫,對圖像進行處理;針對圖像的傾斜問題,通過圖像預處理和霍夫變換取得圖像傾斜角,並進行傾斜矯正;利用直方圖對數字字符進行分割,以網格法提取字符的特征值,用三層BP神(shen)經(jing)網(wang)絡(luo)進(jin)行(xing)液(ye)晶(jing)屏(ping)數(shu)字(zi)字(zi)符(fu)的(de)識(shi)別(bie)。實(shi)際(ji)檢(jian)測(ce)結(jie)果(guo)表(biao)明(ming)識(shi)別(bie)率(lv)很(hen)高(gao),而(er)且(qie)識(shi)別(bie)速(su)度(du)很(hen)快(kuai),該(gai)係(xi)統(tong)基(ji)於(yu)安(an)卓(zhuo)手(shou)機(ji),使(shi)用(yong)方(fang)便(bian),便(bian)於(yu)攜(xie)帶(dai),可(ke)以(yi)實(shi)時(shi)操(cao)作(zuo)。
suizhewoguoxinxihuajianshehexiandaihuajinchengdejiakuai,zidongshibiejishuyijingyuelaiyueguangfandiyingyongzaigegegongchenglingyu,liyongshuzituxiangshibiejishukeyiyouxiaodijiakuaizidonghua、智(zhi)能(neng)化(hua)進(jin)程(cheng)。液(ye)晶(jing)屏(ping)作(zuo)為(wei)智(zhi)能(neng)化(hua)設(she)備(bei)的(de)主(zhu)要(yao)標(biao)誌(zhi),其(qi)識(shi)別(bie)已(yi)經(jing)成(cheng)為(wei)模(mo)式(shi)識(shi)別(bie)領(ling)域(yu)的(de)重(zhong)要(yao)研(yan)究(jiu)課(ke)題(ti)。帶(dai)有(you)七(qi)段(duan)碼(ma)的(de)數(shu)字(zi)液(ye)晶(jing)屏(ping),其(qi)顯(xian)示(shi)精(jing)度(du)高(gao),易(yi)於(yu)讀(du)取(qu)和(he)設(she)置(zhi),在(zai)工(gong)業(ye)領(ling)域(yu)應(ying)用(yong)非(fei)常(chang)廣(guang)泛(fan)。利(li)用(yong)現(xian)有(you)的(de)圖(tu)像(xiang)采(cai)集(ji)技(ji)術(shu)、圖像處理技術和圖像識別技術,可以實現液晶屏數字的識別,常用的方法有神經網絡和模版匹配,識別的時間、識別精度和係統的便攜性是識別係統的關鍵。
現有的識別係統大都是以計算機為載體,不能實現隨時隨地識別液晶屏的要求。近年以來,智能手機係統尤其是安卓係統,以其開放性、易開發和基於Linux操作係統等優勢,獲得了大量的用戶。安卓係統提供本地接口(JNI)功能,使開發者可以通過接口調用庫文件,不僅可以使用Java語言進行開發,而且可以使用輕量級且高效的C/C++yuyanbianxie。anzhuodebendijiekougongnengweishixiantuxiangchulitigonglefangbian。tongguotiaoyongjisuanjishijiaokuwenjian,anzhuokaifarenyuankeyifangbianjinxingtuxiangdechulihetuxiangdeshibie。jiyuci,benwentichujiyuanzhuoshoujideyejingpingshuzishibiexitong,tongguoanzhuoshoujipaizhao,huoquyejingpingtuxiang,liyongtuxiangchulijishuduituxiangjinxingchuli,zuihoucaiyongsancengBP神經網絡對圖像進行識別,隨時隨地、快速、準確地識別液晶屏圖像。
一.識別係統流程
圖(tu)像(xiang)識(shi)別(bie)技(ji)術(shu)是(shi)利(li)用(yong)計(ji)算(suan)機(ji)視(shi)覺(jiao)采(cai)集(ji)物(wu)理(li)對(dui)象(xiang),以(yi)圖(tu)像(xiang)數(shu)據(ju)為(wei)基(ji)礎(chu),讓(rang)機(ji)器(qi)模(mo)仿(fang)人(ren)類(lei)視(shi)覺(jiao),自(zi)動(dong)完(wan)成(cheng)某(mou)些(xie)信(xin)息(xi)的(de)處(chu)理(li)功(gong)能(neng),達(da)到(dao)人(ren)類(lei)所(suo)具(ju)有(you)的(de)對(dui)視(shi)覺(jiao)采(cai)集(ji)圖(tu)像(xiang)進(jin)行(xing)識(shi)別(bie)的(de)能(neng)力(li),以(yi)代(dai)替(ti)人(ren)去(qu)完(wan)成(cheng)圖(tu)像(xiang)分(fen)類(lei)及(ji)識(shi)別(bie)的(de)任(ren)務(wu)。圖(tu)像(xiang)模(mo)式(shi)識(shi)別(bie)係(xi)統(tong)通(tong)常(chang)由(you)五(wu)個(ge)模(mo)塊(kuai)組(zu)成(cheng),如(ru)圖(tu)1所示。

二.圖像預處理及特征提取
由安卓手機拍照成功後得到液晶屏圖像,這裏選取拍照條件不是很理想的情況下獲取的照片,如下圖2所示。

由上圖2所示,得到的圖像是彩色圖像,由於光照強度等原因,液晶屏圖像中常有許多噪聲點。為了得到精確圖像,本文對圖像進行灰度化處理、大津法二值化處理和開運算處理。下圖3中(a)、(b)和(c)分別為灰度化處理、大津法二值化處理和開運算處理後的結果。

1.圖像傾斜矯正
在拍攝過程中由於拍攝角度等因素,導致圖像會有一定角度的傾斜,如圖3(c)所suo示shi。圖tu像xiang的de傾qing斜xie將jiang會hui增zeng加jia後hou續xu字zi符fu分fen割ge和he特te征zheng提ti取qu的de難nan度du,甚shen至zhi導dao致zhi提ti取qu到dao的de特te征zheng值zhi是shi錯cuo誤wu的de,進jin而er嚴yan重zhong影ying響xiang字zi符fu識shi別bie的de精jing度du。為wei了le便bian於yu圖tu像xiang後hou續xu處chu理li,需xu要yao對dui圖tu像xiang進jin行xing傾qing斜xie矯jiao正zheng。
對於液晶屏圖像,考慮采用霍夫變換的方法求其傾斜角。通過霍夫變換,可以取得圖像中所有直線的端點。為了便於快速、高效地求取圖像的傾斜角,先對圖像進行膨脹處理和邊緣檢測。
膨脹是指將圖像與核進行卷積,核可以是任何形狀或大小。通過圖像的膨脹操作,可以將圖像中的高亮區域逐漸增加。對於圖3(c),先進行反色處理,然後采用7×7的矩形內核膨脹處理5次。膨脹處理後的圖像包含有許多直線,對膨脹處理圖像進行邊緣檢測。設定上下限閾值比為3:1,通過Canny邊緣檢測得到的邊緣圖像。圖4中(a)和(b)分別是對圖3(c)進行膨脹和邊緣檢測後的結果。

由圖4(b)可以看出,經膨脹處理和邊緣檢測後的圖像可以將液晶屏數字的輪廓勾勒出來。對圖4(b)進(jin)行(xing)霍(huo)夫(fu)變(bian)換(huan),可(ke)以(yi)獲(huo)取(qu)圖(tu)像(xiang)中(zhong)每(mei)條(tiao)線(xian)段(duan)的(de)端(duan)點(dian),進(jin)而(er)可(ke)以(yi)求(qiu)其(qi)反(fan)正(zheng)切(qie)函(han)數(shu),即(ji)求(qiu)得(de)每(mei)條(tiao)線(xian)段(duan)與(yu)橫(heng)軸(zhou)之(zhi)間(jian)的(de)夾(jia)角(jiao)。對(dui)其(qi)餘(yu)傾(qing)斜(xie)角(jiao)求(qiu)取(qu)平(ping)均(jun)值(zhi),即(ji)認(ren)為(wei)是(shi)圖(tu)3(c)的傾斜角度。
根據傾斜角將圖3(c)進行旋轉得圖5。

2.字符分割及歸一化
zifudefengejishukeyijiangdangezifucongtuxiangzhongfengechulai。zhifangtuguangfanyingyongyujisuanjishijiaoyingyongzhong,keyiduituxiangdeshujujinxingtongji,huodeshujufenbudetongjitu。
對於一個大小為X×Y的二值化圖像,定義其在橫軸和縱軸的投影分布函數為Hx(i)(i=1,2,…,X)和Hy(i)(i=1,2,…,Y),其中,X代表橫軸的坐標,Y代表縱軸的坐標,初始化時設置函數值均為0。遍曆該圖像中的像素點,如果該像素點為黑色像素點,則將該像素點對應的投影分布函數Hx(i)和Hy(i)分別加1。最後,得出圖像在橫軸和縱軸的投影分布函數Hx(i)和Hy(i)。利用縱軸和橫軸方向分布函數中波峰和波穀的位置[9],根據字符和空白在縱軸和橫軸投影的不同,得出各個字符的頂、底、左端和右端在圖像中位置。
根據各個字符在圖像中的位置,即可將字符分割,對圖3(c)進行字符分割後各個字符如圖6所示。

得到字符在圖像中的位置後,即可將字符從圖像中分割出來。由於實際分割過程中每個字符大小不一致,如圖6所示,所以對分割字符進行歸一化處理,使不同字符的大小統一為固定大小,便於後續字符分割。首先將圖6中字符周圍的空白位置切除,然後采用三次樣條插值的方法,對源圖像附近的4×4個ge鄰lin近jin像xiang素su進jin行xing三san次ci樣yang條tiao擬ni合he,最zui後hou將jiang目mu標biao像xiang素su對dui應ying的de三san次ci樣yang條tiao值zhi作zuo為wei目mu標biao圖tu像xiang對dui應ying像xiang素su點dian的de值zhi。將jiang字zi符fu歸gui一yi化hua以yi後hou,所suo得de各ge個ge字zi符fu如ru下xia圖tu7所示。

3.字符特征提取
將字符從圖像中分割以後,就可以對圖像進行特征提取。采用網格法提取字符的21個特征值,用於字符圖像的識別。首先將字符圖像均分為5行3列的區域,分別求得每個區域內黑色像素所占該區域的比例,作為字符的15個特征值;然後將字符圖像均分為3行,分別求得每行內黑色像素點占該區域的比例,作為字符圖像的3個特征值;最後,將字符圖像均分為3列,分別求得每列內黑色像素點占該區域的比例,作為字符圖像的另外3個特征值。共提取字符圖像的21個特征值,用於字符圖像的識別。
三.字符識別
用誤差反向後傳算法即BP神經網絡來進行數字字符的識別。BP神經網絡由Rumelhart和McClelland於1985年提出,實現了Minsky和Papert認為不能實現的多層網絡的設想。

三層BP神經網絡的模型如圖8所示,包括輸入層、隱含層和輸出層,各層間由連接權值構成。BPshenjingwangluodexunlianguochengyouxinhaodezhengxiangchuanbohewuchadefanxiangchuanbolianggeguochengzucheng,qixuexidebenzhishigelianjiequanzhidedongtaitiaozheng。suizhewangluodebuduanxuexi,quanzhiyebuduandetiaozheng,zhidaowuchajianshaodaokejieshoudechengduhuozhexunliandadaoyudingdexunliancishu。
1.網絡結構設計
2.3節說明了提取字符的21個特征值,本係統BP神經網絡的輸入層采用21個節點,分別對應字符的21個特征值。數字字符的識別結果共10個,本文用各個數字對應的四位二進製數表示其對應的期望輸出,即輸出層采用4個節點。
由理論分析證明,具有單隱層的BP神經網絡即可滿足大部分的設計需求,本文中采用單隱層。
BP神經網絡隱含層節點數的設計與訓練樣本數的多少、樣yang本ben噪zao聲sheng的de大da小xiao及ji樣yang本ben中zhong蘊yun含han規gui律lv的de複fu雜za程cheng度du密mi切qie相xiang關guan。實shi際ji應ying用yong中zhong常chang用yong試shi湊cou法fa確que定ding最zui佳jia隱yin節jie點dian個ge數shu。下xia麵mian是shi一yi些xie確que定ding隱yin節jie點dian數shu的de經jing驗yan公gong式shi:

隱節點數,n為輸入層節點數,l為輸出層節點數,為1~10之間常數。
經過分析與實際檢驗,本係統采用10個隱節點數時,可以使網絡誤差很小,同時具有很高的訓練精度,訓練速度也很快,所以采用10個隱節點數。
網wang絡luo訓xun練lian所suo需xu樣yang本ben數shu取qu決jue於yu輸shu入ru輸shu出chu的de非fei線xian性xing映ying射she關guan係xi的de複fu雜za程cheng度du,映ying射she關guan係xi越yue複fu雜za,為wei保bao證zheng映ying射she精jing度du,所suo需xu要yao的de樣yang本ben數shu就jiu越yue多duo。對dui於yu本ben係xi統tong而er言yan,當dang每mei個ge數shu字zi字zi符fu取qu10個樣本,總共取100個樣本的時候,就可以訓練出比較理想的BP神經網絡。
2.生成訓練樣本和測試樣本
本係統收集了1400張液晶屏數字的圖像,任意選取100張作為訓練樣本,剩餘1300張作為測試樣本。
3.訓練神經網絡
如果用安卓手機來進行BP神經網絡的訓練,消耗的時間非常長。為了節省時間,用計算機進行BP神經網絡的訓練。采用VC++平台,根據訓練樣本訓練三層BP神經網絡,訓練成功後將BP神經網絡模型移植到安卓手機中。
4.係統測試
圖9為本係統對圖2的識別結果,可以看到,該係統可以快速實現液晶屏數字的識別。

用1 300個測試樣本對識別係統進行檢測,檢測結果表明本係統正確識別率高達97.8%,可以實現液晶屏數字的精確識別。
四.結論
現xian有you的de液ye晶jing屏ping數shu字zi識shi別bie技ji術shu大da都dou是shi以yi計ji算suan機ji作zuo為wei載zai體ti來lai實shi現xian的de,不bu便bian於yu實shi現xian隨sui時shi隨sui地di進jin行xing液ye晶jing屏ping的de識shi別bie。針zhen對dui這zhe個ge問wen題ti,以yi安an卓zhuo手shou機ji為wei載zai體ti,通tong過guo拍pai照zhao獲huo取qu圖tu像xiang,調tiao用yong計ji算suan機ji視shi覺jiao庫ku實shi現xian圖tu像xiang的de預yu處chu理li和he特te征zheng提ti取qu,用yong訓xun練lian的de三san層cengBP神經網絡模型實現液晶屏數字的識別。檢測結果表明,該係統可以隨時隨地、快速、高效地實現液晶屏數字的識別。
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 一秒檢測,成本降至萬分之一,光引科技把幾十萬的台式光譜儀“搬”到了手腕上
- AI服務器電源機櫃Power Rack HVDC MW級測試方案
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
- 通過直接、準確、自動測量超低範圍的氯殘留來推動反滲透膜保護
- 從技術研發到規模量產:恩智浦第三代成像雷達平台,賦能下一代自動駕駛!
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
按鈕開關
白色家電
保護器件
保險絲管
北鬥定位
北高智
貝能科技
背板連接器
背光器件
編碼器型號
便攜產品
便攜醫療
變容二極管
變壓器
檳城電子
並網
撥動開關
玻璃釉電容
剝線機
薄膜電容
薄膜電阻
薄膜開關
捕魚器
步進電機
測力傳感器
測試測量
測試設備
拆解
場效應管
超霸科技




