基於光譜編碼的傳感與成像的機器視覺技術
發布時間:2021-04-12 責任編輯:lina
【導讀】隨著自動化和智能技術發展日益成熟,機器視覺係統在許多領域被廣泛應用,包括自動駕駛汽車、智能製造、自(zi)動(dong)化(hua)手(shou)術(shu)和(he)生(sheng)物(wu)醫(yi)學(xue)成(cheng)像(xiang)等(deng)。這(zhe)些(xie)機(ji)器(qi)視(shi)覺(jiao)係(xi)統(tong)大(da)多(duo)使(shi)用(yong)基(ji)於(yu)普(pu)通(tong)光(guang)學(xue)鏡(jing)頭(tou)模(mo)組(zu)的(de)相(xiang)機(ji),在(zai)拍(pai)攝(she)通(tong)常(chang)高(gao)達(da)具(ju)有(you)數(shu)百(bai)萬(wan)像(xiang)素(su)的(de)圖(tu)像(xiang)或(huo)視(shi)頻(pin)後(hou),通(tong)常(chang)將(jiang)其(qi)饋(kui)送(song)到(dao)如(ru)GPU等數字邏輯處理單元從而來執行一定的機器學習任務,例如物體識別、分類和場景分割等。
隨著自動化和智能技術發展日益成熟,機器視覺係統在許多領域被廣泛應用,包括自動駕駛汽車、智能製造、自(zi)動(dong)化(hua)手(shou)術(shu)和(he)生(sheng)物(wu)醫(yi)學(xue)成(cheng)像(xiang)等(deng)。這(zhe)些(xie)機(ji)器(qi)視(shi)覺(jiao)係(xi)統(tong)大(da)多(duo)使(shi)用(yong)基(ji)於(yu)普(pu)通(tong)光(guang)學(xue)鏡(jing)頭(tou)模(mo)組(zu)的(de)相(xiang)機(ji),在(zai)拍(pai)攝(she)通(tong)常(chang)高(gao)達(da)具(ju)有(you)數(shu)百(bai)萬(wan)像(xiang)素(su)的(de)圖(tu)像(xiang)或(huo)視(shi)頻(pin)後(hou),通(tong)常(chang)將(jiang)其(qi)饋(kui)送(song)到(dao)如(ru)GPU等數字邏輯處理單元從而來執行一定的機器學習任務,例如物體識別、分類和場景分割等。

藝術效果圖:基於光學神經網絡的機器視覺係統
這種經典的機器視覺架構具有如下幾個方麵的缺點:
第一,高像素傳感器拍(pai)攝(she)帶(dai)來(lai)大(da)量(liang)信(xin)息(xi)使(shi)其(qi)難(nan)以(yi)實(shi)現(xian)極(ji)高(gao)速(su)的(de)圖(tu)像(xiang)或(huo)視(shi)頻(pin)數(shu)字(zi)化(hua)存(cun)儲(chu)和(he)分(fen)析(xi),尤(you)其(qi)在(zai)使(shi)用(yong)移(yi)動(dong)設(she)備(bei)和(he)電(dian)池(chi)供(gong)電(dian)的(de)設(she)備(bei)時(shi)更(geng)是(shi)帶(dai)來(lai)了(le)能(neng)耗(hao)和(he)性(xing)能(neng)的(de)平(ping)衡(heng)問(wen)題(ti);
第di二er,所suo捕bu獲huo的de圖tu像xiang通tong常chang包bao含han許xu多duo對dui機ji器qi學xue習xi任ren務wu無wu用yong的de冗rong餘yu信xin息xi,帶dai來lai了le後hou端duan處chu理li器qi某mou種zhong程cheng度du上shang的de性xing能neng負fu擔dan,和he資zi源yuan浪lang費fei,從cong而er導dao致zhi在zai功gong耗hao和he內nei存cun需xu求qiu方fang麵mian效xiao率lv低di下xia。
第三,在可見光的波長以外的電磁波段製造高像素數圖像傳感器(如手機相機中的傳感器)具有很大的挑戰性,且其成本十分昂貴,因而也限製了機器視覺係統在更長波段(如太赫茲)上的應用。
最近,加州大學洛杉磯分校(UCLA)的研究人員開發了一種新的單像素機器視覺係統,通過引入光學神經網絡(名詞解釋⏬)的方式規避了傳統機器視覺係統的諸多缺點。

圖1 來(lai)自(zi)加(jia)州(zhou)大(da)學(xue)洛(luo)杉(shan)磯(ji)分(fen)校(xiao)的(de)研(yan)究(jiu)人(ren)員(yuan)發(fa)明(ming)了(le)一(yi)個(ge)新(xin)型(xing)單(dan)像(xiang)素(su)機(ji)器(qi)視(shi)覺(jiao)係(xi)統(tong),該(gai)係(xi)統(tong)可(ke)以(yi)將(jiang)物(wu)體(ti)的(de)空(kong)域(yu)信(xin)息(xi)編(bian)碼(ma)為(wei)功(gong)率(lv)譜(pu),從(cong)而(er)實(shi)現(xian)對(dui)圖(tu)像(xiang)進(jin)行(xing)分(fen)類(lei)和(he)重(zhong)建(jian)。
該成果以Spectrally encoded single-pixel machine vision using diffractive networks為題發表在Science Advances。
研究人員借助深度學習技術,設計了一個由多個衍射層組成的衍射光學神經網絡(Diffractive Optical Neural Networks)(拓展閱讀⏬),這些衍射層由計算機自動優化設計,可將經過的輸入光場調製成一定的目標分布,從而能夠執行計算和統計推斷任務。
與(yu)常(chang)規(gui)的(de)基(ji)於(yu)鏡(jing)頭(tou)模(mo)組(zu)的(de)相(xiang)機(ji)不(bu)同(tong),該(gai)衍(yan)射(she)光(guang)學(xue)神(shen)經(jing)網(wang)絡(luo)以(yi)被(bei)寬(kuan)帶(dai)光(guang)照(zhao)明(ming)的(de)物(wu)體(ti)作(zuo)為(wei)其(qi)輸(shu)入(ru),將(jiang)物(wu)體(ti)的(de)空(kong)域(yu)特(te)征(zheng)信(xin)息(xi)提(ti)取(qu)並(bing)編(bian)碼(ma)到(dao)衍(yan)射(she)光(guang)的(de)光(guang)譜(pu)上(shang),而(er)後(hou)光(guang)譜(pu)信(xin)號(hao)由(you)具(ju)有(you)頻(pin)譜(pu)探(tan)測(ce)能(neng)力(li)的(de)單(dan)像(xiang)素(su)超(chao)快(kuai)傳(chuan)感(gan)器(qi)所(suo)收(shou)集(ji)。通(tong)過(guo)將(jiang)物(wu)體(ti)對(dui)應(ying)的(de)不(bu)同(tong)的(de)類(lei)別(bie)分(fen)配(pei)給(gei)不(bu)同(tong)波(bo)長(chang)的(de)光(guang)頻(pin)譜(pu)分(fen)量(liang),該(gai)係(xi)統(tong)僅(jin)使(shi)用(yong)單(dan)像(xiang)素(su)傳(chuan)感(gan)器(qi)探(tan)測(ce)到(dao)的(de)輸(shu)出(chu)光(guang)譜(pu)即(ji)可(ke)自(zi)動(dong)對(dui)輸(shu)入(ru)對(dui)象(xiang)完(wan)成(cheng)分(fen)類(lei),從(cong)而(er)無(wu)需(xu)圖(tu)像(xiang)傳(chuan)感(gan)器(qi)陣(zhen)列(lie)和(he)後(hou)端(duan)數(shu)字(zi)處(chu)理(li)。這(zhe)種(zhong)框(kuang)架(jia)實(shi)現(xian)了(le)全(quan)光(guang)學(xue)推(tui)理(li)和(he)機(ji)器(qi)視(shi)覺(jiao),在(zai)幀(zhen)速(su)率(lv)、內存需求和功耗效率方麵具有明顯優勢,這些特點對於移動計算應用而言尤為重要。

圖2. 該係統使用寬帶光對物體進行照明。係統分類結果取決於單像素傳感器測得的輸出光功率譜上10gebochangweizhishangzuiqiangdexinhao,qibochangduiyingdeleibiejishifenleiyucejieguo。gonglvpuxinhaohaikeyishurudaoshuzishenjingwangluozhongbeiyongyuzhongjianwutibenshendetuxiang。
為驗證這一概念,研究人員通過使用單像素傳感器和3D打印的衍射層對使用手寫數字圖像數據集(MNIST)的所構建的物體進行分類,在實驗中證明了該框架在太赫茲波段下的性能。研究者基於提前選定的10個波長對實驗係統進行了設計,這10個波長被逐一分配給輸入物的不同類別(對應手寫數字的0到9),對物的分類結果取決於傳感器輸出功率譜上10個波長位置上信號最強者的波長對應的類別。
實驗係統中的單像素探測方案基於太赫茲時域光譜術實現,照明光為極短的太赫茲脈衝,網絡的推理以光速在瞬時間完成。
最終,該係統在手寫數字分類任務中實現了超過96%的分類精度,實驗結果也與數值模擬非常吻合,證明了該單像素機器視覺框架在構建低延遲、高(gao)效(xiao)的(de)機(ji)器(qi)學(xue)習(xi)係(xi)統(tong)方(fang)麵(mian)的(de)可(ke)行(xing)性(xing)。除(chu)物(wu)體(ti)分(fen)類(lei)外(wai),研(yan)究(jiu)人(ren)員(yuan)還(hai)將(jiang)此(ci)衍(yan)射(she)神(shen)經(jing)網(wang)絡(luo)的(de)輸(shu)出(chu)與(yu)一(yi)個(ge)簡(jian)單(dan)的(de)全(quan)連(lian)接(jie)數(shu)字(zi)神(shen)經(jing)網(wang)絡(luo)相(xiang)連(lian)接(jie),僅(jin)通(tong)過(guo)功(gong)率(lv)譜(pu)上(shang)10個波長處的信號強度來快速重建此輸入物的圖像,從而實現了圖像的重建或“解壓縮”。
總而言之,這種單像素對象分類和圖像重建框架可以為新的機器視覺係統的開發鋪平道路。該係統具有低像素數、低延遲、低功耗和低成本的特點,以高效、節省資源的獨特優勢通過將物體信息進行頻譜編碼來實現特定的推理任務,有望廣泛應用於移動計算、邊緣計算等領域。
此外,該新框架還可以擴展到各種光譜域測量係統,例如光學相幹斷層掃描、紅外波段成像等,有助於構建基於衍射神經網絡的光譜和空間信息編碼集成的新型3D傳感和成像方式。
免責聲明:本文為轉載文章,轉載此文目的在於傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請電話或者郵箱聯係小編進行侵刪。
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 從機械執行到智能互動:移遠Q-Robotbox助力具身智能加速落地
- 品英Pickering將亮相2026航空電子國際論壇,展示航電與電池測試前沿方案
- 模擬芯片設計師的噩夢:晶體管差1毫伏就廢了,溫度升1度特性全飄
- 3A大電流僅需3x1.6mm?意法半導體DCP3603重新定義電源設計
- 芯科科技Tech Talks與藍牙亞洲大會聯動,線上線下賦能物聯網創新
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索





