“中國制造2025”是我國實(shí)施制造強(qiáng)國戰(zhàn)略的第一步,是中國版的工業(yè)4.0(智能制造)。機(jī)器視覺是工業(yè)實(shí)現(xiàn)智能制造必不可少的重要技術(shù)。
機(jī)器視覺相當(dāng)于人類視覺在機(jī)器上的延伸,讓機(jī)器能夠通過“眼睛”獲取信息,通過智能算法做出判斷,從而自適應(yīng)工作環(huán)境中的非標(biāo)準(zhǔn)因素,實(shí)現(xiàn)工業(yè)非標(biāo)自動(dòng)化的流程。
然而,隨著工業(yè)自動(dòng)化水平的不斷提高, 傳統(tǒng)機(jī)器視覺已經(jīng)不能夠滿足一些更加復(fù)雜的應(yīng)用場景:
無法預(yù)測模板中不存在的樣本
當(dāng)圖像模板不足以覆蓋可能出現(xiàn)的所有樣本時(shí),缺陷特征就很難通過提前設(shè)定的方式實(shí)現(xiàn)。
無法分析不規(guī)則、無規(guī)律的圖像
當(dāng)圖像不規(guī)則、無規(guī)律時(shí),很難按照經(jīng)驗(yàn)手動(dòng)設(shè)計(jì)特征,直接輸出映射關(guān)系。
為更好的滿足工業(yè)領(lǐng)域的各種行業(yè)需求,華??萍荚贛VP智能算法平臺中加入了強(qiáng)大的深度學(xué)習(xí)功能,可針對復(fù)雜多變的應(yīng)用場景進(jìn)行字符識別、缺陷檢測、圖像分類等功能。
深度學(xué)習(xí)OCR識別
字符檢測涉及兩個(gè)步驟,一是字符區(qū)域的提取,二是字符內(nèi)容的識別。采用檢測網(wǎng)絡(luò)結(jié)合端到端的識別深度學(xué)習(xí)模型結(jié)合文字語義信息,可以實(shí)現(xiàn)對通用場景的識別,包括中文、字母、數(shù)字等。對于扭曲、形變、破損、過曝等具有較好的魯棒性。在圖像像素缺失時(shí)的字符檢測率,通過對比,在檢測背景下深度學(xué)習(xí)的字符識別準(zhǔn)確率能比傳統(tǒng)算法上升15%-20%,而復(fù)雜背景下的識別率能提升50%以上。
業(yè)界難題,輕松讀取
對于傳統(tǒng)的字符識別方法來說,點(diǎn)陣字符很難分割,無疑是字符識別的業(yè)界難題。應(yīng)用華??萍糓VP智能算法平臺深度學(xué)習(xí)OCR識別算子,可以輕松解決點(diǎn)陣OCR識別的難題。
惡劣環(huán)境,毫無畏懼
在實(shí)際應(yīng)用場景中,還會(huì)經(jīng)常遇到字符質(zhì)量較差,圖像環(huán)境較為惡劣的情況,應(yīng)用深度學(xué)習(xí)OCR識別,可以自適應(yīng)字符的放縮、變形、扭曲、遮蓋、殘缺等各種變化。
多行字符,語義識別
將深度學(xué)習(xí)在復(fù)雜背景下自適應(yīng)學(xué)習(xí)能力,應(yīng)用于環(huán)境復(fù)雜的物流面單字符識別的應(yīng)用場景中,可以在字符粘連、傾斜、褶皺等多種情況下進(jìn)行識別,完成文本行定位,實(shí)現(xiàn)多行字符同時(shí)識別的功能。華??萍冀?jīng)過多年在物流、郵政行業(yè)的深耕,積累了大量的語料庫,可以識別出快遞面單中各個(gè)地址的語義信息、電話信息以及各種非主流的網(wǎng)絡(luò)用戶名,輕松將面單信息錄入系統(tǒng)。
深度學(xué)習(xí)缺陷檢測、定位檢測
將深度學(xué)習(xí)在復(fù)雜背景下的自適應(yīng)學(xué)習(xí)能力,應(yīng)用于不同物體表面的缺陷檢測。首先將已知缺陷數(shù)據(jù)放入深度學(xué)習(xí)模型用于學(xué)習(xí)缺陷的基礎(chǔ)特征和語義特征,接著利用上述模型區(qū)分缺陷區(qū)域和正常區(qū)域,最后標(biāo)記出缺陷區(qū)域。這類模型只依賴于缺陷和背景的差異,具有良好的遷移能力,能應(yīng)用于紙箱表面,金屬表面和玻璃表面等不同場景。
像素分類
深度學(xué)習(xí)在分割任務(wù)上要求對目標(biāo)區(qū)域進(jìn)行精細(xì)的區(qū)分,在像素上對目標(biāo)和背景進(jìn)行分類,輸出熱度圖。在工業(yè)領(lǐng)域具有較廣泛的應(yīng)用,如織物、布匹、液晶等表面的臟污、破損,劃痕等。
分類
目前深度學(xué)習(xí)應(yīng)用于分類任務(wù)上,主要是通過物體之間的差異得出特征差異。然而物體的數(shù)量判斷無法直接利用上述經(jīng)驗(yàn)。設(shè)計(jì)一種自帶空間特征的深度學(xué)習(xí)模型應(yīng)用于物體的單雙判斷可以有效解決此類分類任務(wù),場景復(fù)雜多變,包裹形態(tài)多樣,存在相互交疊等情況,相比傳統(tǒng)方法準(zhǔn)確率從80%提升至99%以上。
深度學(xué)習(xí)應(yīng)用于機(jī)器視覺系統(tǒng),不僅需要對現(xiàn)有方法的研究和改進(jìn),還需要針對不同的使用場景,設(shè)計(jì)通用深度學(xué)習(xí)模型,一方面可以提高檢測率并降低錯(cuò)誤率,另一方面可以將模型遷移到不同場景。在物流,汽車,火車和智能制造領(lǐng)域,字符識別和缺陷檢測已經(jīng)取得比較滿意的效果,而在其他領(lǐng)域,深度學(xué)習(xí)還有廣闊發(fā)展的空間。
蘇州深淺優(yōu)視智能科技有限公司是以高精度在線檢測3D相機(jī)及配套檢測識別軟件為核心的產(chǎn)品公司,我們圍繞高精度和在線檢測兩個(gè)核心方向發(fā)展,針對不同材料、尺寸、形狀的工件,拓展產(chǎn)品系列,在兼容二次元測量能力的同時(shí),完善三維測量功能,為客戶創(chuàng)造價(jià)值。我們要做智能制造的智慧之眼,看清工業(yè)的深深淺淺,成為中國3D視覺核心產(chǎn)品的頭部公司。
產(chǎn)品的主要技術(shù)路線是融合深度學(xué)習(xí)的相移結(jié)構(gòu)光技術(shù),主要特為“準(zhǔn)”和“快”!從精度上來說,我們與國外同類產(chǎn)品相當(dāng),uDeeper系列產(chǎn)品的重復(fù)精度達(dá)到0.5微米。從測量速度上來講,我們?nèi)鎯?yōu)于國內(nèi)外產(chǎn)品,500萬個(gè)點(diǎn)云一蹴而就,對于一般產(chǎn)線來說,基本上可以做到我們產(chǎn)品等運(yùn)動(dòng)機(jī)構(gòu),由于不需要復(fù)雜機(jī)構(gòu)配合,解決了在有限空間、有限成本下高效產(chǎn)出的難題。針對大型客戶和集成商,我們還提供功能豐富的軟件平臺,可以不依賴收費(fèi)分析軟件,大大降低客戶的二次投入和長期維護(hù)成本。