1.智能小助手在視覺上開戰(zhàn)
隨著我們的系統(tǒng)越來越接近于“人性化”——就像人工智能,它將更需要視覺數(shù)據來進行學習和處理其他數(shù)據。在LDV 峰會上,Evan Nisselson說到:“這是所有主要公司都想在激烈的競爭中擁有我們的活動視覺數(shù)據的原因之一?!薄盀榱俗龅竭@一點,他們需要擁有攝像機?!崩纾瑏嗰R遜最近為其以Alexa作為語音助手的智能設備—— Echo,添加了一臺攝像頭,而Google和Facebook最近又發(fā)布了新的增強現(xiàn)實研究的聲明。
2.光學器件足以引導無人駕駛車
我們經常會看到類似于這樣的爭論——無人駕駛汽車是否需要LiDAR,或者說是僅依賴于光學的解決方案就已經足夠。例如,特斯拉首席執(zhí)行官Elon Musk認為,體積龐大且昂貴的設備LiDAR通過使用激光器實時地對其環(huán)境進行映射不是駕駛時所必需的。 Wheras Humatics 的首席技術官Gregory Charvat在發(fā)布會上表示,汽車“不僅僅需要光學傳感器平臺[相機],他們也需要比差分GPS更精確的LiDAR,雷達和高精度無線電導航。”
LiDAR和雷達通過范圍和角度來精確定位周圍環(huán)境中的實際物體,而基于用相機解決問題的深度學習則需要通過算法運行圖像,并且即便這樣,最終仍只能取得一個預測的結果。然而,光學解決方案能在實際生活中識別某個地方效果更好,就像一個行人和一串像圣誕樹的像素點相比,在Auto X 的創(chuàng)始人兼CEO Jianxiong Xiao的令人印象深刻的演示中,他們的公司可以只使用相機來低成本的解決無人駕駛汽車的問題。
由于技術上的優(yōu)缺點,汽車公司通常提前五年來進行戰(zhàn)略研究,所以現(xiàn)在需要購買一些必備的硬件來確定2021年的最后生產時限。目前,LiDAR和一些更先進的雷達依然很昂貴(對于前者來說即便80,000美元也被認為是便宜的)、笨重。同時,如果要以一種混合的方式運行所有這些光學技術和傳感器技術,需要一臺足夠小的能適應汽車的超級計算機。
3.視覺系統(tǒng)能讓機器比通過機器學習學得更好
LDV中的幾個演示提醒了我們,機器不僅僅通過神經網絡和機器學習來學習。他們還有其他方法來學會識別和分析他們周圍的世界。Google研究的科學家Tali Dekel展示了一種技術,使用計算機視覺來進行識別,通過將屋頂上的直線或紫色水果中所存在的偏差放大,然后來判斷。例如,確定舊房子的結構是否存在問題,或者是某個西紅柿是否比其他的成熟的更好,更飽滿??此坪芎唵危@是計算機視覺優(yōu)于人類的地方。
4.機器視覺可以幫助醫(yī)療診斷
病理學家平均每天有500張幻燈片要處理,而每張幻燈片又包含數(shù)十萬個需要分析的單個細胞,如果有癌癥的存在,那么醫(yī)生很容易將其遺漏?!皩τ谌祟悂碚f,我們無法像計算機一樣高效的工作,只因為我們無法去仔細觀察每一個單元格”,PathAI的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Andrew Beck表示,“但我們認為電腦每次都能做出完美的診斷?!?br/>
根據美國醫(yī)學協(xié)會的一項研究,對于一項正確的診斷,通常只有不到一半的病理學家會表示贊同。引用另一項重點研究乳腺癌淋巴結活檢的例子,Beck說明了計算機與人類病理學家所關注的側重點之間的區(qū)別;前者強調了許多會成為癌細胞容器的區(qū)域。Beck說:“我們?yōu)椴±韺W家提供原始圖像,然后他們仍然可以去查看他們所熟悉的數(shù)據,和那些由學習系統(tǒng)處理了的圖像,基本上這就可以確定癌癥的區(qū)域,然后醫(yī)生就能通過專門研究這些區(qū)域作出診斷?!比橄侔┭芯勘砻?,如果沒有人工智能,這種活檢只有85%的準確率。而如果使用人工智能作為輔助,錯誤率將下降到只有5%。
5.計算機視覺領域的門檻變得越來越低
優(yōu)質相機,傳感器和深度學習軟件庫(如Google TensorFlow)的商品化大大擴展了計算機視覺的使用范圍,我們看到許多新的初創(chuàng)公司出現(xiàn)。在Vision Summit舉辦的兩次比賽中,不論是一種能夠從Google對街景視圖圖像進行判斷,然后生成人口學分析的技術,還是一個能夠對事故發(fā)生后汽車的損壞程度進行評估并且計算出維修成本的應用程序,我們可以看到這些判斷和分析都僅僅是來源于一張圖片。