?人臉識別已經(jīng)被廣泛應用在各個領域,但當新冠肺炎來襲的時候,戴著口罩的你如何證明你是你?
發(fā)現(xiàn)一個犯罪嫌疑人,但是視頻沒有捕捉到他的臉。能不能通過衣服的顏色、布料的紋理,查找相似的ID?
有違章或是犯罪行為的車輛,往往會遮擋號牌或是使用套牌,那么用車牌號就不能正確辨識車輛的身份,能不能通過更細致的外觀把它找出來?
視頻識別在我們現(xiàn)實中的應用越來越廣泛,很多我們想得到的、想不到的,AI已經(jīng)帶給我們越來越多的驚喜與驚嘆。但,這也都是在進程當中,現(xiàn)實的應用場景對AI不斷提出更高的挑戰(zhàn):以前只要能識別人臉就可以了,現(xiàn)在你要能識別戴口罩的人;以前通過人臉照片追查罪犯,現(xiàn)在看不到臉也能把他找出來;以前通過車牌號碼辨別車輛身份,現(xiàn)在則要通過車身細節(jié)去追蹤……
“人們往往高估一項技術的短期表現(xiàn),而低估一項技術的長期表現(xiàn)。” 已經(jīng)從事17年計算機視覺研究的格靈深瞳信息技術有限公司CTO鄧亞峰深有體會,AI是一個長跑,自己的實力很重要,陪伴的伙伴也很重要。
從看見到看懂,AI在各行各業(yè)中落地才有價值
關于AI,我們常常聽到智慧城市、機器人、自動駕駛、智慧醫(yī)療、工業(yè)視覺、AR等,這些都是AI的應用場景。如果說到AI的核心技術,主要是三個方向:計算機視覺、語音識別、自然語言理解。也就是說,在三個技術方向上的深入,可以應用到各種場景當中去發(fā)揮價值。
在我們?nèi)祟愇锢硎澜鐏砜?,視覺可以占到人體各種感覺器官接受信息的80%。所以,視覺是人與外界溝通最重要的途徑。同樣,在數(shù)字世界里,計算機視覺的發(fā)展也決定著AI的走向與能力。“計算機視覺是智慧物聯(lián)網(wǎng)時代最大的數(shù)據(jù)入口,擁有廣闊的應用場景?!?格靈深瞳信息技術有限公司CTO鄧亞峰表示,無論智慧城市、機器人、自動駕駛、智慧醫(yī)療、智能制造,所有這些應都離不開計算機視覺這一項AI基礎技術。
在智慧城市的應用中,可以通過人的行為軌跡分析找線索、發(fā)現(xiàn)規(guī)律,甚至提前預知異常。比如某個人白天不出門,經(jīng)常是后半夜出門,而且行為軌跡也不是去某個固定的工作場所,那么這個人就有可能是犯罪嫌疑人。
再比如在智能商業(yè)應用中,通過人臉識別將同一個人多次到店關聯(lián)起來,利用人臉將商品購買記錄關聯(lián)起來,并形成動線和熱力圖。有時候,通過海量數(shù)據(jù)匯集后,AI真的可以“比你更了解你”。
“看見”這個世界并不能,但“看懂”這個世界卻非常難。在中國現(xiàn)在有近2億的安防攝像頭,但其產(chǎn)生的視頻數(shù)據(jù)有80%是冗余信息。AI如何通過深度學習、高性能運算及大數(shù)據(jù)技術,在這些數(shù)據(jù)中篩出有用的價值。
格靈深瞳就是一家以“讓計算機看懂世界”為愿景的公司。他們與華為聯(lián)合打造的全目標結構化系統(tǒng),集結構化分析、數(shù)據(jù)存儲、數(shù)據(jù)應用于一體的高性能、高密度計算系統(tǒng),以解決對人體、機動車、非機動車、人臉等全目標的特征識別和快速檢索。其主要功能包括目標檢測、跟蹤、分類、全目標特征識別、以圖搜圖、軌跡分析、綜合布控、違法分析等應用。這個系統(tǒng)能夠有效處理大規(guī)模視頻數(shù)據(jù),將廣泛具備并發(fā)能力強、分析識別準、運算速度快、檢索效率高等優(yōu)勢,可實現(xiàn)預警、布控、研判等多種應用,提高辦案效率。應用于包括智慧城市、公共安全領域各類場景。
沒必要重復造輪子,讓算法工程師的工作變得簡單而極致
單機實現(xiàn)384路極致高密視頻實時分析,支持圖片分析(檢測、結構化、特征提取)不低于1200張/秒——這些聽起來不明覺厲的技術,是如何在高效的機器視覺系統(tǒng)上實現(xiàn)的呢?
一般來講,高效的機器視覺系統(tǒng)取決于四個關鍵因素:一是核心算法,二是自動化大規(guī)模訓練模式,三是智能數(shù)據(jù)挖掘和標注,四是基于硬件平臺的計算優(yōu)化。
如上圖,在傳統(tǒng)的算法開發(fā)模式中,工程師把大量的時間都放在處理參數(shù)等這些基礎工作上,而真正能發(fā)揮其價值的時間占比很少。同時,機器的GPU利用率低,硬件無法充分發(fā)揮其效能。形成了對人才價值和機器價值的雙重浪費。
再看改進后的開發(fā)模式,通過設計與開發(fā)工具,幫助更好的收集和處理數(shù)據(jù),工程師把數(shù)據(jù)、框架、計算資源都管理起來,使得訓練的效率、資源的使用效率都非常高,工程師的時間都用要高價值的工作內(nèi)容上。
“通過虛擬化的環(huán)境,系統(tǒng)把運算資源、存儲資源運用得更為高效,讓算法工程師的工作變得簡單而極致?!?鄧亞峰總結到。
從前后兩種開發(fā)模式對比來看,差別就在于一套大規(guī)模訓練平臺。“大部分公司沒必要重新造輪子?!痹卩噥喎蹇磥?,打造一個高效的大規(guī)模訓練平臺就相當于那個“輪子”,把算法工程師從大量的低端重復性工作中拯救出來。
那么又如構建一個通用又高效的輪子呢?格靈深瞳用了“數(shù)據(jù)并行+模型并行”的方式。簡單來講就是把數(shù)據(jù)和模型分配到不同的機器上去運行,通過巧妙的分割、設計,使得不同機器間數(shù)據(jù)交換量比較少,平行拓展計算資源,從而實現(xiàn)非常高的訓練效率。
這恰好就是深瞳大腦的設計思路:構建從“數(shù)據(jù)->標注->算法->訓練->產(chǎn)品->數(shù)據(jù)”的一個正循環(huán),在這個訓練框架里可以支持上百卡的集群訓練、支持上億類別任務訓練、支持多達上百層以及數(shù)十億參數(shù)的深度學習模型。“終極目標是工程師做完這個框架,標注好數(shù)據(jù),系統(tǒng)就會算出一個完美的結果。”鄧亞峰表示。
找對那個“關鍵先生”
前面講過,高效的機器視覺系統(tǒng)有四個關鍵因素,其中前三個都是與框架相關的,是靠內(nèi)部工程師的智慧來解決,而第四個則是如何借助外力,選擇最好的“伙伴”,鄧亞峰認為這一點極其重要:“如何選擇平臺,把計算做到極到,這跟效率和成本都是密切相關的?!?/b>
華為Atlas、海思NNIE、Movidius、TPU、NPU……對于工程師而言,當前市場上的選擇比較多。鄧亞峰給出幾個重要的考量標準:性價比如何?開發(fā)成本如何?能否提供一整套完整的接口和框架?生態(tài)的持續(xù)性如何?
在他看來,平臺的完整性和生態(tài)的可持續(xù)性非常重要。首先,多平臺開發(fā)和維護成本很高。如果一個平臺不具備云、端、側完整的能力,那么工程師就需要開發(fā)多平臺、維護多平臺。增加一個新平臺,不僅資金成本增加,關鍵是時間成本可能是企業(yè)不能承受的。所以,選擇具備云、端、側完整能力的平臺可以減少很多不必要的重復工作。其次,要選擇一個立足于長遠發(fā)展的生態(tài)。如果生態(tài)沒有保障,那么可能很多前期的投入就會全部作廢,這是更可怕的事情。
正是基于這樣的思考,格靈深瞳選擇了鯤鵬處理器+Atlas 300加速卡,結合自創(chuàng)的業(yè)界領先的全目標(人臉、人體、車輛、非機動車)結構化算法,搭建了自己的平臺,通過系統(tǒng)調(diào)度、推理流水線優(yōu)化、內(nèi)存優(yōu)化,最終實現(xiàn)單卡支持48路視頻結構化,64路人臉識別。單機可以提供實現(xiàn)384路極致高密視頻實時分析。這其中Atlas 300 AI加速卡是一個“關鍵先生”,基于昇騰310和910 AI處理器的Atlas 300 AI加速卡提供多種數(shù)據(jù)精度,適用于人工智能訓練和推理場景。
“我們業(yè)務的特點是模型非常多,各種各樣的處理需求復雜。Atlas 300有非常多的資源。” 鄧亞峰對雙方聯(lián)合打造的解決方案非常滿意,“這已經(jīng)是行業(yè)內(nèi)非常領先的一個結果?!?/b>
華為人工智能計算平臺以強大的算力,有云、邊、端豐富的產(chǎn)品,使得綜合成本更低。鄧亞峰認為更為重要的原因是,華為在生態(tài)上有非常大的決心去投入,“我們開發(fā)中間也遇到一些困難,華為非常積極地支持我們,跟我們一起聯(lián)調(diào)。
格靈深瞳去年參加了行業(yè)最具挑戰(zhàn)的“非約束性自然環(huán)境人臉照片”測試項目,根據(jù)全球最權威的人臉識別算法測試(FRVT)公布的結果來看,格靈深瞳獲得了全球第一名的成績。此外,在2019年北京市交管局組織的第一屆交通行為圖像智能識別技術競賽中,格靈深瞳的行為識別算法也獲得了全國總排名第一的佳績。
在懂懂看來,讓格靈深瞳之所以選擇華為,主要是兩個原因:
第一,華為Atlas智能計算平臺的強算力和完整性。這是基于華為昇騰系列AI處理器和業(yè)界主層異構計算部件,通過模塊、板卡、小站、服務器、集群豐富的產(chǎn)品形態(tài),打造面向“端、邊、云”的全場景AI基礎設施方案,可廣泛用于平安城市、智能交通、智慧醫(yī)療、AI推理等領域。
第二,是華為開放的生態(tài)以及對生態(tài)伙伴不遺余力的支持。華為Atlas智能計算平臺支持業(yè)界主流框架,方便易用的代碼遷移和模型轉(zhuǎn)換工具,通過靈活的合作方式與業(yè)界ISV共建、共贏。也就是說,選擇了華為Atlas智能計算平臺,就是選擇了一個開放的標準,選擇了更多的合作伙伴,選擇了更多的機會。
如果人工智能是一場長跑,那么選擇一個最好的合作伙伴才是跑到終點的必要條件。對于格靈深瞳而言,華為Atlas人工智能計算平臺就是那個陪伴的“關鍵先生”。
請登錄以參與評論
現(xiàn)在登錄