法商維數(Vsora)–人工智慧(AI)、數位通訊和先進駕駛輔助系統(ADAS)應用的高性能矽智財知識產權(IP)解決方案提供商,正式發布了其首款千兆浮點運算(PetaFLOPS)運算平台,可協助晶片供應商加速第四等級(L4)和第五等級(L5)自動駕駛汽車晶片設計。
Vsora是一家科技新創公司,在無線通訊的領域上,累積數十年數位訊號處理器(DSP)的設計經驗,包括最新一代行動通訊網路標準5G技術,其最新的DSP設計提供可程式化、可擴展、可利用軟體配置的多核設計,結合通訊DSP及AI加速的雙重功能,適用於自動駕駛晶片設計產業。
Vsora執行長兼創始人Khaled Maalej表示:「我們很榮幸成為第一個在設計L4/L5自動駕駛汽車的晶片設計中提供強大運算能力、便攜性和經濟性的方案供應商,AD1028是公司提供的一系列平台中的首款產品,可為全球汽車製造商提供L4/L5等級功能的早期商業能力。」
Vsora所推出的AD1028是一個IP核心架構,內嵌首個PetaFLOPS千兆浮點運算平台,借助於該高效能運算設計設計的低功耗晶片L4/L5控制單元,可大幅加速L4/L5自動駕駛汽車晶片設計行業縮短設計週期。
AD1028是一個可程式化解決方案,結合了自動駕駛所需要的數位訊號處理(DSP)以及機器學習(ML)功能,其採用強大的多核DSP和AI架構,無須額外的DSP協同處理器及硬體加速器,並提供了軟體可程式化才能實現的靈活性。
當前的自駕車產業正面臨不少技術上的挑戰。在L4等級的自駕車中,駕駛仍得操控車輛,但在L5等級必須實現脫離人類控制的全自動駕駛能力,因此業界都在殫精竭慮,希望實現L4或L5自動駕駛的高速精準運算能力。
首先,車輛必須學習行駛過程中的各種環境特徵以自定行駛方案,這個過程稱為「感知」。這個過程需要使用最先進的DSP技術來處理感應器所收集的大量資訊,不僅包括雷達、光達、相機及超音波感應器的組合,也要配合全球導航衛星系統(GNSS)的數據、5G網絡訊號、蜂巢式車聯網通訊(Cellular Vehicle-to-Everything, C-V2X)的數據。
其次,在實際行駛中,車輛系統必須頻繁且快速地進行更新,以確保安全平穩地行駛,因為突發狀況可能隨時在一秒之內就會發生。 在處理收集到的資訊之前,必須對感測器數據進行快速過濾,以消除噪音和其他更多更複雜的干擾訊號,這就需要將先進的DSP演算法與AI結合使用,透過感測器融合(Sensor Fusion)的過程,藉以整合資訊並過濾產生出乾淨正確的數據。
為了解決上述問題,Vsora設計了一種運算配置方式,通過共享的超高頻寬記憶體,使DSP及深層神經網路(DNN)得以加速交換數據並結合在一起,允許在感知階段即可同步進行前期訊號處理和AI演算法,並在規劃階段可立即採集到有效數據,同時透過大幅縮短數據往返於記憶體的路徑,明顯降低了延遲和功耗。
AD1028的模組架構非常適合L4/5自駕車所需強大運算的挑戰性。 AD1028具有1,028 TeraFLOPS 千兆浮點運算能力,運行頻率為2GHz,在Yolo-v3上處理處理800萬像素的圖像僅需7毫秒(ms),處理Full HD圖像則不超過1.6毫秒,研發人員無須更改演算法,即可自行配置訊號處理及AI演算法的處理架構。
對業界來說,這無疑是一個很大的進展。2019年,三菱電機研究實驗室(Mitsubishi Electric Research Laboratories)發表了一篇論文,其PF試驗使用500個粒子,耗時5毫秒才能完成任務; 相較之下,VSORA AD1028可以處理包含1600萬個粒子,換算起來可以在不到8毫秒內處理800萬個單元。
AD1028是Vsora系列產品中首款具有多種處理能力的產品,採用7奈米製程,邏輯面積為35mm2,功耗小於35瓦。在其他系列產品中,AD514具有514千兆浮點運算(TFLOPS)能力,AD2056具有2056千兆浮點運算(TFLOPS)千兆浮點運算能力,以上兩款產品預計今年底之前正式推出。