在人工智能浪潮中,商湯、云從、依圖、曠視和格靈深瞳作為中國(guó)計(jì)算機(jī)視覺(jué)領(lǐng)域的代表性公司,均以深度學(xué)習(xí)技術(shù)為核心,但在算法實(shí)現(xiàn)手段、技術(shù)路徑及產(chǎn)品應(yīng)用上各有側(cè)重與優(yōu)勢(shì)。以下將分別探討這五家公司在深度學(xué)習(xí)算法實(shí)現(xiàn)上的差異,以及它們?cè)趹?yīng)用軟件服務(wù)方面的產(chǎn)品優(yōu)勢(shì)。
一、 算法實(shí)現(xiàn)手段與技術(shù)路徑差異
- 商湯科技 (SenseTime)
- 實(shí)現(xiàn)手段:以其強(qiáng)大的原創(chuàng)算法研究和超大規(guī)模計(jì)算基礎(chǔ)設(shè)施(如SenseParrots訓(xùn)練框架)著稱(chēng)。商湯強(qiáng)調(diào)“大模型+大數(shù)據(jù)”驅(qū)動(dòng),在基礎(chǔ)模型(如人臉識(shí)別、圖像分類(lèi)、目標(biāo)檢測(cè))的通用性和精度上投入巨大,并通過(guò)自研的模型壓縮與優(yōu)化技術(shù)(如模型剪枝、量化)適配不同場(chǎng)景。其算法迭代速度快,平臺(tái)化能力強(qiáng)。
- 技術(shù)特點(diǎn):注重底層技術(shù)平臺(tái)化,算法覆蓋范圍廣,通用性強(qiáng)。
- 曠視科技 (Megvii)
- 實(shí)現(xiàn)手段:核心優(yōu)勢(shì)在于其自研的深度學(xué)習(xí)框架“Brain++”(包括MegEngine訓(xùn)練框架、MegCompute計(jì)算平臺(tái)、MegData數(shù)據(jù)管理)。曠視強(qiáng)調(diào)算法、算力、數(shù)據(jù)的協(xié)同優(yōu)化,通過(guò)軟硬一體化的思路(如“算法定義硬件”)來(lái)提升算法效率和部署效果。在人臉識(shí)別、人體分析、物體檢測(cè)等領(lǐng)域有深厚積累,尤其在動(dòng)態(tài)、復(fù)雜場(chǎng)景下的算法魯棒性上有突出表現(xiàn)。
- 技術(shù)特點(diǎn):軟硬協(xié)同,注重端到端的算法生產(chǎn)與部署效率,框架級(jí)能力突出。
- 云從科技 (CloudWalk)
- 實(shí)現(xiàn)手段:以“人機(jī)協(xié)同”為核心戰(zhàn)略,算法實(shí)現(xiàn)上強(qiáng)調(diào)與業(yè)務(wù)流程的深度結(jié)合。云從在跨鏡追蹤(ReID)、3D結(jié)構(gòu)光人臉識(shí)別等具體技術(shù)點(diǎn)上具有優(yōu)勢(shì),其算法設(shè)計(jì)注重實(shí)際應(yīng)用場(chǎng)景中的準(zhǔn)確率與誤報(bào)率平衡。相比純粹的算法研究,更側(cè)重于將計(jì)算機(jī)視覺(jué)技術(shù)與語(yǔ)音識(shí)別、自然語(yǔ)言處理等多模態(tài)技術(shù)融合,服務(wù)于具體行業(yè)解決方案。
- 技術(shù)特點(diǎn):聚焦“人機(jī)協(xié)同”落地,算法與行業(yè)知識(shí)結(jié)合緊密,多模態(tài)融合能力強(qiáng)。
- 依圖科技 (Yitu Technology)
- 實(shí)現(xiàn)手段:以追求極致算法精度和效率聞名,尤其在醫(yī)療影像、城市安防領(lǐng)域。依圖的算法實(shí)現(xiàn)強(qiáng)調(diào)對(duì)問(wèn)題本質(zhì)的深刻理解和數(shù)學(xué)建模,早期在人臉識(shí)別競(jìng)賽中多次以極高精度奪冠。其技術(shù)路徑不僅限于深度學(xué)習(xí),也結(jié)合了傳統(tǒng)計(jì)算機(jī)視覺(jué)方法進(jìn)行優(yōu)化。在算法層面,注重在小數(shù)據(jù)或標(biāo)注困難場(chǎng)景下的性能表現(xiàn),以及算法的可解釋性。
- 技術(shù)特點(diǎn):追求極致精度與效率,技術(shù)融合(深度學(xué)習(xí)+傳統(tǒng)CV)能力強(qiáng),在垂直領(lǐng)域算法深度深。
- 格靈深瞳 (DeepGlint)
- 實(shí)現(xiàn)手段:核心技術(shù)優(yōu)勢(shì)在于大范圍場(chǎng)景下的視頻結(jié)構(gòu)化分析與行為識(shí)別。其算法實(shí)現(xiàn)重點(diǎn)在于對(duì)海量視頻流的實(shí)時(shí)處理與分析,特別是在車(chē)輛識(shí)別、人體動(dòng)作與行為分析、跨攝像頭追蹤等領(lǐng)域。格靈深瞳的算法更側(cè)重于解決實(shí)際安防、交通場(chǎng)景中的大規(guī)模、復(fù)雜動(dòng)態(tài)目標(biāo)的檢測(cè)、識(shí)別與關(guān)聯(lián)問(wèn)題,在算法工程化與系統(tǒng)集成方面有較多積累。
- 技術(shù)特點(diǎn):專(zhuān)注于大規(guī)模視頻結(jié)構(gòu)化與行為分析,在動(dòng)態(tài)場(chǎng)景、遠(yuǎn)距離識(shí)別方面有特色,工程落地能力強(qiáng)。
二、 應(yīng)用軟件服務(wù)與產(chǎn)品優(yōu)勢(shì)
- 商湯科技
- 產(chǎn)品優(yōu)勢(shì):提供覆蓋廣泛的標(biāo)準(zhǔn)化SDK、API以及行業(yè)解決方案平臺(tái)(如SenseFoundry方舟城市開(kāi)放平臺(tái)、SenseMARS火星混合現(xiàn)實(shí)平臺(tái))。優(yōu)勢(shì)在于平臺(tái)化、生態(tài)化能力強(qiáng),產(chǎn)品線豐富,從智慧城市、智能手機(jī)、自動(dòng)駕駛到元宇宙均有布局,易于為客戶提供“一站式”AI賦能。
- 曠視科技
- 產(chǎn)品優(yōu)勢(shì):以“AIoT”產(chǎn)品體系為核心,軟件服務(wù)緊密?chē)@其硬件產(chǎn)品(如智能攝像頭、傳感器、機(jī)器人)。其優(yōu)勢(shì)在于軟硬一體化的解決方案,如智慧物流(河圖操作系統(tǒng))、智慧建筑、智慧城市大腦等,能夠提供從感知到?jīng)Q策的閉環(huán)服務(wù),在供應(yīng)鏈、物流倉(cāng)儲(chǔ)領(lǐng)域具有顯著優(yōu)勢(shì)。
- 云從科技
- 產(chǎn)品優(yōu)勢(shì):聚焦智慧金融、智慧治理、智慧出行、智慧商業(yè)四大賽道。其優(yōu)勢(shì)在于深入行業(yè)業(yè)務(wù)流程的“人機(jī)協(xié)同”操作系統(tǒng)(CWOS)和解決方案,例如在銀行網(wǎng)點(diǎn)的身份認(rèn)證與風(fēng)控、機(jī)場(chǎng)的智慧航旅服務(wù)、城市治理的一網(wǎng)統(tǒng)管平臺(tái)等,更注重與客戶業(yè)務(wù)系統(tǒng)的無(wú)縫集成和效率提升。
- 依圖科技
- 產(chǎn)品優(yōu)勢(shì):在醫(yī)療健康與城市安全兩大領(lǐng)域形成深度壁壘。在醫(yī)療領(lǐng)域,其“care.ai”系列產(chǎn)品(如胸部CT智能輔助診斷系統(tǒng))已進(jìn)入臨床實(shí)踐,算法精度獲得專(zhuān)業(yè)認(rèn)可。在智慧城市領(lǐng)域,其“求索”芯片及相應(yīng)解決方案,致力于提供高密度、高效率的智能計(jì)算服務(wù)。優(yōu)勢(shì)在于垂直領(lǐng)域的專(zhuān)業(yè)深度和高可靠性。
- 格靈深瞳
- 產(chǎn)品優(yōu)勢(shì):深耕城市管理、智慧金融、商業(yè)零售三大領(lǐng)域。其優(yōu)勢(shì)產(chǎn)品包括皓目行為分析儀、威目視圖大數(shù)據(jù)平臺(tái)、深瞳大腦平臺(tái)等,特別擅長(zhǎng)于利用視頻分析技術(shù)進(jìn)行客流統(tǒng)計(jì)、軌跡追蹤、異常行為預(yù)警、車(chē)輛識(shí)別等。在體育健康、零售洞察等新興場(chǎng)景也有應(yīng)用,產(chǎn)品落地性強(qiáng),場(chǎng)景理解深入。
****:
五家公司雖同處CV賽道,但技術(shù)路徑各異:商湯重平臺(tái)與廣度,曠視重軟硬協(xié)同與效率,云從重人機(jī)交互與流程,依圖重垂直精度與深度,格靈深瞳重視頻結(jié)構(gòu)化與行為分析。在產(chǎn)品應(yīng)用上,它們分別依托自身技術(shù)特點(diǎn),在智慧城市、金融、醫(yī)療、零售、物流等不同細(xì)分領(lǐng)域構(gòu)建了差異化的競(jìng)爭(zhēng)優(yōu)勢(shì),共同推動(dòng)著人工智能技術(shù)與實(shí)體經(jīng)濟(jì)的深度融合。