Blog

A 3D gépi látás robbanásszerű növekedésre kész.

Nov 05, 2025 Hagyjon üzenetet

Az intelligencia korszaka felé haladva nem csak mesterséges intelligencia technológiára van szükség, hanem egy sor számítástechnikai, érzékelési és kapcsolódási technológiára is, amelyek kompatibilisek az AI-val. Ezek közül a 3D-s érzékelés különösen fontos. Ha a mai legnépszerűbb területeket nézzük, mint például az intelligens robotok, az autonóm járművek, az XR (beleértve a VR-t, az AR-t és az MR-t), valamint a metaverzum, amely jelenleg a legfelkapottabb téma, mind 3D-s érzékelést igényelnek.

 

A 3D-s gépi látást azonban sokáig főként az intelligens városok felügyeletére alkalmazták, és több területen nem találtak alkalmazást. Ennek számos oka van, többek között a költségek, a technológiai érettség és a 3D-s látás chipek használatának akadályai.

 

A 2D-ről a 3D-re való átálláshoz és a megszerzett információ minőségének és mennyiségének ugrásszerű növekedéséhez hatalmas technológiai szakadékot kell áthidalni. Ezek a piacok csak a kiforrott 3D gépi látástermékekkel tudják gyorsan és nagy léptékben átvenni a 3D gépi látást. A világ egyetlen chipes megoldása, amely integrálja a 3D mélységérzékelést, a SLAM-et (Simultaneous Localization and Mapping) és az AI-képességeket, ha a kínai piacon népszerűsítik és alkalmazzák, fel fogja gyorsítani a 3D gépi látás robbanásszerű növekedését.

A 3D Machine Vision üdvözli a robbanásszerű növekedés lehetőségét

 

Miért nehéz a 3D gépi látást népszerűsíteni?

A neves pszichológus, Treicher egyszer ellenőrizte az adatokat: az emberek által megszerzett információk 83%-a látásból, 11%-a pedig hallásból származik. Nyilvánvaló, hogy a gépi intelligencia eléréséhez és az intelligens korszak felé való elmozduláshoz a vizuális információ, különösen a 3D-s látás, kulcsfontosságú.

 

Az idei év legfelkapottabb témája, a metaverzum például a 3D-látáshoz szorosan kapcsolódó XR-t (Extended Reality) igényel a valós világ virtuális világba való leképezéséhez. A VR 2015-ben befektetési fellendülést élt át, és a következő évet, 2016-ot a "VR évének" nevezték.

 

Azonban olyan problémák miatt, mint a VR-eszközök okozta utazási betegség és a nem megfelelő tartalom, 2016 nem lett a „VR éve”. Csak 2021-ben, amikor a Meta 10 millió Oculus Quest 2 VR headsetet adott el, az iparág úgy gondolta, hogy az XR a robbanásszerű növekedés új időszakába lépett.

 

Az autonóm járművek és az intelligens robotok szintén tipikus területek, amelyek 3D-s látást igényelnek, de mindegyikük kihívásokkal néz szembe. Az autonóm járművek területén a tisztán 2D-s látási megoldások használata, legyen szó kameráról vagy lidarról, hatalmas mennyiségű adatot igényel, ami óriási költségkihívásokat jelent. A robotokban megkívánt 3D-s látástechnológia nagy léptékben is nehezen alkalmazható technikai és fejlesztési nehézségek miatt.

 

"A 3D-s látás nem csak chipek vagy algoritmusok kérdése, hanem olyan kapcsolódó kérdéseket is magában foglal, mint az optika, a szerkezet és a hőleadás. A chipekből és algoritmusokból álló összetett technikai rendszer miatt a 3D-s látás chipek és megoldások nagyon magas műszaki korlátokkal rendelkeznek, több időt, technológiát és tehetségbefektetést igényelnek."

 

"Akár egy jó technológia, akár egy sikeres termék végső soron az egész ökoszisztéma fejlődését vezérelheti, hatalmas szakadék tátong a kettő között, és ez a különbség valószínűleg 90%-ban a szoftverek leterheltségének köszönhető." Bai Yi továbbá kijelentette: "Csak egy komplett rendszerszintű-megoldás biztosításával lehet kielégíteni a piaci igényeket. Hiszünk abban is, hogy a binokuláris 3D-s látás csökkenti a mesterséges intelligencia gépi látás költségeit." A magas technikai akadály ezen a területen azt jelenti, hogy csak néhány rendkívül erős műszaki és termékképességgel rendelkező cég tud benne működni, ami hátráltatja a 3D látástechnika gyors népszerűsítését. Jó példa erre, hogy az Apple 360 ​​millió dollárért felvásárolta az izraeli 3D chipeket gyártó PrimeSense céget, majd ezt követően szabadalmaztatta a technológiát, lehetővé téve a Face ID 3D arcfelismerő funkciót az iPhone-okon. Más gyártók, akik nem rendelkeznek hasonló technológiával és termékbeszállítókkal, nehezen tudják megvalósítani az Appleéhez hasonló 3D felismerési funkciókat telefonjaikon.

 

Az XR, az autonóm járművek és az intelligens robotok területén a piacon a 3D vizuális érzékelés AI chip megjelenése tapasztalható, amely több funkciót is integrál, ami potenciálisan a 3D látás felfutását idézi elő ezeken a területeken.

 

A 3D Machine Vision készen áll az áttörésre

Ezeknek a funkcióknak egyetlen chipre történő integrálása nagy kihívást jelent, mivel számos technológia egyidejű integrációját igényli, beleértve a számítógépes látást, a mesterséges intelligenciát, az optikát, a rendszerarchitektúrát, a beágyazott rendszerszoftvert, az élszámítást és a chiptervezést. Az NU4000, amely az Inuitive egyedi 3D-s érzékelő technológiáját SLAM-mel és aszinkron idővetemítési technológiával egyesíti (amely köztes képkockákat tud generálni, ha a videó képkockasebessége nem elegendő, csökkenti a képi remegést és szédülést, és kevesebb, mint 1 ezredmásodperces késleltetést ér el a mozgástól a képernyőre, amióta a piac felismerte a piacot), és integrálja az AI-t.

 

Az Intelligens Robot 3D Vision lesz az első, amely felrobban

"Még a legjobb technológiát sem lehet megvalósítani, ha a költségek túl magasak, vagy nincs piacfókusz" - szögezte le Qu Guancheng. "Az ok, amiért először a kínai piacon vezettük be a robotmodult, egyrészt az, hogy a világjárvány miatt a szolgáltató robotok iránti piaci kereslet robbanásszerű növekedést mutatott. Másrészt a piacvezetők stratégiai kiigazításai is nagy lehetőségeket teremtettek számunkra."

 

A "Kína Robotipari Fejlesztési Jelentés (2021)" szerint a globális robotpiac mérete 2021-ben várhatóan eléri a 33,58 milliárd dollárt. 2021-ben a kínai szolgáltató robotpiac mérete eléri a 30,26 milliárd jüant, ami magasabb, mint a globális szolgáltató robotpiac növekedési üteme; 2023-ra az olyan feltörekvő forgatókönyvek és termékek gyors fejlődésével, mint a látás-vezérelt robotok és a társkiszolgáló robotok, a kínai kiszolgálórobot-piac mérete várhatóan meghaladja a 60 milliárd jüant.

 

"A C158-as modulunk egy általános-célú chipként és egy dedikált modulként értelmezhető. Az intelligens robotok területén a legtöbb ügyfél igényeinek megfelel, míg más területeken az ügyfelek dedikált modulokat igényelnek." Az NU4000 chipünk sokoldalúsága miatt az ezen az általános célú{5}}chipre épülő modulok iterációs ciklusa mindössze néhány hónap, ami sokkal rövidebb, mint a chip iterációs ciklusa. Ezért a modulok folyamatos iterálásával nem csak ugyanazon piac igényeit tudjuk jobban kielégíteni, hanem új piacokra is terjeszkedhetünk.

 

Bármely új technológia érettsége és széles körű alkalmazása különböző tényezők együttes hatását igényli. A technológiai érettség és a költségek két kulcsfontosságú tényező. Korábban a 3D-s gépi látástermékek jelentős kihívásokkal szembesültek a nagyszabású-alkalmazások során a nem megfelelő termékintegráció és a használat nehézségei miatt.

 

A belátható 3-5 éven belül a 3D gépi látást olyan területeken is széles körben alkalmazzák majd, mint az alacsony sebességű vezetés és a VR/AR, és más számítástechnikai, érzékelő- és kapcsolódási technológiákkal együtt a 3D gépi látás robbanásszerű növekedését fogja előmozdítani, ami egy intelligensebb korszakhoz vezet.

A szálláslekérdezés elküldése