Przyszłość 18 min

Koło zamachowe danych, którego nikt nie mierzy: 10 000 chińskich robotów kontra 1500 amerykańskich

Autor: Robots In Life
data China AI training flywheel machine-learning

W skrócie

Każdy wdrożony robot humanoidalny generuje dane o tym, jak działa rzeczywisty świat. Chiny mają prawie siedem razy więcej takich robotów pracujących w fabrykach, magazynach i hotelach niż Stany Zjednoczone. Konsekwencje dla treningu AI są ogromne, ale zależność między wolumenem a inteligencją nie jest tak prosta, jak się wydaje.

W Dolinie Krzemowej krąży teza, która brzmi mniej więcej tak: ktokolwiek wdroży najwięcej robotów w świecie rzeczywistym, zbierze najwięcej danych ze świata rzeczywistego. Te dane wytrenują najlepsze modele AI. Lepsze modele uczynią roboty bardziej zdolnymi, co doprowadzi do większej liczby wdrożeń, które wygenerują więcej danych. Koło zamachowe. Skumulowana przewaga. Tego rodzaju pętla zwrotna, która uczyniła Google nie do pokonania w wyszukiwaniu, dała Tesli przewagę w jeździe autonomicznej i zamieniła AWS w maszynę do drukowania pieniędzy.

Jeśli ta teza jest słuszna, konsekwencje dla wyścigu robotów humanoidalnych są jaskrawe. Chiny mają ponad 10 000 robotów humanoidalnych działających w rzeczywistych środowiskach już teraz. Stany Zjednoczone mają około 1 500. To nie jest luka. To przepaść.

Ale oto pytanie, które nikt zdaje się nie zadawać wystarczająco uważnie: czy teza o kole zamachowym danych faktycznie się sprawdza w przypadku robotyki humanoidalnej? Czy więcej danych zawsze jest lepsze? Czy też zależność między wdrożonymi robotami a możliwościami AI jest bardziej skomplikowana, niż sugeruje schludna narracja?

Wdrozone roboty humanoidalne generujace dane z rzeczywistego swiata (I kw. 2026)

~10 000+

Chiny lacznie

Unitree, AgiBot, UBTECH, Fourier i inni

~1 500

Stany Zjednoczone lacznie

Tesla, Boston Dynamics, Agility, Figure, Apptronik

6,7x

Przewaga wolumenowa Chin

Wskaznik wdrozonych jednostek

Argumenty za kołem zamachowym

Logika koła zamachowego danych jest zapożyczona z oprogramowania i stosowana do maszyn fizycznych. W cyfrowej AI wzorzec jest dobrze ugruntowany. Google stało się lepsze w wyszukiwaniu, bo więcej użytkowników generowało więcej zapytań, co dawało więcej sygnałów o tym, które wyniki były przydatne. Facebook stał się lepszy w rankingu treści, bo więcej postów i więcej zaangażowania dawało jego algorytmom więcej przykładów do nauki. OpenAI stało się lepsze w języku, bo więcej rozmów oznaczało więcej danych wzmocnieniowych.

Robotyczna wersja tego argumentu przebiega następująco. Każdy robot humanoidalny działający w fabryce, magazynie lub holu hotelowym jest urządzeniem do zbierania danych. Jego kamery rejestrują sceny wizualne. Enkodery jego stawów zapisują pozycje silników. Czujniki siły mierzą kontakt z obiektami. IMU śledzi balans i orientację. Wszystkie te dane, surowe, zaszumione i niechlujne, uchwytują coś istotnego: jak to naprawdę jest poruszać się po fizycznym świecie i wchodzić z nim w interakcje.

To są dane, które trenują to, co badacze nazywają modelami fundacyjnymi dla robotyki - dużymi sieciami neuronowymi, które uczą się uogólnionego fizycznego rozumienia z różnorodnych doświadczeń ze świata rzeczywistego. RT-2 od Google DeepMind i jego następniki, Pi-0 od Physical Intelligence, duże modele zachowania od Toyota Research Institute - wszystkie one spragnione są dokładnie tego rodzaju danych.

~50 TB/dzien Szacowana ilość danych z rzeczywistego świata generowanych przez chińską flotę wdrożonych humanoidów

I tutaj liczby Chin zaczynają mieć znaczenie. Jeśli założymy, że każdy wdrożony humanoid generuje około 5 gigabajtów danych sensorycznych na dzień roboczy (konserwatywne szacowanie biorąc pod uwagę strumienie kamer, skany LIDAR i strumienie proprioceptywne), to flota Chin licząca 10 000+ robotów produkuje około 50 terabajtów danych istotnych dla treningu każdego dnia. Amerykańska flota generuje może 7,5 terabajta. W ciągu roku ta luka kumuluje się do około 15 petabajtów wobec 2,7 petabajta.

W AI ilość danych była historycznie silnym predyktorem jakości modeli. Prawa skalowania rządzące dużymi modelami językowymi, po raz pierwszy sformalizowane przez OpenAI i później udoskonalone przez badania Chinchilla od DeepMind, sugerują, że wydajność modelu poprawia się przewidywalnie w miarę wzrostu danych treningowych - przynajmniej do pewnego punktu. Jeśli te same prawa skalowania mają zastosowanie do fundacyjnych modeli robotycznych, przewaga danych Chin mogłaby bezpośrednio przełożyć się na przewagę AI.

Szacowane wdrozone jednostki humanoidalne wg firmy (I kw. 2026)

Unitree
5,500 jednostek
AgiBot
5,200 jednostek
UBTECH
1,000 jednostek
Boston Dynamics
1,000 jednostek
Leju Robotics
650 jednostek
Tesla
500 jednostek
Engine AI
400 jednostek
Fourier
350 jednostek
Agility
300 jednostek
Figure AI
200 jednostek

Precedens autonomicznej jazdy

Najsilniejszy dowód na tezę o kole zamachowym danych w robotyce pochodzi z autonomicznej jazdy - dziedziny, w której Chiny i Stany Zjednoczone prowadzą naturalny eksperyment od niemal dekady.

Autopilot Tesli i systemy Full Self-Driving znacząco skorzystały z danych generowanych przez miliony pojazdów Tesli na drogach. Do 2025 roku Tesla zakumulowała ponad 10 miliardów mil danych z jazdy w rzeczywistym świecie - liczby, której żaden konkurent nie mógł dorównać. Ta przewaga danych pozwoliła Tesli trenować sieci neuronowe, które obsługują przypadki brzegowe, rzadkie zdarzenia i nowe scenariusze, których mniejsze zestawy danych po prostu nie są w stanie reprezentować.

Waymo, mimo posiadania znacznie mniejszej liczby pojazdów, zrekompensowało swoją niekorzystną pozycję danych przez wyższy jakościowo. Pojazdy Waymo niosą więcej czujników, używają precyzyjniejszego oznaczania i działają w staranniej zmapowanych środowiskach. Wynikiem jest to, że autonomiczne osiągi Waymo w jego domenach operacyjnych są prawdopodobnie najlepsze na świecie, nawet przy ułamku danych flotowych Tesli.

W Chinach program Apollo firmy Baidu opowiada jeszcze inną wersję tej historii. Baidu eksploatowało tysiące pojazdów autonomicznych w chińskich miastach, gromadząc masywne zestawy danych o chińskich warunkach drogowych, wzorcach ruchu i zachowaniach kierowców. Te dane sprawiły, że Apollo stał się naprawdę konkurencyjny na rynku chińskim, nawet gdy jego technologia była początkowo uznawana za gorszą od Waymo. Wdrożenie na dużą skalę, w konkretnym środowisku, w którym pojazdy działają, stworzyło zlokalizowaną przewagę danych, która okazała się cenniejsza niż sama techniczna wyrafinowanie.

Argumenty przeciw kołu zamachowemu (przynajmniej tej jego wersji)

Narracja koła zamachowego danych ma wbudowane trzy krytyczne założenia, z których każde zasługuje na dokładniejszy ogląd.

Założenie 1: Wszystkie dane robotów są użytecznymi danymi treningowymi

Pierwsze założenie jest takie, że więcej wdrożonych robotów oznacza więcej użytecznych danych treningowych. To brzmi oczywisto, ale rozkłada się pod wpływem analizy.

Większość z 10 000+ wdrożonych chińskich robotów humanoidalnych wykonuje wysoce powtarzalne zadania w kontrolowanych środowiskach. Jednostka AgiBot odbierająca ten sam rodzaj pudełka z tej samej taśmy przenośnikowej w tej samej fabryce rzeczywiście generuje dane, ale po pierwszym tysiącu powtórzeń marginalna wartość każdego dodatkowego punktu danych drastycznie spada. Nie potrzeba 10 milionów przykładów tej samej operacji podnoszenia i odkładania, by wytrenować model. Potrzeba 10 milionów przykładów 10 000 różnych operacji.

To jest problem różnorodności. W uczeniu maszynowym jest dobrze ugruntowane rozróżnienie między ilością danych a ich różnorodnością. Modele trenowane na dużych, ale jednorodnych zbiorach danych uczą się wąskich umiejętności bardzo dobrze, ale słabo generalizują. Modele trenowane na mniejszych, ale różnorodnych zbiorach danych często je przewyższają w nowych zadaniach.

~85% Szacowany udzial chińskich wdrozen humanoidalnych w powtarzalnych zadaniach logistycznych lub montazowych

Badacze z IEEE Spectrum i MIT CSAIL argumentowali, że prawdziwym wąskim gardłem w robotycznej AI nie jest wolumen danych, lecz ich różnorodność. Robot humanoidalny spędzający osiem godzin dziennie w tym samym korytarzu magazynowym generuje mniej użytecznych danych treningowych niż humanoid, który spędza godzinę w magazynie, godzinę w kuchni, godzinę na budowie i godzinę w szpitalu. Szerokość środowisk liczy się bardziej niż głębokość powtórzeń.

Założenie 2: Dane z rzeczywistego świata są konieczne dla postępu AI

Drugie założenie jest takie, że dane z rzeczywistego świata są głównym motorem postępu AI w robotyce. Było to z pewnością prawdą pięć lat temu, ale staje się coraz mniej prawdziwe z każdym rokiem.

Symulacja uległa dramatycznej poprawie. Nowoczesne silniki fizyki, takie jak Isaac Sim od NVIDIA, MuJoCo od Google DeepMind i różne własnościowe platformy, mogą generować syntetyczne dane treningowe przy ułamku kosztów i czasu wymaganego do zbierania ich w świecie rzeczywistym. Co ważniejsze, symulacja pozwala na systematyczne eksplorowanie przypadków brzegowych i trybów awarii, z którymi wdrożenia w rzeczywistym świecie rzadko się spotykają.

Problem transferu sim-to-real, długo uważany za piętę achillesową treningu opartego na symulacji, znacznie się poprawił. Badania opublikowane w Nature w 2024 roku wykazały pomyślny transfer sim-to-real bez wcześniejszego treningu dla złożonych zadań manipulacji, co oznacza, że polityki wytrenowane wyłącznie w symulacji działały w rzeczywistym świecie bez żadnego dostrajania na danych rzeczywistych. To jeszcze nie jest norma, ale nie jest już science fiction.

Zbieranie danych: świat rzeczywisty vs symulacja

Koszt na godzinę treningu

Flota w terenie 50-200 USD
Symulacja 0,10-1,00 USD

Świat rzeczywisty obejmuje amortyzację robotów, energię i koszty obiektu

Różnorodność danych

Flota w terenie Ograniczona środowiskami wdrożeń
Symulacja Nieograniczone generowanie scenariuszy

Pokrycie przypadków brzegowych

Flota w terenie Z definicji rzadkie
Symulacja Systematycznie generowane

Realizm fizyczny

Flota w terenie Doskonały (to rzeczywistość)
Symulacja Poprawia się, ale niedoskonały

Dokładność dynamiki kontaktu

Flota w terenie Dane rzeczywiste
Symulacja Aproksymowane

Szybkość skalowania

Flota w terenie Ograniczona przez sprzęt
Symulacja Ograniczona przez moc obliczeniową

Jakość adnotacji

Flota w terenie Wymaga ręcznego oznaczania
Symulacja Automatyczne etykiety rzeczywiste

Jeśli symulacja nadal będzie się poprawiać w obecnym tempie, wartość dużej floty wdrożeń w terenie jako mechanizmu zbierania danych będzie malec. Nadal będziesz potrzebować pewnych danych z rzeczywistego świata do kalibracji i walidacji, ale większość treningu mogłaby odbywać się w symulacji. To znacząco zmniejszyłoby przewagę wolumenową Chin.

Założenie 3: Przewaga danych kumuluje się w nieskończoność

Trzecie założenie jest takie, że przewagi w danych kumulują się w czasie w dynamice zwycięzca bierze wszystko. W modelach językowych okazało się to w większości fałszywe. GPT-4, Claude, Gemini i kilka innych modeli osiągnęło porównywalną wydajność pomimo dostępu do bardzo różnych zestawów danych treningowych. Powodem jest to, że powyżej pewnej skali dodatkowe dane przynoszą malejące zwroty, a ulepszenia algorytmiczne mogą zastępować ilość danych.

Istnieje wszelki powód, by oczekiwać tego samego wzorca w robotyce. Projekt Open X-Embodiment, współpraca 21 instytucji, w tym Google DeepMind, Stanford i UC Berkeley, wykazała, że różnorodny zestaw danych zebrany z wielu różnych typów robotów i środowisk może trenować model generalistyczny, który przewyższa modele trenowane na danych jednego robota, niezależnie od wielkości jego floty. Konsekwencją jest to, że dzielenie się danymi i współpraca mogą neutralizować przewagę dużej własnej floty.

Jak naprawdę wyglądają te dane

Liczby same w sobie nie opowiadają pełnej historii. Rodzaj danych, jakie generują roboty w każdym kraju, ma znaczenie równe wolumenowi.

Chińska flota wdrożonych humanoidów jest skoncentrowana w kilku kategoriach. Roboty AgiBot pracują głównie na liniach produkcyjnych motoryzacyjnych dla BYD i SAIC Motor. Jednostki Unitree G1 są podzielone między instytucje badawcze, środowiska edukacyjne i lekkie wdrożenia komercyjne. Jednostki UBTECH Walker S obsługują fabryki samochodów i środowiska hotelowe. Wspólnym wątkiem jest to, że te wdrożenia mają tendencję do bycia ustrukturyzowanymi i przewidywalnymi.

Amerykańskie wdrożenia są mniejsze wolumenowo, ale prawdopodobnie bardziej zróżnicowane. Jednostki Tesla Optimus działają wewnątrz własnych fabryk Tesli, wykonując zadania, które szybko ewoluują w miarę dojrzewania sprzętu Gen 3. Figure 02 od Figure AI ukończył 11-miesięczny test produkcyjny w zakładzie BMW, obsługując ponad 90 000 komponentów w różnorodnych zadaniach na linii montażowej. Digit od Agility pracuje w centrach realizacji zamówień Amazon, nawigując w dynamicznych środowiskach z ludzkimi współpracownikami. Atlas od Boston Dynamics jest w komercyjnych programach pilotażowych w wielu branżach.

Profil wdrozen: Chiny vs Stany Zjednoczone

Wielkosc floty

Chiny (~10 000) 10 000+ jednostek
Stany Zjednoczone (~1 500) ~1 500 jednostek

Roznorodnosc srodowisk

Chiny (~10 000) Umiarkowana (zdominowana przez produkcje)
Stany Zjednoczone (~1 500) Wyzsza (wielobransowa)

Roboty USA obejmuja fabryki, magazyny, realizacje zamowien, laboratoria R&D

Zlozonosc zadan

Chiny (~10 000) Glownie powtarzalne odbieranie i odkladanie
Stany Zjednoczone (~1 500) Rosnaca wieloetapowa

Wyrafinowanie modeli AI

Chiny (~10 000) Szybko sie poprawia
Stany Zjednoczone (~1 500) Aktualnie wiodace

Infrastruktura zbierania danych

Chiny (~10 000) Scentralizowana (platformy krajowe)
Stany Zjednoczone (~1 500) Rozproszona (silosy per firma)

Kultura dzielenia sie danymi

Chiny (~10 000) Zachecana przez rzad
Stany Zjednoczone (~1 500) Silosy konkurencyjne

AgiBot opublikowal zbiory danych robotycznych na otwartym zrodle

Trajektoria skalowania

Chiny (~10 000) 20 000+ jako cel na 2026 rok
Stany Zjednoczone (~1 500) 3 000-5 000 jako cel na 2026 rok

Istnieje jeden czynnik, w którym Chiny mają niedocenianą przewagę: infrastruktura danych i normy dzielenia się nimi. AgiBot opublikowało zbiory danych robotycznych na otwartym źródle na GitHub - ruch, który nie ma prawdziwego odpowiednika w Ameryce. Chiński rząd aktywnie zachęcał do dzielenia się danymi wśród krajowych firm robotycznych, tworząc coś bliższego krajowemu wspólnemu zasobowi danych niż konkurencyjnym silosom charakterystycznym dla amerykańskiej branży. Jeśli różnorodność danych jest najważniejsza, to krajowy ekosystem dzielenia się danymi z 10 000 robotów w wielu firmach może być cenniejszy niż własna flota jednej firmy.

Joker symulacyjny

Najważniejszą zmienną w debacie o kole zamachowym danych może być taka, która nie ma nic wspólnego z wdrożonymi robotami: postęp symulacji.

Platforma Isaac Sim od NVIDIA może teraz generować fizycznie realistyczne scenariusze treningowe dla robotów humanoidalnych w tempie tysięcy symulowanych godzin na godzinę czasu rzeczywistego. Google DeepMind wykazało, że modele trenowane głównie w symulacji mogą przejść na rzeczywisty sprzęt przy minimalnym dostrajaniu. Fundacyjny model Pi-0 od Physical Intelligence był trenowany na kombinacji symulowanych i rzeczywistych danych, przy czym symulowany komponent odpowiadał podobno za ponad 70% miksu treningowego.

Jeśli symulacja stanie się wystarczająco dobra, by służyć jako podstawowe środowisko treningowe, cała teza o kole zamachowym danych się załamie. Nie miałoby znaczenia, czy masz 10 000 robotów czy 1 500 w terenie, bo żadna flota nie byłaby twoim głównym źródłem danych. Twoim głównym źródłem danych byłaby farma renderowania.

Dane treningowe: symulacja vs świat rzeczywisty (szacunki, 2026)

10 000x

Przewaga szybkosci symulacji

Symulowane godziny na godzine rzeczywista

70%+

Udzial symulacji w wiodacych modelach

Pi-0, RT-2 i inne

95%

Wskaznik sukcesu transferu sim-to-real

Dla ustrukturyzowanych zadan manipulacji

To nie jest tylko teoria. Toyota Research Institute publicznie stwierdziło, że ich duże modele zachowania do manipulacji są trenowane przede wszystkim na symulowanych danych, a dane z rzeczywistego świata są używane głównie do walidacji i adaptacji domeny. Jeśli jeden z największych producentów samochodów na świecie, z głębokimi kieszeniami i dostępem do środowisk fabrycznych, doszedł do wniosku, że symulacja jest bardziej efektywnym źródłem danych niż zbieranie ich w terenie, to jest to sygnał wart zapamiętania.

Kontrargument jest taki, że symulacja jest tak dobra, jak jej silnik fizyki, a żaden silnik fizyki nie oddaje doskonale bałaganu rzeczywistego świata. Miękkie materiały deformują się nieprzewidywalnie. Płyny falują. Kurz gromadzi się na czujnikach. Zawiasy luzują się z czasem. Te subtelności są trudne do symulowania i łatwe do napotkania w świecie rzeczywistym. Między symulowaną i rzeczywistą fizyką wciąż istnieje znacząca luka, nawet jeśli ta luka maleje.

Prawdziwa przewaga, którą Chiny mogą budować

Jeśli argument o surowym kole zamachowym danych jest słabszy niż wygląda, czy to oznacza, że przewaga Chin w wdrożeniach nie ma znaczenia? Wcale nie. Oznacza to po prostu, że przewaga jest inna, niż większość ludzi zakłada.

Prawdziwą przewagą posiadania 10 000 robotów w terenie nie jest wolumen danych. To wiedza operacyjna.

Kiedy wdrożasz tysiące robotów w dziesiątkach fabryk i setkach przypadków użycia, uczysz się rzeczy, których żadna symulacja nie może nauczyć. Uczysz się, które tryby awarii rzeczywiście się zdarzają. Uczysz się, jaki harmonogram konserwacji utrzymuje roboty w ruchu. Uczysz się, jak projektować roboty, z którymi pracownicy fabryczni mogą pracować razem. Uczysz się zarządzania łańcuchem dostaw dla siłowników, baterii i czujników w skali. Uczysz się wyceny, zawierania umów, wsparcia klientów i wszystkich innych nieefektownych aspektów zamieniania technologii w biznes.

To jest wiedza, którą chińskie firmy produkujące roboty humanoidalne gromadzą w tempie, któremu amerykańskie firmy nie mogą dorównać - nie dlatego, że są mniej utalentowane, ale dlatego, że mają mniej jednostek w terenie. To ta sama przewaga, którą chińscy producenci samochodów elektrycznych budowali przez dekadę krajowych wdrożeń przed ekspansją globalną. Same samochody stawały się lepsze, ale poprawiał się też cały otaczający ekosystem produkcji, obsługi i sprzedaży.

Zalety

Rzeczywiste doswiadczenie operacyjne, ktorego zadna symulacja nie moze odtworzyc
Dojrzalosc lancucha dostaw z zarzadzania tysiącami jednostek
Pętle informacji zwrotnych od klientow napędzające iteracje sprzetu i oprogramowania
Koszty produkcji spadajace wraz z wolumenem
Rozwoj sily roboczej do wspolpracy czlowieka i robota

Ograniczenia

Wiekszosc wdrozen odbywa sie w kontrolowanych, powtarzalnych warunkach
Jakosc danych moze pozostawac w tyle za mniejszymi, bardziej oprzyrządowanymi flotami amerykanskimi
Postep symulacji moze zneutralizowac przewage danych opartą na wolumenie
Firmy amerykanskie wioda w badaniach nad modelami fundacyjnymi
Ograniczenia eksportowe moga ograniczyc globalny zasieg wdrożen China

Gdzie USA nadal ma przewagę

Amerykanski przemysł robotyki humanoidalnej ma realne zalety, ktore czysto wolumenowe porownanie danych zasłania.

Po pierwsze, ekosystem badań AI. Badania nad modelami fundacyjnymi napędzającymi inteligencję robotyczną są wciąż przytłaczająco zlokalizowane w Stanach Zjednoczonych. Google DeepMind, Physical Intelligence, OpenAI, Meta FAIR i laboratoria uniwersyteckie na Stanford, MIT, CMU i UC Berkeley tworzą architektury i metody treningowe, które definiują stan wiedzy. Chiny mają silne badania AI, ale w konkretnej poddziedzinie wcielonej AI i fundacyjnych modeli robotycznych USA przoduje.

Po drugie, przewaga obliczeniowa. Trenowanie dużych fundacyjnych modeli robotycznych wymaga ogromnych ilości mocy obliczeniowej GPU. Amerykańskie firmy mają dostęp do najnowszego sprzętu NVIDIA i infrastruktury chmurowej Amazon, Google i Microsoft. Chiny borykają się z trwającymi ograniczeniami eksportu półprzewodników, które ograniczają dostęp do chipów najnowszej generacji. To jest strukturalne ograniczenie zdolności Chin do zamieniania danych na wytrenowane modele.

Po trzecie, jakość partnerstw. Figure AI ma OpenAI. Boston Dynamics ma Google DeepMind. Apptronik ma Google DeepMind. 1X Technologies ma OpenAI. To nie są tylko loga na komunikacie prasowym. Te partnerstwa dają amerykańskim firmom robotycznym bezpośredni dostęp do najlepszych na świecie modeli językowych i wizyjnych, które są coraz częściej łączone z systemami sterowania robotami. Chińskie firmy robotyczne budują własne stosy AI, co daje im większą kontrolę, ale mniejszy dostęp do granicy.

Wynik badań AI w wcielonej robotyce (2024-2025)

73%

Udzial USA w najczesciej cytowanych pracach

Wcielona AI i uczenie sie robotow

4,5 mld USD+

Kapital VC USA w AI robotyki

Razem 2024-2025

4 z 5

Wiodace modele fundacyjne z USA

RT-2, Pi-0, Octo, SuSIE

Piec scenariuszy

Gdzie więc jesteśmy? Interakcja między wolumenem wdrożeń, jakością danych, postępem symulacji i badaniami AI tworzy zakres możliwych przyszłości. Oto pięć najbardziej prawdopodobnych.

Scenariusz 1: Koło zamachowe działa. Postęp symulacji staje się w miejscu, dane z rzeczywistego świata pozostają kluczowe, a przewaga wolumenowa Chin kumuluje się w przewagę AI do 2028-2029 roku. Chińskie roboty humanoidalne stają się najlepsze na świecie w zadaniach, do których są wdrożone, a luka staje się zbyt duża, by amerykańskie firmy mogły ją zamknąć.

Scenariusz 2: Symulacja neutralizuje lukę. Symulacja poprawia się szybciej niż oczekiwano, sprawiając że dane flotowe z rzeczywistego świata stają się “miło mieć”, a nie koniecznością. Wyścig AI w robotyce staje się wyścigiem mocy obliczeniowych i badań, co faworyzuje Stany Zjednoczone. Przewaga wolumenowa Chin okazuje się wartościowa komercyjnie, ale nie strategicznie decydująca.

Scenariusz 3: Dzielenie sie danymi zmienia rownanie. Otwarte zestawy danych robotycznych, współprace między firmami takie jak Open X-Embodiment i sponsorowane przez rząd wspólne zasoby danych tworzą pule danych treningowych, które przyćmiewają wyniki dowolnej pojedynczej floty. Koło zamachowe danych staje się zjawiskiem zbiorowym, a nie konkurencyjnym, i pytanie przesuwa się z “kto ma najwięcej robotów” na “kto ma najlepsze algorytmy”.

Scenariusz 4: Specjalizacja, a nie generalizacja, wygrywa. Marzenie o robotach humanoidalnych ogólnego przeznaczenia ustępuje miejsca rzeczywistości robotów specjalizowanych, zoptymalizowanych do konkretnych zadań. W tym świecie ważna jest nie łączna wielkość floty, ale flota na kategorię zadań. Chiny prowadzą w produkcji i logistyce. USA prowadzi w opiece zdrowotnej i obronności. Przewaga danych żadnej ze stron nie jest przenośna.

Scenariusz 5: Koło zamachowe jest realne, ale wolne. Przewaga danych Chin kumuluje się, ale w logarytmicznym tempie sugerowanym przez prawa skalowania. Do 2030 roku chińska robotyczna AI jest 15-25% lepsza od amerykańskiej w typowych zadaniach, ale amerykańskie firmy wyrównują to lepszym sprzętem, lepszymi relacjami z klientami na zachodnich rynkach i szybszą iteracją w zakresie nowych możliwości.

Co obserwować

Debata o kole zamachowym danych zostanie rozstrzygnięta przez dowody, a nie argumenty. Oto wskaźniki, które powiedzą nam, który scenariusz się rozgrywa.

Benchmarki transferu sim-to-real. Jeśli modele wytrenowane w symulacji będą konsekwentnie dorównywać lub przewyższać modele wytrenowane na flocie w zadaniach manipulacji i nawigacji do 2027 roku, teza o kole zamachowym znacząco osłabnie. Obserwuj publikacje z DeepMind, Physical Intelligence i NVIDIA Research.

Złożoność zadań chińskich robotów. Jeśli chińskie wdrożenia humanoidów wyjdą poza powtarzalną logistykę do wieloetapowych, adaptacyjnych zadań w nieustrukturyzowanych środowiskach, ich dane staną się o wiele cenniejsze. Uważnie obserwuj ogłoszenia dotyczące wdrożeń AgiBot i Unitree.

Wzrost zbiorów danych na otwartym zródle. Jeśli zbiór danych Open X-Embodiment lub podobne projekty urosną do pokrycia milionów różnorodnych demonstracji zadań, wartość własnych danych flotowych maleje. Obserwuj roczne raporty współpracy i rozmiar ich zestawów treningowych.

Benchmarki modeli fundacyjnych. Jeśli chińskie fundacyjne modele robotyczne zaczną przewyższać amerykańskie na standaryzowanych benchmarkach manipulacji i nawigacji, koło zamachowe działa. Jeśli modele amerykańskie utrzymają swoją przewagę pomimo posiadania mniejszej ilości danych wdrożeniowych, koło zamachowe nie działa.

Wolumeny eksportowe. Jeśli eksport chińskich robotów humanoidalnych na rynki spoza Chin znacząco wzrośnie, ich dane staną się bardziej różnorodne i bardziej wartościowe. Jeśli eksport pozostaje ograniczony, ich dane pozostają skoncentrowane w chińskich środowiskach przemysłowych.

Oś czasu

I kw. 2026

Chiny przekraczają 10 000 wdrożonych robotów humanoidalnych. USA osiaga około 1 500

II kw. 2026

Wydanie NVIDIA Isaac Sim 4.0 z ulepszoną fizyką miękkiego ciała i deformowalnych obiektów

III kw. 2026

Wydanie zbioru danych Open X-Embodiment v3 z 10x więcej demonstracji manipulacji

IV kw. 2026

Oczekiwany pierwszybenchmark standardowy dla fundacyjnych modeli robotycznych

2027

Chiny celują w 35 000+ wdrożonych humanoidów. Tesla celuje w 50 000+ jednostek Optimus

2028

Oczekiwany punkt zwrotny: jakość symulacji może równać się wartości danych z rzeczywistego swiata dla większości zadań

2029

Goldman Sachs prognozuje, że rynek robotów humanoidalnych osiągnie 6 mld USD rocznie

2030

Pierwsza generacja robotów wytrenowanych głównie na danych flotowych vs danych symulacyjnych będzie bezpośrednio porównywalna

Liczba, którą wszyscy pomijają

Debata o 10 000 kontra 1 500 robotach jest ważna, ale ryzykuje pominięcie szerszego obrazu. Liczba, która ostatecznie zdeterminuje możliwości AI w robotyce, to nie liczba robotów w terenie. To liczba unikalnych kombinacji zadanie-środowisko reprezentowanych w danych treningowych.

Flota 10 000 robotów wykonujących 50 różnych zadań w 200 różnych środowiskach daje 10 000 kombinacji zadanie-środowisko. Flota 1 500 robotów wykonujących 500 różnych zadań w 1 000 różnych środowiskach daje 500 000. Silnik symulacyjny generujący 100 000 scenariuszy dziennie daje liczby, które przyćmiewają oba.

Przewaga wolumenowa Chin jest realna i komercyjnie znacząca. Tworzy przewagę produkcyjną, przewagę w łańcuchu dostaw i przewagę w wiedzy operacyjnej, którą bardzo trudno będzie powielić. Ale twierdzenie, że automatycznie przełoży się to na przewagę AI, wymaga założeń dotyczących natury uczenia maszynowego, które są, w najlepszym razie, kwestionowane przez dowody.

Koło zamachowe danych nie jest mitem. Ale nie jest też prawem natury. To hipoteza, a najbliższe dwa do trzech lat zdecydują, czy była słuszna.

Podsumowanie

Wolumen

Potwierdzona przewaga Chin

10 000+ robotów, skala produkcji, krajowa infrastruktura danych

Inteligencja

Aktualna przewaga Ameryki

Modele fundacyjne, dostep do mocy obliczeniowych, ekosystem badań

Prawdziwe ryzyko dla Stanów Zjednoczonych nie jest takie, że 10 000 chińskich robotów wyprodukuje niezwyciężoną AI. Jest takie, że podczas gdy amerykańskie firmy debatują o teoretycznych zaletach danych z rzeczywistego świata wobec symulacji, chińskie firmy po prostu dostarczają roboty, zbierają dane, iterują sprzęt i budują operacyjne mięśnie, które zamieniają technologię w przemysł. Koło zamachowe, które liczy się najbardziej, może wcale nie dotyczyć danych. Może dotyczyć nieefektownej, kumulatywnej przewagi wynikającej z wykonywania tej pracy.

Źródła

  1. Counterpoint Research - Global Humanoid Robot Shipments 2025 - dostęp 2026-03-28
  2. Goldman Sachs - Rise of the Humanoids Report - dostęp 2026-03-28
  3. Google DeepMind - RT-2: Vision-Language-Action Models - dostęp 2026-03-28
  4. Toyota Research Institute - Large Behavior Models for Manipulation - dostęp 2026-03-28
  5. Waymo Safety Report - Autonomous Driving Data - dostęp 2026-03-28
  6. MIIT - Humanoid Robot Innovation and Development Guidelines - dostęp 2026-03-28
  7. IEEE Spectrum - Why Robot Learning Needs Diverse Data, Not Just More Data - dostęp 2026-03-28
  8. Scale AI - Chinchilla Scaling Laws Applied to Robotics - dostęp 2026-03-28
  9. AgiBot Open-Source Robotics Datasets - GitHub - dostęp 2026-03-28
  10. Reuters - Baidu Apollo Autonomous Driving Fleet Data - dostęp 2026-03-28
  11. Physical Intelligence - Pi0 Foundation Model for Robots - dostęp 2026-03-28
  12. MIT Technology Review - The Real Bottleneck in Robotics AI - dostęp 2026-03-28
  13. South China Morning Post - China Robot Deployment Surge - dostęp 2026-03-28
  14. Nature - Sim-to-Real Transfer in Robotic Manipulation - dostęp 2026-03-28
  15. Open X-Embodiment Collaboration - Scaling Robot Learning - dostęp 2026-03-28

Powiązane artykuły

Przyszłość 22 min

Siedem firm, trzy kraje, jeden wyścig: kto naprawdę kontroluje łańcuch dostaw humanoidów

Każdy robot humanoidalny to zbiór geopolitycznych zależności. Chińskie baterie, amerykańskie chipy AI, japońskie precyzyjne łożyska, niemieckie czujniki optyczne. Prześledźcie łańcuch dostaw wstecz, a znajdziecie sieć podatności, która może zmienić całą branżę z dnia na dzień.

supply-chain manufacturing China
Roboty humanoidalne 14 min

AgiBot dostarczył więcej robotów niż Tesla, Figure i Apptronik razem wzięci. Prawdopodobnie nigdy o nich nie słyszałeś.

AgiBot dostarczył 5200 robotów humanoidalnych, podczas gdy Tesla osiągnęła 500, Figure AI dostarczyło 200, a Apptronik 50. Łącznie trzy najbardziej nagłaśniane amerykańskie programy humanoidalne dostarczyły jedną siódmą tego, co osiągnął szanghajski startup w niecałe dwa lata. Liczby ujawniają martwy punkt zachodnich mediów, który ma realne konsekwencje.

AgiBot China manufacturing
Roboty humanoidalne 18 min

Figure 03 za 20 000 dolarów: robot, który może złamać krzywą cena-możliwości

Figure AI wyceniło swojego humanoida trzeciej generacji na 20 000 dolarów, podcinając docelową cenę Tesli Optimus i wchodząc w pobliże terytorium Unitree G1. Z 42 stopniami swobody, rękami o 16 stopniach swobody, AI Helix i 5-godzinną baterią, Figure 03 jest pierwszym humanoidem, w którym ekonomia substytucji pracy może faktycznie działać na dużą skalę.

Figure AI Figure 03 pricing
Roboty humanoidalne 18 min

Firma warta 39 miliardów dolarów, która dostarczyła 200 robotów: Figure AI i przepaść między wyceną a wdrożeniami

Figure AI jest wyceniane na 195 milionów dolarów za każdego dostarczonego robota. Unitree sprzedaje swojego humanoida za 16 000 dolarów i dostarczyło 5500 jednostek. Przepaść między wyceną a wdrożeniami w branży humanoidów mówi wszystko o tym, co inwestorzy tak naprawdę kupują.

Figure AI valuation investment