
Im Jahr 2026 wird der KI-Kreis die schnellsten 100 Milliarden Einhörner hervorbringen. Skild AI schloss die Series-C-Finanzierung mit einer Bewertung von mehr als 140 Milliarden US-Dollar ab und wurde innerhalb von nur drei Jahren nach der Gründung von SoftBank, Nvidia und Bezos investiert. Der Gründer stammt von Meta AI, das keine Roboterhardware baut, sondern sich darauf konzentriert, ein “universelles Gehirn” zu schaffen: Skild Brain, das gemeinsame Modelle nutzt, um Robotern die Fähigkeit zur physischen Welt zu verleihen.
Skild AI ist das schnellste Einhorn, das in diesem Jahr über 100 Milliarden gekommen ist, mit einem schnellen Entwicklungstempo und einer heftigen Bewertungserweiterung, was selbst in der hektischen Welle von KI-Investitionen phänomenal ist. Nur zwei Monate nach seiner Gründung erhielt das Unternehmen eine Startrunde über 14,5 Millionen US-Dollar, angeführt von Lightspeed Ventures, und startete damit erfolgreich den Start. Zum ersten Jubiläum schloss Skild AI eine Series-A-Finanzierungsrunde von bis zu 300 Millionen Dollar ab, und die Bewertung nach der Investition stieg auf 15 Milliarden Dollar. In weniger als zwei Jahren hat sich die Bewertung fast verzehnfacht, und die jüngste Series-C-Finanzierung hat die Bewertung auf 140 Milliarden US-Dollar erhöht.
Der Grund, warum Kapital auf Skild AI gesetzt wird, ist einfach – der globale Arbeitsmarkt steht vor einer gravierenden Lücke. Die Beschäftigungslücke allein in der US-amerikanischen Fertigungsindustrie wird bis 2030 voraussichtlich 2,1 Millionen erreichen, und das Problem der alternden Bevölkerung in entwickelten Volkswirtschaften wie Europa und Japan ist noch ernster. Allzweckroboter, die komplexe physikalische Aufgaben ausführen können, gelten als Schlüssel zur Lösung der Produktivitätskrise. Die derzeitige Robotikbranche ist jedoch stark fragmentiert, und jeder Hersteller versucht, alles von mechanischen Strukturen bis hin zu Steuerungssystemen zu entwickeln, was zu hohen F&E-Kosten und der Unfähigkeit führt, Fähigkeiten plattformübergreifend zu migrieren.
Das reine Softwaremodell von Skild AI, das “nur das Gehirn, nicht den Körper” behandelt, entspricht genau dem allgemeinen Trend, dass sich die Branche von “hardwareorientiert” zu “KI-Modellen und Softwarefähigkeitsorientiert” verschiebt. Sequoia Capital schrieb im Bericht nach der Investition: “Der Kernwert von Skild AI besteht darin, ein Shared-Foundation-Modell zu nutzen, um die ‘emergente Fähigkeit’ von Robotern in der physischen Welt freizusetzen. Das unterscheidet sich grundlegend von der Nichtskalierbarkeit des ‘Einzelpunkt-Controllers’ in der Vergangenheit.” Diese “emergente Fähigkeit” ähnelt dem Durchbruch von GPT-3 im Sprachverständnis, bei dem das Modell bei Erreichen eines kritischen Punktes automatisch Fähigkeiten besitzt, die während des Trainings nicht explizit vermittelt wurden.
Das Engagement von SoftBank ist besonders strategisch. Der japanische Technologieriese erwarb ARM 2016 für 320 Milliarden Dollar und ist im Bereich Robotik tätig (wie die Übernahme von Boston Dynamics). Der SoftBank Vision Fund ist bekannt für seine Aggressivität bei KI-Investitionen, und diese starke Position bei Skild AI zeigt, dass der Fonds glaubt, dass das “Roboter-Universalgehirn” der nächste Billionen-Dollar-Markt ist. Nvidias Ergänzung bietet Rechenleistung und ökologische Unterstützung, und die Trainingsinfrastruktur von Skild AI wird voraussichtlich auf Nvidias GPU-Cluster basieren. Bezos’ persönliche Investition ist noch seltener, da der Amazon-Gründer selten an frühen Projekten teilnimmt und seine Unterstützung Skild AI einen immateriellen Markenwert verleiht.
Die Antwort auf die technischen Fähigkeiten von Skild AI verbirgt sich im Hintergrund des Gründungsteams. Vor der Gründung von Skild AI war Deepak Pathak ein renommierter Wissenschaftler und Praktiker auf dem Gebiet der künstlichen Intelligenz und Robotik, war Assistenzprofessor an der Carnegie Mellon University und veröffentlichte mehrere vielzitierte Artikel. Während seiner Zeit bei Meta AI war er maßgeblich an mehreren Schlüsselprojekten zu adaptivem Lernen, Simulation zur realen Migration und großflächiger Roboterdatenschulung beteiligt.
Pathak ist fest davon überzeugt, dass echte KI-allgemeine Intelligenz durch Interaktion und Versuch und Irrtum in der physischen Welt aufgebaut werden muss, anstatt sich ausschließlich auf digitale Text- oder Bilddaten zu verlassen. Dieses Konzept wurde innerhalb von Meta hinterfragt, da Metas Fokus damals auf dem Metaverse und sozialer KI lag und die Investition in physische Roboter relativ konservativ war. Diese strategische Meinungsverschiedenheit veranlasste Pathak schließlich, ein Unternehmen zu gründen und die Idee umzusetzen.
Abhinav Gupta, ebenfalls von Meta AI, hat Erfolge an der Schnittstelle von Computer Vision und Robotik-Lernen erzielt. Er legte Wert darauf, physikalisches Wissen aus Netzwerk-Videodaten zu erlernen, was es Maschinen ermöglicht, Objekteigenschaften, physikalische Gesetze und menschliche Absichten zu verstehen. Tatsächlich haben Gupta und Pathak während ihrer Zeit bei Meta mehrfach zusammengearbeitet, um zu erforschen, wie man die “emergenten Fähigkeiten” großer Sprachmodelle in physische Roboter replizieren kann.
Beide sind der Meinung, dass die derzeitige Robotikindustrie zu sehr auf maßgeschneiderte Lösungen für bestimmte Aufgaben und spezifische Hardware setzt und ein verallgemeinerbares und skalierbares “universelles Gehirn” fehlt, was das Anwendungspotenzial und die Popularisierungsgeschwindigkeit von Robotern in der realen Welt stark einschränkt. Infolgedessen haben die beiden bereits in den späteren Phasen von Meta ein internes Projekt gestartet, um ein Roboter-Foundation-Modell zu entwickeln, das nicht auf spezifischer Hardware angewiesen ist. Schließlich beschlossen Pathak und Gupta Anfang 2023, Meta zu verlassen und ein Vollzeitunternehmen zu gründen. Sie sind fest davon überzeugt, dass die Zukunft der Robotikindustrie nicht darin besteht, mehr “Körper” zu erschaffen, sondern ein kraftvolles, teilbares “Gehirn” bereitzustellen.
Springen wir ins Jahr 2023, als intelligente Roboter überall aufblühten, aber jeder Roboter spezialisierte Algorithmen von Grund auf trainieren musste, was zu langen F&E-Zyklen, hohen Kosten und unübertragbaren Fähigkeiten zwischen verschiedenen Robotern führte. In der verkörperten Geheimdienstbranche gab es schon immer ein Problem, das die Branche plagte: Wie verallgemeinert man? Die sogenannte Verallgemeinerung bezieht sich auf die Fähigkeit eines Roboters, der schnell auf andere Roboter kopiert werden kann.
Das ist für Roboter sehr schwierig, da die physische Welt extrem komplex, unsicher und hochdynamisch ist und Roboter gleichzeitig Verallgemeinerungsprobleme auf drei Ebenen Wahrnehmung, Entscheidungsfindung und Ausführung lösen müssen. Zum Beispiel können Lichtveränderungen, Wettereffekte, Hintergrundüberlastung, Okklusionsstörungen usw. drastische Veränderungen in der Verteilung der visuellen Sensoreingabedaten verursachen. Selbst wenn jede einfache Aufgabe (z. B. Greifen, Gehen) gelernt wird, vergrößert sich der Entscheidungsraum exponentiell, wenn sie zu komplexen Aufgaben kombiniert werden (z. B. “Kühlschrank öffnen, ein Getränk herausnehmen und in einen Becher gießen”).
Großflächige multimodale Vorschulung: Erlernen Sie physikalisches Wissen aus Webvideos, simulierten Umgebungen und realen Roboterdaten, um gemeinsame Darstellungen über verschiedene Szenarien hinweg zu erstellen
Hardware ist architekturunabhängig: Entkopplung von Wahrnehmung und Entscheidungsfindungslogik von spezifischen mechanischen Strukturen durch Abstraktionsschichten, sodass dasselbe Modell auf verschiedene Roboterformen wie Räder, Füße und Arme eingesetzt werden kann
Mechanismus des kontinuierlichen Lernens: Die vom Roboter während der Ausführung der Aufgabe erzeugten Daten werden zurück in die Cloud gesendet, das Modell wird kontinuierlich optimiert; die Erfahrung jedes Roboters kann dem gesamten Netzwerk zugutekommen
Skild AI stellt keine Roboterhardware her, sondern strebt an, für alle Roboter ein “universelles Gehirn” zu installieren, und ihre Gründer behaupten, sie schaffen “GPT-3-Momente” verkörperter Intelligenz. Skild Brain trennt Software von Hardware und vermeidet es, an ein einziges Hardwaredesign gebunden zu sein. Gleichzeitig senkt es die Branchenschwelle so weit wie möglich, sodass andere Roboterhersteller oder -integratoren sich auf Hardware-Optimierung und Szenario-Implementierung konzentrieren und direkt die API von Skild Brain aufrufen können, um fortschrittliche Intelligenz zu gewinnen, was die Popularisierung von Roboteranwendungen erheblich beschleunigt.
Auch die Aussichten für die Kommerzialisierung sind vielversprechend. Im Industrie- und Handelssektor müssen Roboter auf einer Produktionslinie nicht wegen eines kleinen Fehlers abgeschaltet werden; Bei der Katastrophenrettung können Roboter weiterhin Aufgaben ausführen, auch wenn sie “abgetrennte Gliedmaßen” haben; Im Verbrauchermarkt kann ein “Gehirn” “aus der Schale” genutzt werden, um die Kosten erheblich zu senken. Diese technologischen Grundpfeiler verändern das Verständnis der Menschen für AGI – digitales Wissen allein kann keine echte AGI erzeugen, und maschinelle Agenten müssen durch “praktisches” Lernen lernen, um die realen Funktionsgesetze der physischen Welt zu verstehen.