„Die nächste Stufe der KI heißt physische KI. Physische KI bedeutet, dass KI mit der physischen Welt interagiert. Das bedeutet Robotik.“ – Jensen Huang, Nvidia, bei einer Fabrikeröffnungszeremonie in Zentraltaiwan am 16. Januar 2025.

Dieses Jahr drehte sich bei der CES alles um die Integration von KI in Hardware, von Wearables über KI-gestützte Möbel bis hin zu Robotern! Den Blickfang bildeten nicht die unattraktiven Maschinenroboter, die in allen Lagerhallen eingesetzt werden – die lustigen, die wir in Science-Fiction-Filmen sehen –, sondern die menschenähnlichen.

Wir können sagen, dass die Robotik gerade einen ChatGPT-„Moment“ erlebt (die Technologie ist nicht neu, aber das öffentliche und kapitalistische Interesse hat ein Erwachen erlebt).

Insbesondere im letzten Jahr haben wir gesehen, wie generative KI die Robotik drastisch verändert hat. Roboter, die früher per Fernbedienung gesteuert wurden, können jetzt selbst „denken“, indem KI in die Maschine integriert wird, und zwar in Form einer nahtlosen Hardware-Software-Integration. Wir erleben gerade die Anfänge zweier völlig unterschiedlicher Wissenschaftsbereiche, die zusammenkommen: LLM/Gen AI und Robotik.

Erst letzte Woche wurde berichtet, dass OpenAI hat seine Robotikabteilung nach der Schließung im Jahr 2020 heimlich wiedereröffnet.  Laut Angaben des Unternehmens wird sich das neue Robotikteam darauf konzentrieren, „die Allzweckrobotik nutzbar zu machen und in dynamischen, realen Umgebungen auf Intelligenz auf AGI-Niveau hinzuarbeiten.“

[Ich werde in einigen Wochen einen ausführlichen Bericht über Unitree, das führende Unternehmen für humanoide und vierbeinige Robotik mit verkörperter KI, veröffentlichen, also bleiben Sie dran.]

Für mich war es hilfreich, beim Verständnis physischer KI diesen Rahmen zu verwenden und das Ganze als einen kontinuierlichen Prozess aus drei Schritten zu betrachten:

  • Sensorik (Augen, Ohren und Hände des Roboters – Sensorik),
  • Denken (der Entscheidungsprozess – GenAI),
  • und Handeln (die Fähigkeit, in der physischen Welt etwas durchzusetzen und Einfluss zu nehmen – Mechatronik).

Diana Wolf Torres, eine KI-Autorin, hat eine technischere Kategorisierung vorgeschlagen: Die Systemarchitektur kann wie folgt unterteilt werden:

1) Wahrnehmungsebene: Hier verarbeitet die Maschine multimodale sensorische Eingaben durch fortschrittliche Sensorfusionsalgorithmen. Dies hilft dem Computer, die ihn umgebende physische Umgebung besser zu verstehen.

2) Kognitive Ebene: Dies ist der Kern der Integration von KI in herkömmliche Roboter. Sie dient als Entscheidungshirn der Maschine und verarbeitet die von ihrer Perfektionsebene gesammelten Daten auf der Grundlage vorab trainierter Simulationen, um zu entscheiden, wie auf die physische Welt reagiert werden soll.

3) Aktionsebene: Diese Ebene erzeugt die eigentliche „Ausgabe“ an die physische Welt und sorgt für Genauigkeit bei den Bewegungen und dafür, wo wir das Springen, Gehen oder Bewegen von Objekten sehen.

Und physische KI umfasst so viel: 1) autonome Fahrzeuge (an denen ich gerade arbeite), 2) spezialisierte Roboter – Lager-/Arbeitsautomatisierung (das, was wir traditionell kennen) und 3) humanoide Roboter.

Quelle: Morgan Stanley

Haftungsausschluss: Heute konzentrieren wir uns ausschließlich auf humanoide Roboter. Ich habe mein Bestes gegeben, meine Gedanken logisch zu ordnen, als ich sie aufschrieb und versuchte, die sich entwickelnde Beziehung zwischen Robotern und KI zu verstehen.

Humanoide Roboter

Erstens: Was ist verkörperte KI?

Verkörperte KI bezieht sich auf Agenten der künstlichen Intelligenz (KI) – Roboter, virtuelle Assistenten oder andere intelligente Systeme – die mit einer physischen Umgebung interagieren und von ihr lernen können. (Qualcomms Definition)

Viele Jahre lang haben wir uns an Roboterarme für den Einsatz in Lagerhallen, Kaffeezubereitungsroboter in ganz Tokio und Shanghai, Roboterhunde für Spaß und Lieferzwecke und ähnliche Geräte gewöhnt. Aber diese Roboter haben ihren Wow-Faktor irgendwie verloren.

Vor etwa zehn Jahren investierte ein Freund der Familie in ein Roboterrestaurant in Peking. Es war eine Maschine, die etwa 10 Gerichte zerkleinern und zubereiten konnte, die in die Maschine programmiert wurden. Meine Mutter fand das so cool, aber der Roboter sah nicht wie ein Mensch aus, sondern nur wie eine weitere Maschine, also war ich von der Neuheit nicht begeistert (ich bin ziemlich sicher, dass sie den Laden nach einem Jahr geschlossen haben). Die Gerichte schmeckten gut, aber Kochen ist keine Wissenschaft; man muss das Feuer spüren und wissen, wie viel Salz man hinzufügen muss. Manchmal muss man es aufpeppen und improvisieren. Der geeignetere Anwendungsfall ist eine große Universitäts-/Campus-Cafeteria, Fabriken oder Gefängnisse, wo man standardisiertes Essen in großem Maßstab effizient anbieten muss. Als mittelpreisiges Restaurant im CBD von Peking hat es einfach nicht funktioniert. Es gibt viele andere bessere Optionen zum Essen als ein mittelmäßig schmeckendes, von Robotern zubereitetes Essen.

Jetzt stellen wir Humanoide vor, Roboter, die körperlich wie Menschen gestaltet sind. Sie haben zwei Arme, zwei Beine und einen Kopf und ihre Beweglichkeit ähnelt der unseres Körpers.

„Die am einfachsten anzupassenden Roboter der Welt sind humanoide Roboter, weil wir die Welt für uns erschaffen haben“, sagte Jensen Huang auf der Computex und fügte hinzu: „Es gibt mehr Daten, um diese Roboter zu trainieren, weil wir den gleichen Körperbau haben.“

Und ich stimme ihm zu. Unsere Besessenheit von menschlich aussehenden Robotern geht mittlerweile über das Egoistische und Selbstgefällige hinaus, das wir als Menschen haben. Es ist eine Frage der Optik, aber auch eine praktische. Es klingt also immer mehr nach Ich, ein Roboter.

Das allgemeine Interesse an humanoiden Robotern begann Ende 2022, als Telsa seinen Optimus vorstellte. Seitdem haben viele Robotikunternehmen weltweit die Aufmerksamkeit der Medien und Investoren auf sich gezogen. Dies wurde zur neuen „Wow“-Roboterform.

Quelle: Morgan Stanley

Worin unterscheiden sie sich von herkömmlichen Robotern?

Traditionelle Robotik gibt es schon seit über einem Jahrzehnt. Diese konventionellen Roboter verließen sich auf starre Programmierung, um vorgefertigte Anweisungen auszuführen (sie befolgten eine Reihe von Befehlen und konnten nicht „denken“). Traditionelle Roboter waren im Wesentlichen auf sich wiederholende, vorprogrammierte Bewegungen mit geringer Flexibilität beschränkt, und die Komplexität der Aufgaben, die sie bewältigen können, ist begrenzt. Roboter mit verkörperter KI hingegen werden anhand von realen Daten trainiert, die Verstärkungslernen verwenden, und sie haben die Fähigkeit entwickelt, zu „denken“.

Im Oktober 2024, während eines Videoanrufs auf einer Tech-Konferenz in Riad​​, Elon Musk prognostizierte, dass es bis 2040 mindestens 10 Milliarden humanoide Roboter im Wert zwischen $20.000 und $25.000 geben würde. über einen Videoanruf bei einer Tech-Konferenz in Riad. Obwohl wir davon noch weit entfernt sind, sind wir der zunehmenden Zugänglichkeit/Verbreitung von Robotern mit den bahnbrechenden Robotermodellen von einen Schritt näher gekommen. Ameca, Tesla, Agility Robotics, Unitree und so weiter.

Quelle: Morgan Stanley

Bei seiner letzten Hauptversammlung sagte Tesla-Chef Musk voraus, dass es in Zukunft mindestens doppelt so viele Humanoide wie Menschen geben wird. Das ist verrückt (und beängstigend).

Und erst heute sagte David Soloman, CEO von Goldman Sachs: KI wird die Unternehmensproduktivität revolutionieren. Seiner Ansicht nach werden letztlich viele Aufgaben der Junior-Banker durch KI ersetzt werden, wie beispielsweise das Erstellen von 95%-IPO-Anmeldeunterlagen, das heute von KI in wenigen Minuten erledigt werden kann. „Heute kommt es auf die letzten 5 Prozent an, denn der Rest ist eine Ware.“

Führungskräfte beobachten diese Revolution und glauben wirklich, dass KI-Roboter uns eines Tages ersetzen (unterstützen) werden.

Entwicklung und Einschränkungen

Nvidias Keynote-Rede im März 2024 konzentrierte sich auch auf physische KI-Robotik. Die Weiterentwicklung von Robotern beruht auf drei Hauptfaktoren: 1) GenAI, 2) Aktuatoren und Mechanik und 3) Batteriespeicher (was ich auch schon einmal angesprochen habe, als ich hier über Lösungen für erneuerbare Energien schrieb)

Wenn die drei Faktoren gemeinsam voranschreiten, wird die Massenproduktion und Kommerzialisierung humanoider Roboter wahrscheinlich in einigen Jahren erfolgen. In meinem Unitree-Artikel spreche ich über China, das aufgrund seiner langjährigen Erfahrung in der Hardwareherstellung einen Know-how-Vorsprung in der Mechatronik hat, die mechanische Technologie und Elektronik kombiniert, da es in den letzten Jahrzehnten das Zentrum der Hardwareherstellung für verschiedene Geräte war. Während die USA bei GenAI immer noch eindeutig führend sind, stellt sich die Frage, welcher Faktor wichtiger ist oder ob eine Zusammenarbeit angestrebt wird. Und wer kann das letzte Puzzlestück finden? Eine bessere Batterielösung. Können sie Batterien leichter, langlebiger und sicherer machen?

Quelle: Morgan Stanley – Sehen Sie sich die führenden Unternehmen in diesem Bereich an.

Wir Menschen träumen seit Jahrzehnten von einer Welt, in der Roboter an unserer Seite sind, vom Film „Her“ aus dem Jahr 2013, in dem wir uns einen virtuellen KI-Liebhaber vorstellten (der jetzt praktisch real sein kann), bis hin zum Science-Fiction-Thriller „Subservience“ aus dem Jahr 2024 mit Megan Fox, in dem physische KI unsere Moralvorstellungen von Treue und Loyalität in Frage stellt und sogar zu schädlichen Sicherheitsrisiken führt. Wir haben uns immer vorgestellt, dass wir eines Tages Roboter-Selbste erschaffen werden. Nur ist die Technologie jetzt endlich so weit fortgeschritten, dass sie mit unserer Vorstellungskraft mithalten kann. (Natürlich sehen die aktuellen Humanoiden Megan Fox noch nicht ähnlich)

Ein Roboter, der sich in den Menschen verliebt und böse wird im Film /Subservience/

Menschlicher Protagonist, der sich im Film /Her/ in eine KI-Sprachagentin verliebt

Mein Punkt ist also, dass dies offensichtlich nur der Anfang ist. Da die Ressourcen jetzt alle in physische KI (oder KI im Allgemeinen) fließen, wird dieses interdisziplinäre Feld aus seinem Anfangsstadium herausreifen und sich schneller weiterentwickeln, als wir vielleicht überhaupt begreifen können. Da unsere physische und digitale Welt sich immer weiter verformen und miteinander verschmelzen, bereiten mir als Mutter einer Zweijährigen die Sicherheitsbedenken große Sorgen. Wenn Smartphones Kinder bereits jetzt über die Realität verwirren, wie sollten wir diese Technologie dann regulieren und wozu werden Roboter fähig sein, wenn sie Teenager wird?

Es gibt noch viel zu entpacken, also werde ich AI Proem um eine neue Vertikale erweitern: Physische KI. In In diesem Bereich werde ich die vielen Bereiche untersuchen, die die Entwicklung der physischen KI beeinflussen können. Zunächst werde ich mich eingehend mit Chinas führendem Unternehmen für humanoide Roboter, Unitree Robotics, befassen, das oft mit Boston Dynamics verglichen wird. Ich werde auch den Aspekt der Batterielösung untersuchen, für den ich nach mein Stück zum Thema erneuerbare Energien.

Dann denke ich, dass es interessant sein wird, die Bedenken zu untersuchen, die sich um mögliche Theorien darüber drehen, wie Roboter außer Kontrolle geraten könnten. Dies betrifft die allgemeine Sicherheit der Roboter und die Geschicklichkeit von Robotermaschinen. Dann gibt es die technischen Aspekte der Konnektivität, Bandbreite, Latenzkomplikationen und anderer wichtiger Komponenten – Sensoren (LIDAR), Sensorfusion und Softwarearchitekturtechnologie. Dies hängt auch mit einem anderen in Arbeit befindlichen Teil zusammen, der untersucht, wie EV-Unternehmen in Teslas Fußstapfen treten und sich zu KI-orientierten Unternehmen entwickeln (z. B. Li Auto).

Ich möchte meine Berichterstattung auch um die Frage erweitern, wie sich KI auf unsere Arbeitsabläufe auswirkt. Daher untersuche ich, wie sich die physische Einführung von KI auf unsere Arbeitskräfte auswirkt und untersuche anschließend möglicherweise kommende KI-Software oder wie sich KI auf unsere beliebtesten Softwareplattformen des Internetzeitalters auswirken wird.

Es gibt einfach so viel zu lernen und darüber zu schreiben! Bis dahin, tschüss~

Vielen Dank fürs Lesen KI-Probe! Abonnieren Sie kostenlos, um neue Beiträge zu erhalten und meine Arbeit zu unterstützen.

Veröffentlicht von Grace Shao
VORHERIGER BEITRAG
Das gefällt dir vielleicht auch

Hinterlassen Sie Ihren Kommentar:

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert