「AI の次の段階は、物理 AI と呼ばれています。物理 AI とは、AI が物理世界と相互作用する段階です。つまり、ロボット工学のことです。」 – 2025 年 1 月 16 日、台湾中部の工場開所式にて、Nvidia のジェンセン フアン氏。
今年の CES は、ウェアラブルから AI 搭載家具、ロボットまで、ハードウェアへの AI の統合がテーマでした。注目を集めたのは、倉庫でよく採用されている、SF 映画で見かけるような面白みのない機械ロボットではなく、人間そっくりのロボットでした。
ロボット工学はChatGPTの「瞬間」を迎えていると言えるでしょう。(技術自体は新しいものではないが、一般大衆と資本家の関心が目覚めたという意味で)
特に昨年は、Generative AI がロボット工学を劇的に変革した様子を目にしました。以前はリモコンで制御されていたロボットが、今では AI を機械に統合し、ハードウェアとソフトウェアをシームレスに統合して、自ら「考える」ことができるようになりました。LLM/Gen AI とロボット工学という、まったく異なる 2 つの科学分野が融合しつつある初期段階を私たちは目の当たりにしています。
先週、次のような報道がありました。 OpenAIは2020年に閉鎖したロボット部門を秘密裏に再開した。 同社によれば、新しいロボットチームは「汎用ロボットを解き放ち、動的な現実世界の設定でAGIレベルの知能を推進すること」に重点を置くとのことだ。
[数週間以内に、具現化された AI ヒューマノイドと四足歩行ロボットの大手企業である Unitree について詳しく紹介する予定ですので、お楽しみに。]
私が役に立つと思ったのは、物理的な AI を理解しようとするときにこのフレームワークを使用し、全体を次の 3 つのステップの連続したプロセスとして見ることでした。
- センシング(ロボットの目、耳、手、感覚技術)、
- 思考(意思決定プロセス - GenAI)、
- そして行動力(物理的な世界、つまりメカトロニクスにおいて、最後までやり遂げて影響を与える能力)。
これをより技術的な方法で分類すると、AI ライターの Diana Wolf Torres 氏は、システム アーキテクチャは次のように分類できると述べています。
1) 知覚層: マシンが高度なセンサー融合アルゴリズムを通じてマルチモーダルな感覚入力を処理する場所です。これにより、コンピューターは周囲の物理的環境をよりよく理解できるようになります。
2) 認知層: これは、AI を従来のロボットに統合する方法の中核です。これは、機械の意思決定頭脳として機能し、事前にトレーニングされたシミュレーションに基づいてパーフェクション層から収集されたデータを処理し、物理世界にどのように反応するかを決定します。
3) アクション レイヤー: このレイヤーは、実際に物理世界への「出力」を作成し、動きの正確性を確保し、ジャンプ、歩行、またはオブジェクトの移動が表示される場所を確保します。
そして、物理的な AI には、1) 自律走行車 (現在、これに取り組んでいます)、2) 特殊ロボット - 倉庫/労働自動化 (従来から知られているもの)、3) ヒューマノイド ロボットなど、非常に多くのものが含まれます。
免責事項: 今日は、ヒューマノイド ロボットにのみ焦点を当てます。私は自分の考えを書き留め、ロボットと AI の進化する関係を理解しようと努めながら、論理的に考えをまとめようと最善を尽くしました。
ヒューマノイドロボット
まず、具現化されたAIとは何でしょうか?
具現化されたAI 物理的な環境と対話し、そこから学習できる人工知能 (AI) エージェント (ロボット、仮想アシスタント、その他のインテリジェント システム) を指します。クアルコムの定義)
私たちは長年、倉庫用のロボットアーム、東京や上海のあちこちで見かけるコーヒーメーカーロボット、娯楽や配達用のロボット犬、その他さまざまなデバイスに慣れ親しんできました。しかし、これらのロボットは、ある意味、驚きの要素を失ってしまいました。
約 10 年前、家族の友人が北京のロボット レストランに投資しました。それは、プログラムされた 10 種類ほどの料理を切ったり作ったりできる機械でした。母はすごくクールだと思いましたが、ロボットは人間には見えず、ただの機械だったので、私には目新しいものには感じられませんでした (1 年後に店を閉めたと思います)。料理の味は良かったのですが、料理は科学ではありません。火加減や塩の量を感知する必要があります。時には、工夫して即興で作る必要があります。より適した使用例は、大規模な大学/キャンパスのカフェテリア、工場、刑務所など、標準化された料理を効率的に大量提供する必要がある場所です。北京の CBD にある中価格帯のレストランとしてはうまくいきませんでした。ロボットが作った、味のいまいちな料理よりも、もっと良い選択肢はたくさんあります。
さて、ヒューマノイド、つまり人間のように物理的に設計されたロボットを紹介しましょう。ヒューマノイドには 2 本の腕、2 本の脚、そして頭があり、その動きは人間の体の動きを模倣しています。
「世界で最も適応しやすいロボットはヒューマノイドロボットです。なぜなら、人間が人間に代わって世界を構築したからです」とジェンセン・フアン氏はComputexで語り、さらに「人間と同じ体格なので、こうしたロボットを訓練するためのデータが多くあります」と付け加えた。
私も彼に賛成です。人間のようなロボットへの執着は、人間としての利己主義や自尊心を超えています。これは視覚的な問題ですが、実用的な問題でもあります。だから、今ではますます 私はロボットです。
ヒューマノイドロボットへの主流の関心は、2022年後半にテスラがオプティマスを発表したときに始まりました。それ以来、多くのロボット企業が世界中のメディアや投資家から注目を集めています。これが新しい「すごい」ロボットの形になりました。
従来のロボットとどう違うのでしょうか?
従来のロボット工学は 10 年以上前から存在しています。これらの従来のロボットは、事前に記述された指示を実行するために厳格なプログラミングに依存していました (一連の命令に従うため、「考える」ことはできませんでした)。従来のロボットは基本的に、柔軟性がほとんどない反復的な事前にプログラムされた動作に限定されており、処理できるタスクの複雑さは制限されています。一方、具現化された AI ロボットは、強化学習を使用する現実世界のデータでトレーニングされ、「考える」能力を開発しました。
2024年10月、リヤドでの技術カンファレンスのビデオ通話中に、 イーロン・マスクは、2040年までに$20,000から$25,000の価格帯のヒューマノイドロボットが少なくとも100億台存在すると予測した。 リヤドの技術会議でビデオ通話を通じて、ロボットがもっと身近になり、普及するのにまだ遠いですが、最先端のロボットモデルによって、ロボットがより身近になり、普及するのに一歩近づきました。 アメカ、Tesla、Agility Robotics、Unitree など。
テスラ社のCEOであるマスク氏は、直近の年次株主総会で、将来的にはヒューマノイドの数が人間の2倍以上になるだろうと予測した。これは驚くべき(そして恐ろしい)ことだ。
そして今日、ゴールドマン・サックスのCEOであるデイビッド・ソロモンはこう言った。 AIはビジネスの生産性に革命を起こす彼の見解は、最終的にはジュニアバンカーが行う作業の多くがAIに置き換えられるというもので、例えば95% IPO申請書類の作成はAIによって数分で完了できる。 「残りが商品となったため、最後の5%が重要になる。」
経営陣はこの革命に注目し、AI ロボットがいつか私たちに取って代わる(支援する)ようになると本気で考えています。
開発と限界
2024年3月のNvidiaの基調講演 また、物理的なAIロボットにも焦点を当てています。ロボットの進歩は、1) GenAI、2) アクチュエータとメカニクス、3) バッテリーストレージという3つの主な要素に依存しています(これについては、以前ここで再生可能エネルギーソリューションについて書いたときにも触れました)。
これら 3 つの要素が同時に進展すれば、ヒューマノイド ロボットの大量生産と商用化はおそらく数年後に実現するでしょう。Unitree の記事では、ハードウェア製造における長年の経験を持つ中国について取り上げています。中国は、過去数十年にわたりさまざまな家電製品のハードウェア製造拠点であり、機械技術と電子工学を組み合わせたメカトロニクスのノウハウで優位に立っています。米国が GenAI で依然としてリードしていることは明らかですが、どの要素がより重要なのか、それとも協力の意思があるのでしょうか。そして、最後のピースを誰が見つけられるでしょうか。より優れたバッテリー ソリューションです。バッテリーをより軽量で長持ちさせ、より安全にできるでしょうか。
私たち人間は、2013年の映画「her/世界でひとつの彼女」で仮想のAI恋人を想像し(今ではほぼ現実のものとなり得る)、2024年のミーガン・フォックス主演のSFスリラー「Subservience/従順」では物理的なAIが私たちの誠実さや忠誠心という道徳に挑戦し、有害な安全上のリスクにつながることさえあるなど、ロボットが私たちと隣り合って暮らす世界を何十年も夢見てきました。いつかロボットのような人間が作られるだろうという想像はずっとありました。ただ、今、テクノロジーがようやく私たちの想像力に追いつくほど進歩したのです。(もちろん、現在のヒューマノイドはまだミーガン・フォックスに似ていません)
映画「Subservience」で人間に恋をして悪に変わるロボット
映画「Her/世界でひとつの彼女」でAI音声エージェントと恋に落ちる人間の主人公
つまり、これは明らかに始まりに過ぎないということです。現在、すべてのリソースが物理 AI (または AI 全般) に投入されているため、この学際的な分野は初期段階から成熟し、おそらく私たちが理解できるよりも速いペースで進歩し続けるでしょう。物理世界とデジタル世界が互いに融合し、形を変えていく中で、2 歳児の母親である私は、安全性に関する懸念を非常に心配しています。スマートフォンがすでに子供たちに現実を混乱させているのであれば、このテクノロジーをどのように規制すべきでしょうか。そして、彼女が 10 代になったとき、ロボットは何ができるようになるのでしょうか。
まだ解明すべきことがたくさんあるので、AI Proem に新しい垂直分野を追加します。 物理的なAI。 この分野では、フィジカルAIの発展に影響を与える可能性のある多くの分野について検討します。まず、ボストンダイナミクスと比較されることの多い中国の大手ヒューマノイドロボット企業、ユニツリーロボティクスについて詳しく説明します。また、バッテリーソリューションの角度についても検討します。 私の再生可能エネルギー作品。
次に、ロボットが暴走する可能性のある理論に関する懸念を探るのも興味深いと思います。これは、ロボット工学全体の安全性とロボット マシンの器用さに関するものです。さらに、接続性、帯域幅、遅延の複雑さ、その他の主要コンポーネント (センサー (LIDAR)、センサー フュージョン、ソフトウェア アーキテクチャ テクノロジー) に関する技術的な問題もあります。これは、EV 企業がテスラの足跡をたどって AI ファーストの企業 (たとえば Li Auto) に移行する方法を調べる進行中の別の記事にも関連しています。
また、AI が私たちの仕事の流れにどのような影響を与えるかまで取材範囲を広げたいと考えています。そのため、物理的な AI の導入によって労働力がどのような影響を受けるかを調査し、その後、AI ソフトウェアの登場や、最も人気のあるインターネット時代のソフトウェア プラットフォームに AI がどのような影響を与えるかを調査しています。
学ぶことや書くべきことがたくさんあります! とりあえず、トゥーデルー〜
読んでくれてありがとう AIプロム! 新しい投稿を受信し、私の仕事をサポートするには、無料で購読してください。
最新のブログ投稿の更新情報を受け取るには購読してください
コメントを残す: