1티피1티

“AI의 다음 단계는 물리적 AI라고 합니다. 물리적 AI는 AI가 물리적 세계와 상호 작용하는 것입니다. 로봇공학을 의미합니다.” – 2025년 1월 16일 대만 중부에서 열린 공장 개장식에서 엔비디아의 젠슨 황.

올해 CES는 웨어러블 기기부터 AI가 강화된 가구, 로봇에 이르기까지 하드웨어에 AI를 통합하는 것이 전부였습니다! 주목을 끄는 것은 창고에서 모두 채택한 섹시하지 않은 기계 로봇이 아니라(SF 영화에서 보는 재밌는 로봇) 인간과 닮은 로봇이었습니다.

로봇공학이 ChatGPT 순간을 겪고 있다고 말할 수 있습니다. (기술이 새롭지 않지만 대중과 자본의 관심이 깨어나는 것을 경험했습니다.)

특히 작년에 우리는 Generative AI가 로봇공학을 어떻게 극적으로 변화시켰는지 보았습니다. 이전에는 리모컨으로 제어하던 로봇이 이제는 스스로 "생각"할 수 있으며, AI를 매끄러운 하드웨어-소프트웨어 통합으로 기계에 통합할 수 있습니다. 우리는 두 가지 매우 다른 과학 분야, 즉 LLM/Gen AI와 로봇공학의 초기가 만나는 것을 보고 있습니다.

바로 지난주에 다음과 같은 보고가 있었습니다. OpenAI는 2020년에 로봇 사업부를 폐쇄한 후 비밀리에 다시 열었습니다.  회사에 따르면, 그들의 새로운 로봇공학 팀은 "일반 목적 로봇공학의 잠재력을 끌어내고 역동적이고 현실적인 환경에서 AGI 수준의 지능을 향해 나아가는 데 집중할 것"이라고 합니다.

[저는 몇 주 안에 선도적인 체현형 AI 휴머노이드 및 4족 보행 로봇 회사인 유니트리에 대한 심층 분석을 게시할 예정이니 기대해 주시기 바랍니다.]

제가 도움이 되었다고 생각한 것은 물리적 AI를 이해하려고 할 때 이 프레임워크를 사용하여 전체를 세 단계의 연속적인 프로세스로 보는 것이었습니다.

  • 감지(로봇의 눈, 귀, 손—감각 기술)
  • 사고(의사결정 과정—GenAI),
  • 그리고 행동(실제로 물리적인 세계에 영향을 미치고 이를 실행하는 능력—메카트로닉스).

이를 보다 기술적으로 분류하면 AI 작가인 다이애나 울프 토레스는 시스템 아키텍처를 다음과 같이 나눌 수 있다고 말했습니다.

1) 지각 계층: 이것은 기계가 고급 센서 융합 알고리즘을 통해 다중 모드 감각 입력을 처리하는 곳입니다. 컴퓨터가 주변의 물리적 환경을 더 잘 이해하도록 돕습니다.

2) 인지 계층: 이는 AI가 기존 로봇에 통합되는 방식의 핵심입니다. 기계의 의사 결정 두뇌 역할을 하며, 사전 훈련된 시뮬레이션을 기반으로 완벽 계층에서 수집된 데이터를 처리하여 물리적 세계에 어떻게 반응할지 결정합니다.

3) 액션 레이어: 이 레이어는 물리적 세계에 대한 "출력"을 실제로 생성하여 움직임의 정확성을 보장하고 점프, 걷기 또는 물체가 움직이는 위치를 확인합니다.

물리적 AI는 매우 많은 것을 포괄합니다. 1) 자율주행차(현재 제가 작업하고 있는 내용), 2) 전문 로봇 - 창고/노동 자동화(기존에 우리가 알고 있던 것), 3) 인간형 로봇 등이 있습니다.

출처: Morgan Stanley

면책 조항: 오늘은 휴머노이드 로봇에만 집중할 것입니다. 저는 제 생각을 적어내면서 논리적으로 만들고 로봇과 AI의 진화하는 관계를 이해하려고 최선을 다했습니다.

휴머노이드 로봇

첫째, 구현된 AI란 무엇입니까?

구체화된 AI 물리적 환경과 상호 작용하고 이를 통해 학습할 수 있는 인공 지능(AI) 에이전트, 즉 로봇, 가상 비서 또는 기타 지능형 시스템을 말합니다.Qualcomm의 정의)

수년 동안 우리는 창고용 로봇 팔, 도쿄와 상하이 전역의 커피 제조 로봇, 재미와 배달을 위한 로봇 개, 그리고 그런 다른 장치에 익숙해져 왔습니다. 하지만 이런 로봇들은 와우 요소를 잃어버렸습니다.

약 10년 전, 가족 친구가 베이징에 로봇 레스토랑에 투자했습니다. 그것은 기계에 프로그래밍된 10가지 요리를 자르고 만들 수 있는 기계였습니다. 제 엄마는 그것이 정말 멋지다고 생각했지만, 그 로봇은 인간처럼 보이지 않고 그저 또 다른 기계일 뿐이었기 때문에 그 참신함은 저에게는 통하지 않았습니다(그들이 1년 후에 가게를 닫았을 거라고 확신합니다). 요리는 괜찮았지만 요리는 과학이 아닙니다. 불길을 느끼고 얼마나 소금을 더해야 하는지 느껴야 합니다. 때로는 재기발랄하게 만들고 즉흥적으로 대처해야 합니다. 더 적합한 사용 사례는 대량으로 표준화된 음식을 효율적으로 제공해야 하는 대규모 대학/캠퍼스 카페테리아, 공장 또는 교도소입니다. 베이징 CBD의 중간 가격대 레스토랑으로는 통하지 않았습니다. 그곳에서는 맛이 밋밋한 로봇이 만든 음식보다 더 나은 식사 옵션이 많이 있습니다.

이제, 인간처럼 물리적으로 설계된 로봇인 휴머노이드를 소개하겠습니다. 그들은 두 개의 팔, 두 개의 다리, 그리고 머리를 가지고 있으며, 그들의 이동성은 우리 몸의 이동성과 유사합니다.

젠슨 황은 컴퓨텍스에서 "세상에서 가장 적응하기 쉬운 로봇은 인간형 로봇입니다. 왜냐하면 우리는 우리를 위해 세상을 만들었기 때문입니다."라고 말하며, "이런 로봇을 훈련할 데이터가 더 많습니다. 왜냐하면 우리는 체격이 같기 때문입니다."라고 덧붙였다.

그리고 저는 그에게 동의합니다. 인간처럼 생긴 로봇에 대한 우리의 집착은 이제 우리가 인간으로서 얼마나 이기적이고 자만심이 강한지를 넘어섰습니다. 그것은 시각적인 것일 뿐만 아니라 실용적인 것입니다. 그래서 지금은 점점 더 아이, 로봇.

휴머노이드 로봇에 대한 주류적 관심은 2022년 후반에 테슬라가 옵티머스를 공개하면서 시작되었습니다. 그 이후로 많은 로봇 회사가 전 세계 미디어와 투자자들의 주목을 받았습니다. 이것이 새로운 "와우" 로봇 형태가 되었습니다.

출처: Morgan Stanley

기존 로봇과 어떤 점이 다릅니까?

전통적인 로봇은 10년 이상 존재해 왔습니다. 이러한 기존 로봇은 미리 작성된 지시(일련의 명령을 따르고 "생각"할 수 없음)를 실행하기 위해 엄격한 프로그래밍에 의존했습니다. 전통적인 로봇은 본질적으로 유연성이 거의 없는 반복적이고 미리 프로그래밍된 동작으로 제한되었으며 처리할 수 있는 작업의 복잡성이 제한되었습니다. 반면 구체화된 AI 로봇은 강화 학습을 사용하는 실제 데이터로 훈련되었으며 "생각"할 수 있는 능력을 개발했습니다.

2024년 10월, 리야드에서 열린 기술 컨퍼런스에서 화상 통화를 하는 동안 일론 머스크는 2040년까지 $20,000에서 $25,000 사이의 가격대를 가진 휴머노이드 로봇이 최소 100억 대가 될 것이라고 예측했습니다. 리야드에서 열린 기술 컨퍼런스에서 화상 통화를 통해. 아직은 그 단계에 이르지 못했지만, 프런티어 로봇 모델을 통해 로봇이 더 쉽게 접근 가능해지고 널리 보급되는 단계에 한 걸음 더 가까워졌습니다. 아메카테슬라, 애질리티 로보틱스, 유니트리 등이 있습니다.

출처: Morgan Stanley

테슬라 CEO인 머스크는 최근 주주총회에서 미래에 휴머노이드가 인간보다 2대 1 이상 많을 것이라고 예측했습니다. 그것은 엉뚱하고 무섭습니다.

그리고 오늘 Goldman Sachs의 CEO인 David Soloman은 다음과 같이 말했습니다. AI는 비즈니스 생산성을 혁신할 것입니다. 그의 견해에 따르면 결국 주니어 은행원들이 하는 일의 상당 부분이 AI로 대체될 것입니다. 예를 들어 95% IPO 신고 문서 초안 작성은 이제 AI가 몇 분 안에 완료할 수 있습니다. "마지막 5%가 중요해졌어요. 나머지는 이제 상품이 되었으니까요."

경영진은 이러한 혁명을 바라보며 언젠가는 AI 로봇이 우리를 대체(보조)할 것이라고 생각하고 있습니다.

개발 및 제한 사항

2024년 3월 엔비디아 기조연설 또한 물리적 AI-로봇공학에 집중했습니다. 로봇의 발전은 세 가지 주요 요인에 달려 있습니다. 1) GenAI, 2) 액추에이터 및 기계, 3) 배터리 저장(여기서 재생 에너지 솔루션에 대해 글을 쓸 때 언급했던 내용이기도 합니다)

세 가지 요소가 함께 진행될 수 있다면, 인간형 로봇의 대량 확장 및 상용화는 몇 년 안에 이루어질 가능성이 큽니다. 이제, Unitree 기사에서, 저는 중국에 대해 이야기하겠습니다. 중국은 하드웨어 제조 분야에서 오랜 경험을 가지고 있으며, 기계 기술과 전자 기술을 결합한 메카트로닉스 분야에서 노하우 우위를 점하고 있으며, 지난 수십 년 동안 다양한 가전제품의 하드웨어 제조 허브가 되었습니다. 미국은 여전히 GenAI 분야에서 선두를 달리고 있지만, 문제는 어느 요소가 더 중요한가, 아니면 협력 의도가 있는가입니다. 그리고 마지막 요소는 누가 알아낼 수 있을까요? 더 나은 배터리 솔루션입니다. 배터리를 더 가볍고, 더 오래 지속되고, 더 안전하게 만들 수 있을까요?

출처 Morgan Stanley – 이 분야의 선도 기업을 확인해 보세요.

우리 인간은 수십 년 동안 로봇이 우리와 나란히 있는 세상을 꿈꿔왔습니다. 2013년 영화 Her에서 우리는 가상의 AI 연인을 상상했습니다(이제 사실상 현실이 될 수 있습니다). 2024년 메건 폭스 서브서비언스가 등장하는 SF 스릴러에서 물리적 AI는 우리의 충실함, 충성심에 대한 도덕성에 도전하고 심지어 해로운 안전 위험으로 이어집니다. 언젠가 로봇 자아를 만들 것이라는 상상은 항상 있었습니다. 다만 지금은 기술이 마침내 우리의 상상력을 따라잡을 만큼 발전했습니다. (분명히 현재의 휴머노이드는 아직 메건 폭스와 전혀 닮지 않았습니다)

영화 /Subservience/에서 인간과 사랑에 빠져 악으로 변하는 로봇

영화 /Her/에서 AI 음성 에이전트와 사랑에 빠진 인간 주인공

그래서 제가 말하고자 하는 것은, 이것은 분명히 시작에 불과하다는 것입니다. 현재 모든 리소스가 물리적 AI(또는 일반적인 AI)로 이동함에 따라, 이 학제간 분야는 초기 단계에서 벗어나 우리가 이해할 수 있는 것보다 더 빠르게 발전할 것입니다. 물리적 세계와 디지털 세계가 계속해서 서로 형성되고 융합됨에 따라, 2살짜리 아이의 어머니로서 안전에 대한 우려가 정말 걱정됩니다. 스마트폰이 이미 아이들을 현실에 대해 혼란스럽게 만들고 있다면, 우리는 이 기술을 어떻게 규제해야 할까요? 그리고 로봇은 그녀가 10대가 되었을 때 무엇을 할 수 있을까요?

아직 풀어야 할 것이 많으므로 AI Proem에 새로운 세로 항목을 추가하겠습니다. 물리적 AI. 이 수직에서 저는 물리적 AI 개발에 영향을 미칠 수 있는 많은 영역을 탐구할 것입니다. 먼저, 저는 종종 보스턴 다이내믹스와 비교되는 중국의 선도적인 휴머노이드 로봇 회사인 유니트리 로보틱스에 대해 심층적으로 살펴볼 것입니다. 또한 저는 시간을 내어 살펴보려고 노력해 온 배터리 솔루션 각도도 탐구할 것입니다. 저의 재생 에너지에 대한 글입니다.

그런 다음 로봇이 어떻게 불량해질지에 대한 가능한 이론에 대한 우려를 탐구하는 것이 흥미로울 것이라고 생각합니다. 이는 전반적인 로봇 안전과 로봇 기계의 손재주와 관련이 있습니다. 그런 다음 연결성, 대역폭, 지연 합병증 및 기타 핵심 구성 요소(센서(LIDAR), 센서 융합 및 소프트웨어 아키텍처 기술)의 기술적 문제가 있습니다. 이는 또한 EV 회사가 Tesla의 발자취를 따라 AI 우선 회사로 전환하는 방법을 살펴볼 또 다른 진행 중인 작업과 관련이 있습니다(예: Li Auto).

또한 AI가 우리의 업무 흐름에 어떤 영향을 미칠지까지 다루 범위를 확대하고 싶습니다. 따라서 물리적 AI 도입이 우리 노동력에 어떤 영향을 미칠지 알아보고 있으며, 그 후 AI 소프트웨어나 AI가 가장 인기 있는 인터넷 시대 소프트웨어 플랫폼에 어떤 영향을 미칠지 조사하고 있습니다.

배울 것도 쓸 것도 너무 많아요! 지금은 toodeloo~

읽어주셔서 감사합니다 AI 프로엠! 새로운 게시물을 받고 내 작업을 지원하려면 무료로 구독하세요.

이전 게시물
당신은 또한 좋아할 수 있습니다

댓글을 남겨주세요:

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다