“Giai đoạn tiếp theo của AI được gọi là AI vật lý. AI vật lý là nơi AI tương tác với thế giới vật lý. Nghĩa là robot.” – Jensen Huang, Nvidia, tại lễ khai trương nhà máy ở miền trung Đài Loan vào ngày 16 tháng 1 năm 2025.

Năm nay, CES tập trung vào việc tích hợp AI vào phần cứng, từ thiết bị đeo đến đồ nội thất được hỗ trợ AI cho đến robot! Sự chú ý không phải là những robot máy móc không hấp dẫn mà các nhà kho đều áp dụng—những robot vui nhộn mà chúng ta thấy trong phim khoa học viễn tưởng—mà là những robot trông giống người.

Chúng ta có thể nói rằng robot đang có một "khoảnh khắc" ChatGPT. (tức là công nghệ này không phải là mới, nhưng sự quan tâm của công chúng và vốn đã được đánh thức)

Đặc biệt, năm ngoái, chúng ta đã thấy AI tạo sinh đã biến đổi mạnh mẽ ngành robot như thế nào. Robot trước đây được điều khiển từ xa giờ đây có thể "tự suy nghĩ", tích hợp AI vào máy trong quá trình tích hợp phần cứng-phần mềm liền mạch. Chúng ta đang chứng kiến những ngày đầu của hai lĩnh vực khoa học hoàn toàn khác nhau kết hợp lại với nhau: LLM/Gen AI và robot.

Chỉ tuần trước, người ta đã đưa tin rằng OpenAI đã bí mật mở lại bộ phận robot của mình sau khi đóng cửa vào năm 2020.  Theo công ty, nhóm nghiên cứu robot mới của họ sẽ tập trung vào việc "mở khóa robot đa năng và hướng tới trí thông minh cấp độ AGI trong bối cảnh thực tế năng động".

[Tôi sẽ công bố một bài viết chuyên sâu về Unitree, công ty hàng đầu về robot hình người và robot bốn chân sử dụng AI trong vài tuần tới, vì vậy hãy chú ý theo dõi.]

Điều tôi thấy hữu ích là sử dụng khuôn khổ này khi cố gắng hiểu AI vật lý, để xem xét toàn bộ quá trình như một quá trình liên tục gồm ba bước:

  • Cảm biến (mắt, tai và tay của robot—công nghệ cảm biến),
  • Suy nghĩ (quá trình ra quyết định—GenAI),
  • và Diễn xuất (khả năng thực hiện và tạo ra tác động trong thế giới vật chất—cơ điện tử).

Theo cách phân loại kỹ thuật hơn, Diana Wolf Torres, một nhà văn chuyên viết về AI, cho biết kiến trúc hệ thống có thể được chia thành:

1) Lớp nhận thức: Đây là nơi máy xử lý đầu vào cảm biến đa phương thức thông qua các thuật toán hợp nhất cảm biến tiên tiến. Nó giúp máy tính hiểu rõ hơn về môi trường vật lý xung quanh nó.

2) Lớp nhận thức: Đây là cốt lõi của cách AI tích hợp vào robot truyền thống. Nó đóng vai trò là bộ não ra quyết định của máy, xử lý dữ liệu thu thập được từ lớp hoàn thiện của nó dựa trên các mô phỏng được đào tạo trước để quyết định cách phản ứng với thế giới vật lý.

3) Lớp hành động: Lớp này thực sự tạo ra “đầu ra” cho thế giới vật lý, đảm bảo độ chính xác trong chuyển động và nơi chúng ta sẽ thấy hành động nhảy, đi bộ hoặc di chuyển của vật thể.

Và AI vật lý bao gồm rất nhiều thứ: 1) xe tự hành (tôi đang nghiên cứu một phần), 2) Robot chuyên dụng – tự động hóa kho/lao động (theo truyền thống là những gì chúng ta biết), và 3) Robot hình người.

Nguồn: Morgan Stanley

Tuyên bố miễn trừ trách nhiệm: Hôm nay, chúng ta sẽ chỉ tập trung vào Robot hình người. Tôi đã cố gắng hết sức để làm cho suy nghĩ của mình trở nên hợp lý khi ghi lại chúng và cố gắng hiểu mối quan hệ đang phát triển giữa robot và AI.

Robot hình người

Đầu tiên, AI hiện thân là gì?

AI hiện thân đề cập đến các tác nhân trí tuệ nhân tạo (AI) — rô-bốt, trợ lý ảo hoặc các hệ thống thông minh khác — có thể tương tác và học hỏi từ môi trường vật lý. (Định nghĩa của Qualcomm)

Trong nhiều năm, chúng ta đã quen với cánh tay robot dùng trong kho, robot pha cà phê ở khắp Tokyo và Thượng Hải, chó robot dùng cho mục đích giải trí và giao hàng, và các thiết bị tương tự khác. Nhưng những con robot này đã mất đi yếu tố gây ấn tượng.

Khoảng mười năm trước, một người bạn của gia đình đã đầu tư vào một nhà hàng robot ở Bắc Kinh. Đó là một cỗ máy có thể cắt và chế biến khoảng 10 món ăn được lập trình sẵn trong máy. Mẹ tôi nghĩ rằng nó thật tuyệt, nhưng con robot trông không giống người, chỉ là một cỗ máy khác, vì vậy sự mới lạ này không có tác dụng với tôi (tôi khá chắc là họ đã đóng cửa cửa hàng sau một năm). Các món ăn có vị ngon, nhưng nấu ăn không phải là khoa học; bạn cần cảm nhận ngọn lửa và lượng muối cần thêm. Đôi khi, bạn cần làm cho nó hấp dẫn hơn và ứng biến. Trường hợp sử dụng phù hợp hơn là đối với một căng tin trường đại học/khuôn viên trường lớn, các nhà máy hoặc nhà tù, nơi bạn cần cung cấp thực phẩm chuẩn hóa trên quy mô lớn một cách hiệu quả. Nó không hiệu quả như một nhà hàng giá trung bình ở khu thương mại trung tâm của Bắc Kinh. Có nhiều lựa chọn khác tốt hơn để ăn ở đó hơn là một món ăn do robot chế biến có hương vị bình thường.

Bây giờ, chúng ta hãy giới thiệu về người máy, robot được thiết kế giống con người về mặt vật lý. Chúng có hai tay, hai chân và một đầu, và khả năng di chuyển của chúng bắt chước cơ thể chúng ta.

Jensen Huang phát biểu tại Computex: “Robot dễ thích nghi nhất trên thế giới là robot hình người vì chúng ta đã xây dựng thế giới cho chúng ta”, đồng thời nói thêm: “Có nhiều dữ liệu hơn để đào tạo những robot này vì chúng ta có cùng vóc dáng”.

Và tôi đồng ý với anh ấy. Sự ám ảnh của chúng ta với những con rô-bốt trông giống con người giờ đây đã vượt ra ngoài sự ích kỷ và tự phụ của chúng ta với tư cách là con người. Đó là một vấn đề về quang học nhưng cũng là một vấn đề thực tế. Vì vậy, bây giờ nó nghe có vẻ ngày càng giống Tôi, Robot.

Sự quan tâm chính thống đối với robot hình người bắt đầu vào cuối năm 2022 khi Telsa ra mắt Optimus. Kể từ đó, nhiều công ty robot đã nhận được sự chú ý từ giới truyền thông và các nhà đầu tư trên toàn thế giới. Đây đã trở thành hình dạng robot "wow" mới.

Nguồn: Morgan Stanley

Chúng khác với robot truyền thống như thế nào?

Robot truyền thống đã xuất hiện trong hơn một thập kỷ. Những robot thông thường này dựa vào lập trình cứng nhắc để thực hiện các hướng dẫn được viết sẵn (làm theo một tập hợp các lệnh và không thể "suy nghĩ"). Robot truyền thống về cơ bản bị giới hạn ở các chuyển động lặp đi lặp lại, được lập trình sẵn với ít sự linh hoạt và độ phức tạp của các nhiệm vụ mà chúng có thể xử lý bị hạn chế. Trong khi đó, robot AI hiện thân được đào tạo trên dữ liệu thực tế sử dụng học tăng cường và chúng đã phát triển khả năng "suy nghĩ".

Vào tháng 10 năm 2024, trong một cuộc gọi video tại một hội nghị công nghệ ở Riyadh, Elon Musk dự đoán rằng đến năm 2040, sẽ có ít nhất 10 tỷ robot hình người có giá từ $20.000 đến $25.000 thông qua cuộc gọi video tại một hội nghị công nghệ ở Riyadh. Mặc dù chúng ta vẫn còn xa mới đạt được điều đó, nhưng chúng ta đã tiến gần hơn một bước đến việc robot trở nên dễ tiếp cận/phổ biến hơn với các mô hình robot tiên tiến từ Ameca, Tesla, Agility Robotics, Unitree, v.v.

Nguồn: Morgan Stanley

Trong cuộc họp thường niên gần đây nhất của mình, Musk, CEO của Tesla, đã dự đoán rằng người máy sẽ đông hơn con người gấp đôi hoặc hơn trong tương lai. Thật hoang đường (và đáng sợ).

Và ngay hôm nay, David Soloman, CEO của Goldman Sachs, đã nói rằng AI sẽ cách mạng hóa năng suất kinh doanh. Quan điểm của ông là cuối cùng, phần lớn những gì các nhân viên ngân hàng cấp dưới làm sẽ được thay thế bằng AI, chẳng hạn như soạn thảo các tài liệu nộp hồ sơ IPO 95%, hiện có thể được AI hoàn thành trong vài phút, “5 phần trăm cuối cùng hiện quan trọng vì phần còn lại hiện là một hàng hóa.”

Các nhà điều hành đang nhìn vào cuộc cách mạng này và thực sự nghĩ rằng một ngày nào đó, robot AI sẽ thay thế (hỗ trợ) chúng ta.

Phát triển và hạn chế

Bài phát biểu quan trọng của Nvidia vào tháng 3 năm 2024 cũng tập trung vào AI vật lý - robot. Sự tiến bộ của robot phụ thuộc vào ba yếu tố chính: 1) GenAI, 2) bộ truyền động và cơ học, và 3) lưu trữ pin (tôi cũng đã đề cập đến trước đây khi viết về các giải pháp năng lượng tái tạo ở đây)

Nếu ba yếu tố này có thể cùng nhau tiến triển, thì việc mở rộng quy mô và thương mại hóa robot hình người có thể sẽ diễn ra trong vài năm tới. Bây giờ, trong bài viết của Unitree, tôi sẽ nói về Trung Quốc, với kinh nghiệm lâu năm trong sản xuất phần cứng, điều này đã mang lại cho họ lợi thế về bí quyết trong cơ điện tử, kết hợp công nghệ cơ khí và điện tử, vì đây là trung tâm sản xuất phần cứng cho nhiều thiết bị khác nhau trong vài thập kỷ qua. Trong khi Hoa Kỳ rõ ràng vẫn đang dẫn đầu trong GenAI, câu hỏi đặt ra là yếu tố nào quan trọng hơn, hay sẽ có ý định hợp tác? Và ai có thể tìm ra câu trả lời cuối cùng? Một giải pháp pin tốt hơn. Họ có thể làm cho pin nhẹ hơn, bền hơn và an toàn hơn không?

Nguồn Morgan Stanley – Hãy xem xét các công ty hàng đầu trong lĩnh vực này.

Con người chúng ta đã mơ về một thế giới nơi robot sát cánh cùng chúng ta trong nhiều thập kỷ, từ bộ phim Her năm 2013, nơi chúng ta tưởng tượng ra một người yêu AI ảo (mà giờ đây điều đó gần như có thể trở thành hiện thực), cho đến bộ phim kinh dị khoa học viễn tưởng năm 2024 có sự góp mặt của Megan Fox Subservience, nơi AI vật lý thách thức đạo đức của chúng ta về lòng chung thủy, lòng trung thành và thậm chí dẫn đến những rủi ro an toàn có hại. Trí tưởng tượng luôn cho rằng một ngày nào đó chúng ta sẽ tạo ra những bản ngã robot. Chỉ là bây giờ, công nghệ cuối cùng đã tiến bộ đủ để bắt kịp trí tưởng tượng của chúng ta. (Rõ ràng là những người máy hiện tại không giống Megan Fox chút nào)

Một con robot yêu con người và trở nên độc ác trong bộ phim /Subservience/

Nhân vật chính là con người, người phải lòng một nhân viên giọng nói AI trong bộ phim /Her/

Vì vậy, theo quan điểm của tôi, đây rõ ràng chỉ là sự khởi đầu. Khi tất cả các nguồn lực hiện đang đổ dồn vào AI vật lý (hay AI nói chung), lĩnh vực liên ngành này sẽ trưởng thành từ giai đoạn mới chớm nở và tiếp tục phát triển nhanh hơn cả những gì chúng ta có thể hiểu được. Khi thế giới vật lý và kỹ thuật số của chúng ta tiếp tục định hình và hòa trộn vào nhau, những lo ngại về an toàn thực sự khiến tôi, một người mẹ của một đứa trẻ 2 tuổi, lo lắng. Nếu điện thoại thông minh đã khiến trẻ em bối rối về thực tế, thì chúng ta nên quản lý công nghệ này như thế nào và robot sẽ có khả năng làm gì khi trẻ đến tuổi thiếu niên?

Vẫn còn nhiều điều cần giải quyết, vì vậy tôi sẽ thêm một mục dọc mới vào AI Proem: AI vật lý. Trong theo chiều dọc này, tôi sẽ khám phá nhiều lĩnh vực có thể ảnh hưởng đến sự phát triển của AI vật lý. Đầu tiên, tôi sẽ đi sâu vào công ty robot hình người hàng đầu của Trung Quốc, Unitree Robotics, thường được so sánh với Boston Dynamics. Tôi cũng sẽ khám phá góc giải pháp pin, mà tôi đã cố gắng dành thời gian để xem xét sau tác phẩm năng lượng tái tạo của tôi.

Sau đó, tôi nghĩ sẽ rất thú vị khi khám phá những mối quan tâm xung quanh các lý thuyết có thể xảy ra về cách robot sẽ trở nên bất thường. Điều này liên quan đến sự an toàn chung của robot và sự khéo léo của máy móc robot. Sau đó, có những vấn đề kỹ thuật về kết nối, băng thông, độ trễ phức tạp và các thành phần quan trọng khác—cảm biến (LIDAR), công nghệ kết hợp cảm biến và kiến trúc phần mềm. Điều này cũng liên quan đến một tác phẩm đang tiến hành khác sẽ xem xét cách các công ty EV đang chuyển đổi thành các công ty AI theo bước chân của Tesla (ví dụ như Li Auto).

Tôi cũng muốn mở rộng phạm vi nghiên cứu của mình để bao gồm cả cách AI sẽ tác động đến quy trình làm việc của chúng ta, vì vậy tôi đang tìm hiểu cách lực lượng lao động của chúng ta sẽ bị tác động bởi việc áp dụng AI vật lý và sau đó có khả năng nghiên cứu phần mềm AI sắp ra mắt hoặc cách AI sẽ tác động đến các nền tảng phần mềm phổ biến nhất thời đại internet của chúng ta.

Có quá nhiều thứ để học và viết! Bây giờ, toodeloo~

Cảm ơn bạn đã đọc AI Proem! Đăng ký miễn phí để nhận bài viết mới và ủng hộ công việc của tôi.

Đăng bởi Grace Thiệu
BÀI VIẾT TRƯỚC
Bạn cũng có thể thích

Để lại bình luận của bạn:

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *