SO-101で始めるPhysical AI｜Sim2Real実践記録

最終更新：2026年6月15日
※本記事はプロジェクトの進行に合わせて最新情報へアップデートしています。

このプロジェクトは、大企業の研究所で始まったものではありません。業務後の時間を活用し、月10時間程度という小さな持ち時間から、6人のメンバーで始めた株式会社アープのPhysical AI先駆けプロジェクトです。

目的は、SO-101ロボットアームを完成させることだけではありません。すぐそこまで来ているPhysical AI時代に先駆けて、従来の「仕様を書き、コードで制御する」開発から、AIに何を見せ、どの環境で学ばせ、何を成功とみなすかを設計する「学習中心の開発スタイル」へ移行するためです。

本記事では、アープがSO-101でPhysical AIとSim2Realに挑む理由、そこで習得したい設計パターン、実機で早くも見えた現実、そしてこの知見を全社へ広げるための記録方針を整理します。

📖 読了時間 14分｜🎯対象：Physical AI・Sim2Real・AIロボット開発を組織で学びたい方｜🛠 難易度：★★☆

✅ 先に結論

最大の目的：SO-101を動かすことではなく、Physical AI時代の学習中心の設計パターンを全社で習得する牽引役をつくることです。
始め方：専任研究所ではなく、業務後の月10時間程度、6人の小さなチームから始めます。
学ぶ流れ：Behavior Cloningでお手本を記録し、Sim2Realで仮想と現実の差を学び、Fine-tuningで現実に合わせて補正します。
重要な転換：これからのAIロボット開発では、動作を書く力だけでなく、AIに何を学ばせるかを設計する力が問われます。
記録の価値：失敗、判断、環境構築、データ収集、電源・配線のつまずきまでを記録し、社内外で再利用できる実践知に変えます。

この記事の著者・監修者　ケニー狩野（Kenny Kano）

Arpable 編集部（Arpable Tech Team）

株式会社アープに所属するテクノロジーリサーチチーム。人工知能の社会実装をミッションとし、最新の技術動向と実用的なノウハウを発信している。
役職：(株)アープ取締役。Society 5.0振興協会・AI社会実装推進委員長。中小企業診断士、PMP。著書『リアル・イノベーション・マインド』▶ 詳細はこちら

Toggle

なぜ今、月10時間からPhysical AIに挑むのか

この挑戦の本質は、ロボット制作ではなく、Physical AI時代の開発思想を先行体験することです。

Physical AIは、AIが画面の中で文章や画像を生成するだけでなく、現実世界を見て、判断し、身体を通じて動く段階へ進む技術領域です。工場、物流、介護、点検、農業、建設、教育。AIが現実の物体や空間と関わる場面は、これから急速に広がっていきます。

しかし、Physical AIの開発スタイルは、従来のソフトウェア開発とは大きく異なります。画面上の仕様をコードに落とし込むだけではなく、カメラ、アーム、照明、摩擦、対象物、データ、学習モデル、シミュレーション環境をまとめて設計しなければなりません。現実世界は、コードのようにきれいには動いてくれません。昨日は成功した把持が、今日は照明の角度やケーブルのたわみで失敗します。

だからこそ、アープはこの領域を「調査記事で眺める」だけでは足りないと考えました。すぐそこまで来ているPhysical AI時代に備えるには、実際に手を動かし、失敗し、設計判断を蓄積する必要があります。

ただし、いきなり大規模な研究体制を作るわけではありません。業務後の時間を使い、月10時間程度から、6人のメンバーで小さく始めます。これは弱さではなく、むしろ強みです。限られた時間で始められるからこそ、同じようにPhysical AIへ踏み出したい中小企業や開発チームにとって、再現しやすいモデルになります。

このプロジェクトは、アープがPhysical AIを「語る会社」から「試し、学び、提案できる会社」へ進むための先駆けです。

SO-101は何を学ぶための教材なのか

SO-101は安価なロボットアームであると同時に、学習中心の開発スタイルを体験する教材です。

SO-101は、Hugging FaceのLeRobot系で扱われる小型ロボットアームです。大規模な産業ロボットとは異なり、手元で組み立て、キャリブレーションし、カメラとPCに接続し、行動ログを記録できます。だからこそ、Physical AIの入口として適しています。

このプロジェクトでSO-101を使う理由は、ロボットアームそのものの性能を競うためではありません。重要なのは、AIロボット開発の学習ループを小さく分解して体験できることです。

SO-101で体験する学習ループ
段階	何をするか	習得したい設計パターン
Behavior Cloning	人間がお手本動作を見せ、行動ログを記録する	何を見せ、どんなデータを集めるか
Sim2Real	仮想環境で条件差に耐えるかを検証する	身体・場・成功条件をどう定義するか
Fine-tuning	実機で出たズレをもとに追加調整する	現実との差分をどう測り、どう埋めるか
※ Arpable編集部作成（2026年6月版）

SO-101を使うと、AIロボット開発で必要な一連の流れを、手元の実機で確認できます。組み立て、電源、カメラ、記録、学習、シミュレーション、実機評価。どれか一つでも曖昧だと、ロボットは安定して動きません。

この「安定して動かない」現実こそ、教材としての価値です。Physical AIでは、モデルだけが賢くても不十分です。身体、環境、データ、評価条件を揃えなければ、学習は成立しません。SO-101は、その当たり前を小さく、しかし痛みを伴って教えてくれる教材なのです。

学習中心の設計パターンとは何か

学習中心の設計とは、動作を書き切るのではなく、AIが学べる条件を設計する開発スタイルです。

従来のロボット開発では、人間が動作を細かく分解し、座標、角度、速度、条件分岐をプログラムしてきました。環境が安定している工場では、この方法は今でも強力です。しかし、対象物の位置が少しずれる、照明が変わる、摩擦が変わる、カメラの見え方が変わると、すべての例外を人間が書き切ることは難しくなります。

Physical AI時代の開発では、発想が変わります。人間がすべての動作を命令するのではなく、AIが学習できる条件を作ります。つまり、次の問いが開発の中心になります。

AIにどんなお手本を見せるのか
どの角度からカメラで観測するのか
どの範囲の失敗を許容し、何を成功とみなすのか
シミュレーションでどの条件を揺らすのか
実機で出たズレをどう記録し、どう次の学習へ戻すのか

これは、ソフトウェア開発でいう「実装」よりも前にある、設計思想そのものの変化です。コードを書く前に、AIが学ぶ世界を設計する。これが学習中心の設計パターンです。

人間がどう動かすか。
ではなく、AIにどう学ばせるか。

この問いをチームで扱えるようになることが、今回の最大の目標です。SO-101を動かせる人を一人つくるのではなく、Physical AIの設計判断を理解し、周囲へ伝え、次の案件やPoCへ展開できる牽引役を育てます。

全社で習得するとはどういうことか

全社で習得するとは、全員がロボットを組み立てることではなく、判断基準を共有することです。

このプロジェクトでいう「全社で習得する」は、社員全員がSO-101を直接操作するという意味ではありません。重要なのは、Physical AIの開発で何が難所になり、どの判断が品質や再現性に効くのかを、組織の共通言語にしていくことです。

たとえば、営業や経営企画のメンバーが「AIロボット開発ではデータだけでなく、電源・観測環境・成功条件の設計が重要だ」と理解していれば、顧客との会話は変わります。PMが「実機で失敗した理由を責めるのではなく、次の学習条件へ戻す」と理解していれば、進捗管理の見方も変わります。エンジニアが「モデル精度だけでなく、身体・場・成功の定義をそろえる」と理解していれば、実装の優先順位も変わります。

全社習得とは、Physical AIを専門部署だけの技術に閉じ込めず、提案・設計・実装・運用の全員が同じ地図を見られるようにすることです。

Behavior CloningからSim2Realへ、何を体得するのか

BC、Sim2Real、Fine-tuningは独立作業ではなく、失敗を学習へ戻す一つのループです。

最初に取り組むのはBehavior Cloningです。人間がリーダーアームを動かし、フォロワーアームの動き、カメラ映像、関節角、タイムスタンプを記録します。これは単なる操作練習ではありません。AIにとっての「最初の記憶」を作る工程です。

ここで失敗しやすいのは、データ量だけを見てしまうことです。大切なのは、同じ作業を何回録ったかだけではありません。対象物の位置、カメラ画角、照明、作業台、グリッパーの入り方が、学習に耐える形で揃っているかが重要です。良いデータとは、たくさんあるデータではなく、AIが何を学ぶべきかが明確なデータです。

次にSim2Realへ進みます。ここで多くの人が誤解しやすいのは、「BCデータをそのままシミュレーションへ渡せばよい」と考えてしまうことです。しかし、Sim2Realに必要なのはBCデータそのものではありません。ロボットの身体、作業空間、成功条件を、学習可能な仮想世界として定義することです。

最後にFine-tuningです。シミュレーションでうまくいった動作を実機へ戻すと、必ずズレが出ます。サーボの個体差、関節の摩擦、電源容量、ケーブルの取り回し、カメラのわずかな角度。こうしたズレを測り、記録し、モデルや環境定義へ戻すことがFine-tuningの本質です。

この一連の流れを体験することで、エンジニアは「動くコード」ではなく「学習するシステム」を設計する感覚を身につけます。

実機で早くも見えた現実：電源・配線・環境構築の壁

Physical AIの学習は、モデル以前に、電源・配線・観測環境という現実から始まります。

このプロジェクトはまだ序盤ですが、すでに重要な知見が出ています。たとえば、SO-101 Pro版のフォロワーアームでは、同梱電源のままでは実使用時に電流容量が不足する可能性が見えました。ロボットが動かないとき、原因はAIモデルではなく、電源、配線、コネクタ、サーボ負荷、保護回路にあるかもしれません。

これは一見すると地味な話です。しかし、Physical AIではこの地味な部分が本質です。AIロボットは、クラウド上のソフトウェアと違い、現実の電流、熱、摩擦、振動、重力の中で動きます。電源が弱ければ、どれだけ高度なモデルを使っても実機は止まります。カメラ画角が悪ければ、AIは間違った世界を見て学びます。

だからこそ、このプロジェクトでは失敗を隠しません。電源トラブル、Ubuntu環境の選定、LeRobotのセットアップ、カメラ配置、URDF変換、Isaac Simのゲイン調整まで、つまずいた箇所をすべて記録します。

この失敗記録は、単なる反省ではありません。同じ道を進む次のチームが、同じ場所で止まらないための設計資産です。Physical AIの先駆けプロジェクトにおいて、失敗はコストではなく、再現可能な知見の源泉なのです。

なぜスパイラルで進め、THE PACKAGEを残すのか

未知の領域では、最初から正解を決めるより、リスクを一つずつ潰す設計が有効です。

このプロジェクトでは、最初から完璧な計画を立てて、その通りに進めることを目指しません。Physical AIは、実際にやってみないと分からないことが多い領域です。机上では正しく見える構成でも、実機では電源が足りない、USB認識が不安定、カメラの視野が悪い、シミュレーションと現実の挙動が合わない、ということが起きます。

そのため、アープは「チャレンジ→観察→クイックピボット」を基本方針にします。まず試す。結果を見る。うまくいかなければ、早く方向を変える。これは失敗を許すという意味ではありません。失敗を早く見つけ、次の設計へ戻すためのプロジェクト運営です。

そこで重要になるのが、THE PACKAGEです。これは、本プロジェクト固有の成果物名であり、手順書、トラブルシューティング、失敗記録、設計判断ログ、制作過程の記録をまとめた再現可能な実践知の総体です。

THE PACKAGEに残すもの
記録するもの	残す理由
環境構築手順	別メンバーや次プロジェクトが再現できるようにする
失敗記録	同じ失敗を繰り返さないための判断材料にする
設計判断ログ	なぜその構成を選んだかを後から説明できるようにする
実機検証結果	机上の仮説と現実の差分をチームで共有する
記事・動画・社内LT	個人の経験を組織の知識へ変換する

動くロボットは壊れるかもしれません。しかし、設計判断と失敗の記録は残り続けます。その記録が、次のエンジニアの学習時間を短縮し、全社でPhysical AIを扱うための共通言語になります。

SO-101実践シリーズの読み方

本記事はプロジェクト宣言ハブであり、詳細実装はSO-101実践シリーズへ接続します。

本記事では、なぜアープが月10時間・6人でPhysical AIへ挑むのかを説明しました。実際の手順や技術詳細は、SO-101実践シリーズとして分担しています。読者の関心に応じて、次の順番で読むと理解しやすくなります。

SO-101実践シリーズの読み方
読みたいこと	記事	役割
全体像を知る	SO-101で学ぶPhysical AI	BC→Sim2Real→Fine-tuningの設計原理
何を準備するか	SO-101の機材準備	電源、カメラ、GPU PC、外部機材
行動ログを録る	SO-101 Behavior Cloningセットアップ	LeRobotで模倣学習データを採取
仮想身体を作る	URDF・USD変換とIsaac Simゲイン調整	Sim2Real前の身体モデル整備
成功条件を設計する	身体・タスク・Ground Truthを定義する	身体・場・成功基準の整理
NVIDIA Isaacとの関係を知る	SO-101で理解するNVIDIA Isaac	Isaac型設計思想との接続

このシリーズの狙いは、単発の技術メモを増やすことではありません。SO-101という小さな実機を軸に、Physical AI時代の開発スタイルを、機材、データ、シミュレーション、評価、組織学習へつなぐことです。

2年間のロードマップはどう見るべきか

ロードマップは固定計画ではなく、学習の成熟度に応じて更新される仮説です。

現行計画では、1年目にReal-to-Realの型を作り、2年目にSim2Realへ進む構想です。1年目は、機材準備、行動ログ取得、Behavior Cloning、再現性設計、失敗分析を中心に進めます。2年目は、URDFやUSDによる仮想身体の構築、Isaac Sim / Isaac Labでの検証、Domain Randomization、Fine-tuningへ進みます。

ただし、このロードマップは固定された契約仕様ではありません。Physical AIの実践では、電源、サーボ、ソフトウェア環境、学習データ、シミュレーション条件のどこで詰まるかを最初から完全には予測できません。だからこそ、スパイラル型で進め、各段階で最大のリスクを一つずつ潰します。

重要なのは、2年後に計画通りのロボットを完成させることだけではありません。計画を更新しながら、何を学び、何を諦め、何を次の設計へ戻したかを記録することです。その記録が、社内のエンジニア育成にも、将来の受託開発にも、Arpableでの情報発信にもつながります。

まとめ：Physical AIを語る会社から、試し、学び、提案できる会社へ

月10時間の小さな挑戦は、Physical AI時代へ進むための全社的な学習装置になります。

このプロジェクトの目的は、SO-101ロボットアームを完成させることだけではありません。すぐそこまで来ているPhysical AI時代に先駆けて、学習を中心とした新しい開発スタイルを、全社で習得するための牽引役をつくることです。

業務後の月10時間程度、6人のチームで始める取り組みは、大きな研究開発プロジェクトに比べれば小さく見えるかもしれません。しかし、小さく始めるからこそ、実務に近い制約の中で何が起きるかを記録できます。時間が足りない。環境構築で詰まる。電源が弱い。カメラの位置でデータ品質が変わる。そうした一つひとつの現実が、Physical AI開発の本当の教材になります。

アープは、この挑戦を通じて、AIロボットを一台作るだけでなく、Physical AIを試し、失敗し、学び、提案できる会社へ進んでいきます。月10時間から始まるこの先駆けプロジェクトは、アープが次のAI時代に踏み出すための最初の実験室です。