アーパボー(ARPABLE)
アープらしいエンジニア、それを称賛する言葉・・・アーパボー
ロボット

SO-101 AIロボット制作|模倣学習からSim2Realまで備品・機材を完全整理【2026年】

SO-101 AIロボット制作|模倣学習からSim2Realまで備品・機材を完全整理【2026年】

SO-101の組み立てを終えた翌日、動作確認しようとしてUSBシリアルアダプタが手元にないことに気づく——これが最初の躓きである。

次に照明を用意せずデモ収集を開始し、50エピソード分のデータが使い物にならなかったことに気づく。これが二度目の躓きである。

本記事は、その躓きを事前に回避するための備品整理である。アームと主要部品が揃っている前提で、模倣学習(フェーズ①)からSim2Real(フェーズ②)まで、フェーズ別に必要な備品を目的・用途・推奨型番つきで整理する。

✅ この記事の結論(TLDR)

  • 模倣学習(フェーズ①)の最小追加調達:USBシリアルアダプタ/ACアダプタ/GPU PC/Webカメラ×2/照明×2が核心。アームとサーボが揃っていれば、追加投資20〜25万円前後でデモ収集を開始できる。
  • ラズパイは今フェーズ不要:SO-101はUSBシリアルアダプタでGPU PCに直結して動作する。ラズパイはSim2Real後のエッジデプロイフェーズで初めて登場する。
  • Webカメラはラズパイカメラより優先:LeRobotの標準構成はUSB接続のWebカメラ前提。ラズパイカメラはロボット組み込みフェーズまで不要。
  • Sim2Real(フェーズ②)ではSSD 2TB・RAM 64GBへの増強が必須:Isaac Labの合成データ生成は桁違いのストレージを消費する。最初から2TBを確保するのがコスパ最良。
  • 照明は最重要の見落とし備品:環境光が安定しないと学習精度が大きく低下する。固定光源の確保はデモ収集前に完了させること。

この記事の結論:フェーズ別に備品を分けて考える

模倣学習とSim2Realは必要な備品の性格が大きく異なる。今すぐ動かすフェーズと、将来の拡張フェーズを分けて整理することが、無駄な先行投資を避ける最短ルートである。

SO-101プロジェクトにおける備品調達で最初に判断すべきことは、「いま動かすために何が必要か」と「将来のSim2Realに何が必要か」を混同しないことである。

模倣学習(Behavior Cloning)フェーズでは、実機アームとGPU PCをUSB接続してデモデータを収集する。高価なシミュレーション環境やエッジデバイスは一切不要である。一方、Sim2RealフェーズではIsaac Lab上で大規模な合成データを生成するため、ストレージ・メモリの要件が桁違いに増える。

本記事では、以下の前提で備品リストを整理する。

  • リーダーアーム・フォロアーアーム:組み立て済み
  • サーボモーター:キャリブレーション・設定済み
  • ラズパイ・Jetson:フェーズ②まで不要

なぜ備品の整理が学習精度に直結するのか

「とりあえず動いた」状態からでは学習精度は上がらない。照明・固定・カメラ位置という物理的な再現性こそが、模倣学習データの品質を決定する根本要因である。

模倣学習の精度は、アルゴリズムの優劣よりもデモデータの品質に依存する割合が高い。そしてデータ品質を決めるのは以下の3要素である。

  1. 照明の一定性:デモごとに照明が変わると、カメラが捉える色・陰影が変化し、モデルは同一タスクを別タスクとして学習してしまう。
  2. 位置の再現性:アームの設置位置・タスク物体の配置がデモごとにズレると、学習データの一貫性が失われる。方眼シートとクランプはこのための備品である。
  3. 視覚入力の安定性:カメラの固定位置・台数・解像度は全デモを通じて統一する必要がある。

備品の揃え方は、後続の学習工程の成否を左右する。逆に言えば、この3要素さえ押さえれば、アルゴリズムの改良より先に学習精度は上がる。

フェーズ①:模倣学習に必要な備品(今すぐ調達)

アームとサーボが揃っている前提で、模倣学習を開始するために追加で必要な備品の全リストである。優先度順に整理する。

🔴 最優先:これがないと動かない

備品 目的・用途 推奨スペック 推奨型番 価格目安
USBシリアルアダプタ PCとFeetechサーボを接続する通信アダプタ。これがないとアームへの指令送受信が一切できない CH343G / FT232RLチップ搭載、USB-A to TTL Waveshare CH343G USB-UART Board ¥1,500前後
ACアダプタ(アーム給電) サーボモーターへの安定電力供給。USB給電では電力が不足する DC 5V / 5A以上(SO-101仕様準拠) Feetech純正アダプタ ¥2,000前後
スイッチ付き電源タップ アーム暴走・誤動作時にワンタッチで全電源を遮断する安全装置 個別スイッチ付き・接地3ピン・4〜6口 エレコム T-ST02-2620BK ¥2,500前後
GPU搭載PC デモ録画・モデル学習・推論の中枢。WSL2・仮想環境は検証コストが高いため、本記事では専用Ubuntuマシンを前提とする。最低ラインはRTX 3060クラスでも開始できるが、SO-101で動画ベースの模倣学習を継続運用するなら以下が実務的な推奨値 RTX 4070以上・VRAM 12GB以上・RAM 32GB以上・Ubuntu 22.04(推奨値) RTX 4070 Ti搭載デスクトップ or ノートPC ¥200,000
前後
NVMe SSD デモ動画・モデル・チェックポイントの高速保存。HDDでは学習速度のボトルネックになる PCIe Gen4・読み書き5,000MB/s以上・512GB〜1TB Samsung 990 Pro 1TB ¥15,000
前後

🟡 次に優先:データ収集の品質に直結

備品 目的・用途 推奨スペック 推奨型番 価格目安
Webカメラ × 2台 アーム動作の視覚入力録画。俯瞰1台+正面1台で死角をカバー。LeRobotの標準構成は2台前提 1080p / 30fps以上・USB3.0・自動露出OFF可能 Logicool C920s ¥8,000×2台
カメラスタンド × 2台 カメラを固定位置に安定設置。デモ間のカメラ位置ズレは学習データの一貫性を破壊する 高さ30〜80cm調整可能・クランプ式 Ulanzi MT-08 ¥3,000×2台
セルフパワーUSBハブ カメラ2台+アーム2本をPC同時接続するための分岐装置。バスパワーでは電力不足になる USB3.0・4口以上・ACアダプタ付きセルフパワー Anker A7516 ¥3,500前後
照明ライト × 2台 最重要の見落とし備品。作業エリアの照明を固定し、環境光変化による認識精度の低下を防ぐ。固定光源なしでは高い学習精度は期待できない 色温度調整可能・フリッカーフリー・LEDパネル型 Neewer 660 LEDビデオライト ¥6,000×2台
ポジショニングシート
(方眼紙A3)
アームの設置位置・タスク物体の置き場所をデモごとに統一する基準シート。位置再現性が学習精度に直結する A3サイズ・5mm方眼・厚手(耐久性) コクヨ方眼紙A3 / LeRobot公式PDF印刷版(GitHub配布) ¥500前後
単色背景板 カメラ映像の背景を均一にして物体認識ノイズを排除する。白または黒の単色が推奨 A1〜A2サイズ・白または黒・非反射素材 ケント紙A1(白)/ 布製撮影バックグラウンド(黒) ¥500前後

🟢 運用・保守

備品 目的・用途 推奨スペック 推奨型番 価格目安
予備サーボ(STS3215)
× 3個
デモ収集中のサーボ故障に備えたストック。破損時に即交換して作業継続するため。※交換後は再キャリブレーション必要 Feetech STS3215純正 Feetech STS3215(秋月電子等で入手) ¥3,000×3個
強力クランプ × 2個 アームを作業台にガッチリ固定する。クランプなしでは振動がデータに混入する 開口50mm以上・金属製 秋月電子 [105315] ¥500×2個
タスク用小物
(複数セット)
ロボットに学習させるタスクの対象物。破損・紛失時の継続性確保と同一条件での複数デモ収集のため 作業内容に合わせた形状・重量 LEGOデュプロブロック(初期検証に最適) ¥2,000前後
有線LANケーブル HuggingFace Hubへの大容量データ・モデルのアップロード用。数GB〜数十GBになるためWi-Fiより安定した有線接続が必要 Cat6以上・3〜5m エレコム LD-GPT/BU30(Cat6) ¥800前後
結束バンド・ケーブルクリップ 複数ケーブルを整理・固定し、アーム動作への干渉を防ぐ マジックテープ式・再利用可能 VELCRO ワンラップ ¥1,000前後
養生テープ 作業台へのポジショニングマーキング補助、カメラスタンド・背景板の仮固定 弱粘着・幅15〜25mm・カラー複数色 ニトムズ J3000 ¥500前後

💻 ソフトウェア・アカウント(無償)

項目 目的・用途 推奨バージョン 入手先
Ubuntu LeRobot公式サポートOS。CUDA・ドライバの安定動作に必要。WSL2・仮想環境は非推奨 22.04 LTS ubuntu.com
LeRobot デモ収集・模倣学習・推論を一貫して行うHuggingFace製メインフレームワーク 最新版(GitHub) github.com/huggingface/lerobot
HuggingFace Hubアカウント 収集したデータセット・学習済みモデルのクラウド保存・バージョン管理 無料プランで可 huggingface.co
Git / GitHub コード・設定ファイルのバージョン管理。チーム間での設定共有にも使用 Git 2.x以上 git-scm.com
CUDAドライバ GPU学習・推論に必須のNVIDIA公式ドライバ CUDA 12.x developer.nvidia.com

💰 フェーズ①の追加調達コスト概算

  • PC除く追加調達:5〜7万円前後(カメラ・照明・電源・保守小物)
  • GPU PC(RTX 4070 Ti):¥200,000前後
  • カメラ・照明・スタンド周辺:¥35,000前後
  • USBシリアル・電源・ハブ類:¥10,000前後
  • 保守・小物類:¥15,000前後
  • 合計目安:25〜30万円前後(PC込み)

この構成で、SO-101による最初の模倣学習デモまで最短1〜2週間の立ち上げが現実的なラインになる。

フェーズ②:Sim2Realに必要な追加備品(模倣学習が安定してから)

Isaac Labを使ったSim2Realフェーズでは、大規模な合成データ生成・並列学習・エッジデプロイに対応するため、ハードウェアとソフトウェアの両面で大幅な増強が必要になる。

⚠️ フェーズ②はフェーズ①が安定してから着手すること。Sim2Realの成功はフェーズ①で蓄積した実機デモデータの質が前提となる。

🔴 ハードウェア追加・増強

備品 目的・用途 推奨スペック 推奨型番 価格目安
GPUアップグレード Isaac Labの大規模並列学習を回すためのGPU増強。RTX 4070クラスではVRAMが限界になるケースが多い RTX 4080 / 5080・VRAM 16GB以上 RTX 5080搭載PC or GPU単体換装 ¥150,000〜250,000
RAM増設(64GB) ROS2複数ノード+物理シミュレーション同時実行。32GBでは競合してFPSが低下する DDR5・64GB(32GB×2) Crucial DDR5 64GB Kit ¥25,000前後
SSD増設(2TB以上) Isaac Labでフォトリアリスティックな環境を作り、マルチビュー画像・深度・マスクまで含めて合成すると、1シーンあたりのデータ量は実写より簡単に1桁増える。Omniverse Assetsとシミュレーションログだけで数百GB、タスクバリエーションを増やすと合成データは1〜3TB規模に膨らむため、2TB SSDを「最初から埋まる前提の作業領域」として確保しておいた方が、あとからの増設よりトータルコストを抑えられる PCIe Gen4・NVMe・2TB以上・読み書き5,000MB/s以上 Samsung 990 Pro 2TB ¥25,000前後
Raspberry Pi 5
(8GB版)
学習済みモデルをロボットに搭載してエッジ推論・自律動作させるためのオンボードコンピュータ。フェーズ①では不要 8GB版必須(4GB版はAI推論とロギングの同時実行でメモリ不足になる) 秋月電子 [130282] ¥25,190前後
Pi 5用電源アダプタ(27W) Raspberry Pi 5への安定給電。5V/5A供給が必須。標準的なUSB充電器では動作不安定になる 27W・USB-C・5V/5A 秋月電子 [118451] ¥2,310前後
Raspberry Piカメラモジュール V3 ロボット本体に搭載するCSI接続カメラ。エッジ推論・自律動作フェーズで使用。Webカメラとは別に用意する Pi Camera Module V3・CSI接続 秋月電子 [OBTS42](またはエレショップ) ¥5,940前後
Jetson Orin Nano Super
(将来)
ラズパイでは処理しきれない高度なAIモデルの推論エンジン。Sim2Realで育てた上位モデルを実機デプロイする際のアップグレード先 8GB・デベロッパーキット Jetson Orin Nano Super Dev Kit ¥52,800前後

💻 ソフトウェア追加(無償)

項目 目的・用途 推奨バージョン 入手先・備考
Ubuntu 22.04 / 24.04 LTS Isaac Sim 5.x系は両バージョンを正式サポート。フェーズ①で22.04を使用中であればそのまま継続可能。24.04への移行は任意であり必須ではない 22.04 または 24.04 LTS(どちらも可) ubuntu.com
Isaac Sim 5.1系 NVIDIA Omniverse上で動くロボット向け3Dシミュレータ本体。高精度な物理演算・センサーシミュレーションを担当 5.1系(pip導入)※6.0はGA版未公開のため現時点では5.1推奨 pypi.nvidia.com(pipインストール)
Isaac Lab Isaac Sim上で強化学習・模倣学習を行う学習フレームワーク。SO-101のデジタルツインを並列で大量学習させる 最新版 github.com/isaac-sim/IsaacLab
Python 3.11仮想環境 Isaac Sim 5.x系の動作要件。Python 3.10・3.12ではIsaac Lab実行時にエラーになる 3.11固定(3.10・3.12は非対応) python.org
ROS 2 複数センサー・ノードの非同期通信制御。Sim2Realでの実機連携に使用 Humble / Jazzy ros.org
URDFデータ(SO-101) Isaac Sim上でSO-101のデジタルツインを構築するための実機物理モデル定義ファイル SO-101公式URDF HuggingFace / GitHubで取得

💰 フェーズ②の追加調達コスト概算

  • GPU増強(RTX 5080):¥150,000〜250,000
  • RAM増設(64GB):¥25,000前後
  • SSD増設(2TB):¥25,000前後
  • Raspberry Pi 5(8GB)+電源+カメラ:¥33,000前後
  • Jetson Orin Nano Super(将来):¥52,800前後
  • 合計目安(Jetson除く):25〜35万円前後

全備品チェックリスト:フェーズ別サマリー

模倣学習スタートからSim2Real完遂まで、全備品を2フェーズで整理したサマリーである。調達前のチェックリストとして活用できる。

【フェーズ①:模倣学習】今すぐ調達

▼ 最優先(動作に必須)
□ USBシリアルアダプタ(Waveshare CH343G)
□ ACアダプタ DC5V/5A(Feetech純正)
□ スイッチ付き電源タップ(エレコム T-ST02)
□ GPU搭載PC(RTX 4070以上・RAM 32GB・Ubuntu 22.04)
□ NVMe SSD 1TB(Samsung 990 Pro)

▼ データ収集品質
□ Webカメラ × 2台(Logicool C920s)
□ カメラスタンド × 2台(Ulanzi MT-08)
□ セルフパワーUSBハブ(Anker A7516)
□ 照明ライト × 2台(Neewer 660 LED)★見落とし注意
□ ポジショニングシート A3方眼紙
□ 単色背景板(白または黒)

▼ 運用・保守
□ 予備サーボ STS3215 × 3個
□ 強力クランプ × 2個
□ タスク用小物(複数セット)
□ 有線LANケーブル Cat6
□ 結束バンド・ケーブルクリップ
□ 養生テープ

▼ ソフトウェア(無償)
□ Ubuntu 22.04 LTS
□ LeRobot(HuggingFace)
□ HuggingFace Hubアカウント
□ Git / GitHub
□ CUDAドライバ 12.x

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
【フェーズ②:Sim2Real】模倣学習安定後に着手

▼ ハードウェア追加・増強
□ GPU増強(RTX 4080 / 5080・VRAM 16GB以上)
□ RAM増設 64GB(DDR5)
□ SSD増設 2TB以上(Samsung 990 Pro 2TB)★Isaac Lab必須
□ Raspberry Pi 5(8GB版)
□ Pi 5用電源アダプタ(27W)
□ Raspberry Piカメラモジュール V3
□ Jetson Orin Nano Super(将来フェーズ)

▼ ソフトウェア追加(無償)
□ Ubuntu 22.04 / 24.04 LTS(22.04からそのまま継続可。24.04移行は任意)
□ Isaac Sim 5.1系(pip経由)
□ Isaac Lab(GitHub)
□ Python 3.11仮想環境(3.10・3.12は非対応)
□ ROS 2(Humble / Jazzy)
□ SO-101 URDFデータ

まとめ:備品の揃え方が学習成果を決める

模倣学習の成否は、アルゴリズムの選択よりも物理的な実験環境の再現性に依存する割合が高い。備品リストは「消耗品の調達表」ではなく「実験精度の設計書」である。

SO-101プロジェクトで何度も痛感したのは、「アルゴリズムを変える前に、環境を変えよ」という単純な事実だった。模倣学習の成否は、華やかなモデル名よりも、どれだけ同じ条件でデモを取り続けられるかに左右される。だからこの備品リストは、単なる買い物リストではなく、SO-101の学習精度を決める実験設計書として書いている。

本記事で整理した備品は、以下の3つの判断基準に基づいている。

  1. フェーズを混同しない:模倣学習フェーズとSim2Realフェーズでは必要なものが根本的に異なる。今すぐ必要ではないものへの先行投資は避ける。
  2. 物理的な再現性を最優先にする照明・固定・カメラ位置の3要素が学習データの品質を決定する。これらへの投資はアルゴリズム改善より先に行う。
  3. Sim2Realはストレージが命:Isaac Labの合成データ生成は実写収録と桁違いのデータ量になる。SSD 2TB以上をフェーズ②開始前に確保することがコスパ最良の選択である。

まずフェーズ①の備品を揃え、50〜100エピソードのデモ収集と最初の学習サイクルを完了させることが最優先のマイルストーンである。


参考サイト・出典

📚 合わせて読みたい

よくある質問(FAQ)

Q. ラズパイはフェーズ①から必要ですか?
A. 不要である。SO-101はUSBシリアルアダプタでGPU PCに直結して動作する。ラズパイはSim2Real完了後、学習済みモデルをロボットにオンボード搭載して自律動作させるフェーズで初めて必要になる。

Q. Webカメラは1台でも始められますか?
A. 1台でも技術的には開始できるが、LeRobotの標準構成・サンプルコードは2台前提で書かれており、1台にする場合はコード修正が必要になる。タスクが単純であれば1台スタートも現実的な選択肢である。

Q. SSDは最低何GBあれば模倣学習を始められますか?
A. フェーズ①の模倣学習のみであれば256GBでも開始は可能だが、デモ数が増えると不足する。512GB〜1TBが現実的な最小構成である。Isaac Lab(フェーズ②)を見据えるなら最初から2TBを確保することをすすめる。

Q. Isaac LabにはUbuntu 22.04と24.04どちらが必要ですか?
A. Isaac Sim 5.x系はUbuntu 22.04・24.04の両方を正式サポートする。pip経由インストールの要件はGLIBC 2.35以上であり、Ubuntu 22.04はこれを満たす。フェーズ①で22.04環境を構築済みであれば、そのままSim2Realへ移行できる。24.04への移行は必須ではなく任意の選択肢である。

Q. 照明はどんなものでも良いですか?
A. フリッカーフリーかつ色温度が固定(または調整可能)なLEDパネル型が推奨である。蛍光灯・デスクライト・窓からの自然光は環境光の変化が大きく、デモごとに画像の色調が変わり学習精度を著しく低下させる。Neewer 660等の撮影用LEDを2台固定配置することが最も効果的である。

更新履歴

  • 2026年5月28日:初稿アップ
ABOUT ME
ケニー 狩野
ケニー狩野(Kenny Kano)は、AI社会実装・技術経営・ITコンサルティングを専門とする経営者・監修者。株式会社ベーネテック代表、株式会社アープ取締役、一般社団法人Society 5.0振興協会 AI社会実装推進委員長。早稲田大学大学院理工学研究科修了後、キヤノンで国内外の開発や中国・インド・オーストラリアを含むオフショア案件を牽引。独立後はAI社会実装支援に従事し、Arpableで人工知能・先端技術分野の記事を約2年間で約300本監修。中小企業診断士、PMP、ITコーディネータ。著書『リアル・イノベーション・マインド』。実務と経営を橋渡しする。