インテリジェント・ドライビングのエンドツーエンド大規模モデルに関する調査レポート（2026年）

Intelligent Driving End-to-End Large Model Research Report, 2026

発行: ResearchInChina
発行日: 2026年05月08日
ページ情報: 英文 595 Pages
納期: 即日から翌営業日
商品コード: 2064024

翻訳ツール提供対象
自動車関連専門

概要

インテリジェントドライビング大規模モデルに関する調査 - 技術競合とパラダイム統合の重要な時期

自動運転技術がL2からL3～L4へと急速に進化する中、インテリジェントドライビングシステムは、従来のルール駆動型アーキテクチャから、データ駆動型＋認知駆動型の次世代アーキテクチャへと大きく転換しつつあります。その基盤となる中核技術として、インテリジェントドライビング大規模モデルは、業界競合における中核的な分野となっています。フィジカルAI時代の到来が加速する中、自動運転はその最初の大規模な応用シナリオとして位置づけられ、自動車を従来の移動手段の枠を超えた「スーパーエージェント」へと急速に進化させ、モビリティ、モバイルオフィス、家庭生活、そしてサードパーティのエコシステムを結びつける全シナリオ対応のインテリジェントハブへと変貌させています。

産業の観点から見ると、フィジカルAIは依然として技術的融合の初期段階にあり、世界の自動運転市場には未開拓の巨大な潜在力があります。データによると、世界の乗用車保有台数は約15億台、商用車およびトラックは2億8,000万台、稼働中のタクシーは1,800万台に上ります。世界の年間総走行距離は13兆キロメートルに達する一方、自動運転の走行距離はわずか7億キロメートルで、全体の約0.006%に過ぎません。将来の増分ポテンシャルは極めて大きいと言えます。

さらに技術導入のペースから判断すると、インテリジェントドライビングの大規模モデルは、重要な技術的イテレーションの窓期を迎えつつあります。セグメント化されたエンドツーエンドソリューションは2024年から2025年にかけて量産段階に入り、単一モデルによるエンドツーエンドおよびVLA技術は2025年から2026年にかけて集中的に導入される見込みです。これに加え、自動運転体験の継続的な向上や、L3～L4レベルの高レベル自動運転技術の成熟化が加速していることから、フィジカルAIも急速に発展しています。ResearchInChinaは、自動運転向け大規模モデルの3つの主要な動向を予測しています。

動向1：2026年の自動運転大規模モデル進化の核心は、複数の技術ルートの競合と深い統合となります。

Bosch、Momenta統合モデル1：ワンモデル・エンドツーエンド＋ワールドモデル＋強化学習、代表的なサプライヤー - WeRide、Bosch、Momenta

特徴：ワンモデル・エンドツーエンドモデルは、スマートドライビングの中核となるニューラルネットワークとして機能し、センサー入力と運転出力を情報損失ゼロで直接接続し、極めて高い性能上限を実現します。ワールドモデルは、将来の道路状況の推論を担当し、シミュレーション訓練のために低コストで膨大なロングテールシナリオを生成できます。強化学習は、報酬メカニズムに基づいて推論空間内で反復・最適化を行い、最適な運転戦略を出力し、様々な突発的な状況に対処します。これら3つの組み合わせにより、「データ生成（ワールドモデル）→ポリシー学習（強化学習）→意思決定と実行（エンドツーエンドモデル）」という強力な閉ループが形成されます。これにより、自動運転システムは膨大な運転データから学習し、進化し続けることが可能になります。

統合モード2：E2E+基盤モデル（VLM/VLA）+ 強化学習+ ワールドモデル、代表的なサプライヤー - Horizon RoboticsおよびAfari Technology

特徴：ビジョン・言語大型モデルは認知的推論を担う「大脳」として機能し、小型のエンドツーエンドモデルは迅速な実行を担う「小脳」として機能します。

Horizon Roboticsは、単一モデルによるE2E+VLM+強化学習+ ワールドモデルを採用しています。Horizon Roboticsの「高速思考＋低速思考」というデュアルトラックの自動運転アーキテクチャは、強化学習を中核としています。一方では、ワールドモデルとシミュレーショントレーニングを通じてエンドツーエンドの直感モデルを強化し、ミリ秒単位での応答を可能にすると同時に、稀な短時間シーケンスのロングテールシナリオへの対応能力を補完します。他方、推論機能の強化を通じてVLM認知モデルを強化し、長時系列の複雑なシナリオに対する意味理解能力と論理推論能力を高めています。最終的にVLMの機能を車両モデルへ移行させ、量子化と蒸留による軽量な展開を実現し、「ミリ秒レベルの高速応答＋長時系列の低速推論」というバランスの取れた閉ループを構築しています。

Afari Technologyは、VLA+E2E+ワールドモデルというアーキテクチャを採用しています。このアーキテクチャにおいて、VLAモデルはスローシステムによる高レベルな意思決定に類似した推論を担当し、E2Eエンドツーエンドアルゴリズムはファストシステムに類似したアクションのマッピングを担当します。320億パラメータの大規模モデルを用いて大規模マルチモーダル事前学習（VLM）を行い、70億パラメータの軽量モデルへと蒸留することで、性能と展開のバランスを最適化します。さらに、知覚と運転動作を整合させ、運転ドメインの知識を導入し（VLA）、教師あり微調整を通じて、高レベルの運転戦略と行動規範を学習します→人間の運転スタイルと安全制約を整合させる強化学習により、知覚・意思決定・制御の閉ループ最適化を実現します。

統合モード3：VLA+ワールドモデル、代表的なサプライヤー - Zhuoyu TechnologyおよびXPeng

特徴：VLAは、現在の環境の認識、過去の運転パターンの学習、および次の行動の決定を担当します。ワールドモデルは、道路上の各対象が今後5～10秒間にどのように相互作用するかを推論する役割を担います。VLAは現在を理解するのは得意ですが、未来を予測することは得意ではありません。一方、ワールドモデルは予測には優れていますが、予測結果について反省や推論を行うことはできません。この2つの組み合わせが、完全な「脳」を構成します。

動向2：VLAとワールドモデルの融合パラダイムは、フィジカルAIの実装における主要な手法の一つになると予想されます。

将来の自動運転大規模モデルの進化の核心は、その根底にあるパラダイムを「人間の運転の模倣」から「物理世界の理解」へと根本的に再構築することにあります。VLAとワールドモデルは、どちらか一方を選ぶという選択肢ではありません。将来の自動運転大規模モデルは、この両者の融合となるでしょう。現在、両者のアプローチの相違点は、VLAの支持者が「理解」を運転の前提と見なすのに対し、ワールドモデルの支持者は「予測」が鍵であると考えている点にあります。

ワールドモデル派は、物理世界の変化は連続的かつ高次元であると考えています。言語は離散的で低次元の記号体系であり、物理から言語への変換には必然的に情報の損失が伴います。ワールドモデルは、より高い帯域幅を持つ物理表現を直接操作します。VLA派は、VLAの最大の利点は、ワールドモデルやモデルベース強化学習と組み合わせて微調整できる点にあると考えています。VLAはワールドモデルの利点を吸収できますが、ワールドモデルはVLM/VLAの利点を活用できません。言語は人間の常識を圧縮したパッケージであるため、強力な汎化能力をもたらします。VLAは言語を通じて「常識推論」能力とChain-of-Thought（CoT）を備えており、それによって自己説明能力を獲得しています。

これら2つのアプローチの長所と相違点に基づき、業界では両者の融合に向けた取り組みが始まっています。現在、VLAとワールドモデルの融合には、主に3つの主流なモードが存在します。それは、潜在空間統一融合、アーキテクチャレベルでの深層融合、そしてモジュール型協調融合（クラウドシミュレータ型）です。

融合モード1：潜在空間統一融合、代表例 - Xiaomi OneVLおよびHuawei DriveVLA-W0

その核心は、推論段階で追加のモジュールを追加するのではなく、ワールドモデルの予測能力をVLAの学習目標に組み込むことにあります。具体的には、VLAモデルの学習プロセスに将来の画像予測タスクを追加することで、モデルが行動の予測だけでなく、将来の時点における環境状態（すなわち将来の画像）も学習できるようにします。この設計により、モデルは単に希薄な行動監督信号に適合させるだけでなく、運転環境の根底にある動的法則を学習するよう促されます。

潜在空間統合融合の事例1：Xiaomi OneVL自動運転モデル

2026年5月13日、XiaomiはVLA、ワールドモデル、潜在空間推論という3つの技術的アプローチを同一のフレームワークに統合した、完全オープンソースの自動運転モデル「Xiaomi OneVL」を正式にリリースしました。このモデルの核心的なブレークスルーは、潜在空間推論を通じて複数の技術的パラダイムを深く統合した点にあります。推論プロセスを人間が読める自然言語に分解し、単語単位で演繹論理を生成する従来のソリューションとは異なり、Xiaomi OneVLは高次元ベクトル化された潜在空間において、エンドツーエンドの論理演算を直接実行します。この潜在空間は、VLAのシナリオ認識・理解能力と、ワールドモデルの環境時系列予測能力の両方を統合しており、すべての推論演算はテキストレベルではなくベクトルレベルで行われるため、従来のVLAソリューションと比較して推論効率において飛躍的な向上を実現しています。

実装メカニズムに関しては、まず、モデル内に2種類の潜在変数、すなわち視覚的潜在トークンと言語的潜在トークンを導入しています。前者はシーン内の物理的関係や時系列の変化を符号化し、ワールドモデルの予測能力を担います。後者は運転意図や意味論的論理を表現し、VLAの理解能力を担います。

次に、OneVLでは2つの補助デコーダを導入しており、これらは学習段階でのみ使用されます。言語補助デコーダは、言語潜在トークンから人間が読めるCoTテキストを復元する役割を担い、モデルが特定の運転決定を下した理由を説明します。視覚補助デコーダは、視覚的潜在トークンから将来のフレームの視覚的トークン（0.5秒後および1.0秒後の画像）を予測する役割を担い、モデルがシーンの変化を予測できるようにします。推論時には、両方のデコーダが削除され、モデルは計画結果を直接出力します。これにより、ワンステップ推論が実現され、自己回帰によって引き起こされる遅延の蓄積が完全に排除されます。

潜在空間統合融合の事例2：Huawei DriveVLA-W0がワールドモデリングタスクを通じて将来の画像を予測

従来のVLAモデルは、「監督情報の不足」という根本的な問題に直面しています。VLAモデルの入力は高次元のマルチモーダルデータ（フロントビュー画像シーケンス、言語指示、過去の行動など）ですが、監督信号は低次元の行動トークンに過ぎません。モデルの表現能力の大部分が無駄になり、その結果、運転環境の複雑なダイナミクスを十分に学習できず、VLAモデルの持つ巨大な潜在能力を効果的に発揮することができません。

下の図からわかるように、トレーニングデータの量が70万フレームから700万フレーム、さらに7,000万フレーム（データ量が増加するにつれて）へと増加するにつれ、衝突率は低下傾向を示しています。つまり、トレーニングデータが多ければ多いほど、安全性は向上するということです。しかし、ワールドモデルを持たない従来のVLA技術パラダイムでは、データが700万フレームから7,000万フレームに増加すると、衝突率の低下ペースが鈍化します。これは、データがVLAの安全性能向上に及ぼす効果には限界があることを示しています。

疎な自己教師付き学習、データスケーリング則の破綻、物理的な時系列予測能力の欠如といったVLAの課題を解決するため、Huaweiは論文の中でDriveVLA-W0というトレーニングパラダイムを提案しました。これは、トレーニング段階において将来の画像を密な自己教師付き信号として予測するワールドモデルを導入し、環境の動的変化を理解する能力を維持しつつ、将来の時系列予測能力を向上させるものです。従来のVLAと比較して、DriveVLA-W0はワールドモデリング（将来の道路状況の予測）を追加しています。これにより、データ量が増えるほどその利点が拡大し、データのスケーリング法則が強化されます。

具体的には、VLAモデルの学習プロセスに将来の画像予測タスクを追加することで、モデルが行動の予測だけでなく、将来の時点における環境状態（すなわち将来の画像）も学習できるようにします。この設計により、モデルは単に疎な行動監督信号に適合させるだけでなく、運転環境の根底にある動的法則を学習するよう強制されます。

融合モード2：アーキテクチャレベルでの深層融合、代表例 - VLA-World

ワールドモデルが外部ツールとして機能し、まず生成してから伝達する事前学習融合（外部強化学習）とは異なり、アーキテクチャレベルでの深層融合では、ワールドモデルの機能をVLAの固有機能として内部化し、計画と生成が同一アーキテクチャ内で共に発展します。

2026年4月に上海交通大学とファーウェイ中央研究所が共同で提案したVLA-Worldは、世界モデル機能を深く組み込んだ統合型VLAアーキテクチャです。従来のソリューションでは、世界モデルとVLAは互いに独立しており、前者はシミュレーション動画の生成を担当し、後者は知覚推論と意思決定の出力を担当していました。VLA-Worldは、視覚生成と意思決定推論間の特徴量共有のために単一のVLAバックボーンネットワークを採用しています。軌道予測と視覚生成を同一の意思決定チェーンにおける連続したリンクとして統合し、まず運動軌道を予測し、その軌道に基づいて将来の画像を推論するという因果論理に従うことで、モジュールの深い結合と一貫性の高い推論チェーンを実現しています。

動作メカニズム：

軌道知覚による条件付け：VLA-Worldはまず軌道を予測し、その軌道を条件として将来のフレームを生成します。軌道予測の結果は、視覚生成の条件付け信号として直接機能し、生成プロセスを導きます。このようにして、軌道は「どこへ行くか」を決定し、画像は「そこに到着した時に何を見るか」を提示することで、因果的な依存関係を形成します。

生成と推論の統合：世界モデルとVLAが2つの独立したモジュールであった従来とは異なり、VLA-Worldでは両者が同じVLAバックボーンを共有します。つまり、視覚生成と推論を同一のVLA構造内で統合しています。

GRPOによるエンドツーエンドの整合 - 強化学習段階において、GRPO（Group Relative Policy Optimization）を用いてモデルを最適化します。モデルは複数の候補軌道とそれに対応する将来の画像を生成し、「想像された未来」が「実際の安全な決定」と一致する結果に対して報酬を与えます。このメカニズムにより、視覚生成はもはや独立したタスクではなく、常に下流の決定の質を高める役割を果たすようになります。

動向3：インテリジェントドライビングAIの基盤モデルへの進化が加速し、業界は基盤モデルの汎用的な認知・推論能力をめぐる競合期に突入します。

2026年は、自動運転基盤モデルの登場が始まった最初の年です。DeepRoute.ai、Afari Technology、Zhuoyu Technology、Li Auto、XPengが関連製品を発表しました。基盤モデルの核心は、物理世界に向けた汎用的かつ再利用可能な認知基盤を構築し、全レベルの自動運転との互換性と、シナリオを横断した能力の移行を実現することにあります。

第一に、自動運転は本質的に典型的なスケーリング問題であり、現在の実装は主にモデル容量の不足とデータ閉ループの効率の低さに制約されています。第一に、既存の基盤モデルは規模が限定的であり、ロングテールの複雑なシナリオに対する汎化能力が不十分です。第二に、高価値データのマイニングは手動による選別とレビューに依存しており、断片化が進み自動化が不十分なため、長期的な反復能力が制限されています。

モデル容量の不足とデータ閉ループの非効率性という2つのボトルネックに対処するため、DeepRoute.aiは、400億パラメータの統一型VLA基盤モデルというソリューションを提案しました。その中核となる革新は、「三位一体」のモデル役割設計にあり、同一のモデルが「ドライバー（視覚入力→リアルタイムの運転判断）」、「アナリスト（主要シナリオの診断的理解）」、「批評家／審判（運転行動の安全性と合理性の評価）」という3つの役割を同時に果たすことを可能にし、運転システムを単なる実行システムから、認知能力を備えたインテリジェントシステムへと進化させます。

前処理段階において、DeepRoute.aiは、軌跡の監督に依存する従来のエンドツーエンドモデルのアプローチ（データ利用率はわずか0.001%）を放棄し、代わりに動画予測タスクを採用しました。これにより、モデルは動画シーケンスを予測することで実世界の動的構造を学習できるようになり、すべてのピクセルを監督信号に変換することで、データ利用率をほぼ100%にまで高めています。

コアトレーニング段階（Mid-train）では、モデルは以下の3つのタスクを中心に共同学習を行います。V+A（ビジョン＋アクション）による従来のエンドツーエンド運転学習、V+A→L（アクション後の説明）によるアナリストとクリティックの役割の活性化、そしてV→L+A（マルチモーダル論理推論）による推論能力を持つドライバーの訓練です。Chain-of-Thoughtを活用し、モデルにまず主要なイベントの言語記述と決定ロジックを出力させ、その後具体的な運転軌道を出力させます。

エンジニアリング実装の面では、DeepRoute.aiは、KVキャッシュ、マルチトークン予測（MTP）、モデル量子化、および独自開発の推論エンジンといった最適化手法を用いることで、1,000個の視覚トークンと数十個の推論トークンに対する1ステップ処理のレイテンシを60～85ミリ秒以内に抑え、10～15Hzのリアルタイム閉ループ制御能力を実現しています。さらに、基盤モデルは車両用チップの演算能力に応じて柔軟にディスティレーションが可能であり、100 TOPSプラットフォームには純粋な運転VAモデルを、500 TOPSプラットフォームには論理推論機能を備えたVLAモデルを展開できます。

また、基盤モデルは、実世界の物理法則や空間論理を学習するために事前学習されており、ネイティブなゼロショット移行機能を備えています。汎用的な認知基盤を備え、モデルの蒸留、演算能力の最適化、機能の微調整を通じて、L2の運転支援からL4の自動運転に至るまで、あらゆるレベルに適応します。まずは自動運転に適用され、将来的にはヒューマノイドロボットや産業用ロボットなど、複数の分野へと展開し、「一つの基盤ですべてをインテリジェントにする」ことを実現します。

2026年、Zhuoyu Technologyは戦略を全面的に転換します。ネイティブマルチモーダル基盤モデルを技術的基盤とし、「インテリジェントドライビングTier 1サプライヤー」から「モビリティ・フィジカルAI企業」へのアップグレードを目指します。乗用車、商用車、L4製品、海外展開を網羅するあらゆるシナリオおよび垂直分野での量産拡大に注力し、さらに具現化ロボットの分野へと展開していきます。

ZhuoyuはVLA（VLA World Model、ネイティブマルチモーダルFM）を発表しました。これは、統一されたバックボーンを用いて視覚、テキスト、センサーデータを処理し、潜在空間内で物理推論を行い、運転アクションを直接出力するものです。事前学習段階から、画像・動画・テキスト・運転・ロボットデータを用いた共同学習を行い、統一された潜在空間において物理世界の予測と推論を行い、意味論と物理法則の両方を理解します。

2026年は、自動運転大規模モデルの技術的進化とパラダイム融合にとって重要な年となります。複数の技術ルートの競合と統合、VLAとワールドモデルの協調的実装、そして基盤モデルの大規模な展開が相まって、自動運転業界を「技術的探求」から「大規模実装」へと加速させるでしょう。多経路統合の技術革新であれ、基盤モデルの汎用的な展開であれ、その核心は「より安全で、より効率的、そして実際の運転シナリオにより適応できる」という目標を中心に据えることにあります。「物理AI」の実装という動向は、自動運転システムを「人間を模倣する」段階から「世界を理解する」段階へとさらに進化させ、真の自動運転を実現することになるでしょう。

将来的には、技術の継続的な進化と産業チェーンの協調的な向上に伴い、自動運転向け大規模モデルは既存のボトルネックを徐々に打破し、自動運転の大規模導入を支える中核となり、モビリティ分野の発展パターンを再構築するとともに、移動体物理AIのさらなるシナリオへの拡張と応用を促進することになるとみられています。

エンドツーエンド自動運転の用語と概念
エンドツーエンド自動運転用語の説明
エンドツーエンド関連概念の相関関係と相違点
エンドツーエンド自動運転の概要と開発状況
典型的なエンドツーエンドの自動運転事例
SenseTime UniAD：経路計画に特化した大規模AIモデルがエンドツーエンドの商用シナリオアプリケーションを提供
SenseTime UniADの技術原理とアーキテクチャ
Horizon VADの技術原理とアーキテクチャ
Horizon VADv2の技術原理とアーキテクチャ
VADv2のトレーニング
DriveVLMの技術原理とアーキテクチャ
Li Autoが専門家混合型（MoE）アーキテクチャを採用
MOEとSTR2
上海斉智研究所のE2E-ADモデルSGADS：強化学習と模倣学習に基づく安全で汎用的なE2E-ADシステム
上海交通大学のActiveADアクティブラーニング事例：データ中心の視点からデータラベリングのボトルネックを解決する
ほとんどのエンドツーエンドの自動運転システムは、基礎モデルに基づいて開発されています。
基礎モデル
視覚言語モデル（VLM）
インテリジェントドライビングにおけるビジョン言語モデル（VLM）の応用
自動運転における基礎モデルの応用
視覚言語モデル（VLM）の応用
視覚言語モデル（VLM）の開発経緯
視覚言語モデル（VLM）のアーキテクチャ
エンドツーエンドの自動運転におけるVLMの適用原理
エンドツーエンドの自動運転におけるVLMの応用
インテリジェントドライビングにおけるVLMモデルが直面する課題
視覚・言語・行動モデル（VLA）
VLM→VLA
VLM+E2E->VLA
VLAアーキテクチャの分析
典型的なVLAアーキテクチャ
VLAアーキテクチャ解析事例：Li Auto MindVLAアーキテクチャの分解（1）
VLAアーキテクチャ解析事例：Li Auto MindVLAアーキテクチャの分解（2）
VLA大型モデルの概念
VLAモデルの原理
VLAモデルの分類
VLA技術進化の解釈
エンドツーエンドの中核の一つとしての大規模言語モデル
VLAの技術アーキテクチャと主要技術
VLAの利点
VLAモデルの展開における課題-リアルタイム応答能力
VLAモデル展開におけるリアルタイム性能とメモリ占有率の課題
VLAモデルの展開における課題-データ
VLAモデルの展開における課題-長期任務計画能力
VLA大型モデルの進化経路
VLA技術パラダイムの代表モデル
VLAデータセットとベンチマーク
ワールドモデル
世界モデルプロトタイプ：メンタルモデル
世界モデルの主要な定義と応用開発
世界モデルの基本アーキテクチャ
自動運転を推進するワールドモデルの3つのコアバリュー
世界モデルの2つの主要な技術的ルート
生成世界モデルDIAMOND：拡散モデル＋リアルタイム強化学習適応＋長期安定性
生成型インタラクティブワールドモデルGenie：ラベルなしインターネット動画からの現実世界の物理法則の教師なし学習
WorldDreamerの技術的原理と開発プロセス
暗黙的世界モデル：V-JEPA2の技術的原理と経路
暗黙的世界モデル：Comma.aiの技術的原理と開発経路
世界モデルの枠組み設定と実施上の困難
トランスフォーマーモデルと拡散モデルに基づく動画生成手法
世界モデルは、エンドツーエンドの自動運転を実現するための理想的なアプローチの一つとなる可能性があります。
ワールドモデル- 仮想トレーニングデータの生成
ワールドモデル- テスラワールドモデル
ワールドモデル-NVIDIA
InfinityDrive：ドライビングワールドモデルにおける時間制限の打破
SenseAuto InfinityDriveのパラメータ性能
SenseAuto InfinityDriveのパイプライン
SenseTime DiTアーキテクチャと主なビデオ生成評価指標FID/FV
自動運転におけるワールドモデルの導入課題
エンドツーエンドの大規模モデル技術パラダイムの比較
拡散モデル
4つの主流生成モデル
拡散モデルの原理
拡散モデルは、インテリジェントな運転軌道生成の中核となるリンクを最適化
拡散モデル別インテリジェントな運転軌道生成の最適化
インテリジェントドライビングにおける拡散モデルの応用
拡散モデルの実践的な応用例

第2章エンドツーエンド自動運転の技術的ルートと開発動向

エンドツーエンド自動運転の技術動向
インテリジェントドライビングのエンドツーエンド大型モデルにおける進化経路のサマリー
トレンド1：2026年における自動運転大型モデル進化の中核となる焦点は、複数の技術ルートの競合と深い統合となる
統合事例1：Afari Technology社の自動運転システムの全体アーキテクチャはVLA+E2E協調型クローズドループを採用
統合事例2：L3対応ワールドアクションモデル（WAM）が「VLA+ワールドモデル+ 安全敵対モデル」の三位一体アーキテクチャを構築
トレンド2：VLAとワールドモデル融合パラダイムは、物理AI実装の主流アプローチの一つになると予想される
VLA+世界モデル統合事例1：Xiaomi OneVLがVLAと世界モデルを1つのフレームワークに統合
Xiaomi OneVLアーキテクチャの分解
VLA+Worldモデル統合事例2：XPengがX-Worldをローンチ
VLA+世界モデル統合事例3：Huawei DriveVLA-W0別世界モデリングタスクを通じた未来画像の予測
DriveVLA-W0アーキテクチャの分解
DriveVLA-W0は世界モデルを活用して自動運転データのスケーリング法則を増幅する
VLA+世界モデル統合事例4：BoschExploreVLAがVLA+RLに基づく世界モデルを導入し、3つの大きなブレークスルーを達成
Bosch ExploreVLAモデルアーキテクチャの分解
トレンド3：自動運転は物理的なAI段階に入りつつある
究極の形態の物理AIはデジタル世界と物理世界を結びつけ、自動運転はその最適な実装媒体となります。
トレンド4：インテリジェントドライビングAIの進化が基盤モデルに向けて加速し、業界は基盤モデルの汎用的な認知能力と推論能力を競合期に突入する
ケース1：DeepRoute 40B VLA基盤モデルにおけるハードコアな技術革新
事例2：卓宇科技の2026年戦略の中核：モバイルインテリジェント基盤モデルの構築（1）
事例2：卓宇科技の2026年戦略の中核：モバイルインテリジェント基盤モデルの構築（2）
事例3：XPengワールド財団モデル
トレンド5：エンドツーエンドの自動運転は、データクローズドループ競合と洗練された運用段階に入る
ケース：NVIDIA MOSAIC
トレンド6：ロボットとインテリジェントドライビングがAGIへの道のりにおける2つの主流エンドツーエンドアプリケーションシナリオとなる
エンドツーエンドの自動運転市場の動向
ADAS Tier 1サプライヤー間のエンドツーエンド自動運転大型モデル構成の比較
他のエンドツーエンド自動運転システムサプライヤーとのソリューション構成比較
OEM各社におけるエンドツーエンド自動運転大型モデル構成の比較（1）：Xiaomi、XPeng、Li Auto、NIO
OEM各社におけるエンドツーエンド自動運転大型モデル構成の比較（2）：Changan、BYD、Leapmotor
OEM各社（3社）におけるエンドツーエンド自動運転大型モデル構成の比較：Chery、Dongfeng汽車、IM Motors
OEM各社（4社）におけるエンドツーエンド自動運転大型モデル構成の比較：GAC、FAW Hongqi、Geely

第3章エンドツーエンドの自動運転サプライヤー

第4章エンドツーエンドの自動運転におけるOEMのレイアウト

Xiaomi
プロファイル
2026年戦略計画/li>
2026年の新車計画に関する総合分析
2026年新型車の製品ポジショニングとパラメータベンチマーク
インテリジェントドライビング部門の組織構造変更
インテリジェントドライビング技術ルート：単一技術に賭けない全ルート事前調査
VLAとエンドツーエンドルートの比較
インテリジェントドライビングアルゴリズムの進化トレンド：モジュール型エンドツーエンドからエンドツーエンドアーキテクチャへ　ワールドモデル＋強化学習の導入
2026年にXLAコグニティブラージモデルを発売
インテリジェントドライビングシステムと大型モデルの進化ロードマップ
HADの拡張版
エンドツーエンドのVLAインテリジェントドライビングソリューションOrion
ORIONフレームワーク
物理世界モデリングアーキテクチャ
3層分離モデリング別マルチモデルエンドツーエンド
長尺動画生成フレームワーク-MiLA
XPeng
エンドツーエンドのインテリジェントドライビング大型モデルへの進化ロードマップ
自動運転製品企画、2025年～2026年
2026年におけるレベル4自動運転レイアウト：ロボタクシー
第2世代VLA：ネイティブマルチモーダル物理世界大規模モデル
L4機能= モデル×コンピューティング能力×データ量×車両ハードウェア
第2世代VLA
世界財団モデル
世界財団モデルのコア技術パス
世界財団モデルの研究開発における3段階の成果
クラウドモデルファクトリー
エンドツーエンドシステム：アーキテクチャ
Li Auto
エンドツーエンドのインテリジェントドライビング大型モデルの進化ロードマップ
2026年に次世代統合アーキテクチャ「MindVLA-o1」を発売
次世代統合アーキテクチャMindVLA-o1
E2E+VLMデュアルシステムからMindVLAへの進化
MindVLAモデルのアーキテクチャ
MindVLAの中核技術1：優れた3D空間認識能力
MindVLAの中核技術2：大規模言語モデル（LLM）との統合
MindVLAのコアテクノロジー3：拡散とRLHFの組み合わせ
MindVLAの中核技術4：ワールドモデルとNVAIE加速強化学習
エンドツーエンドソリューション
Tesla
2024年AIカンファレンスの解釈
ADアルゴリズムの開発履歴
エンドツーエンドの進捗状況のサマリー、2023年～2024年
FSD v13
ADアルゴリズムの開発史：知覚重視・地図重視の時代への突入
ADアルゴリズムの開発履歴
ADアルゴリズムの開発履歴：マルチカメラ融合アルゴリズムHydraNet
ADアルゴリズムの開発履歴：FSD V12
知覚・意思決定フルスタック統合モデルのコア要素
エンドツーエンドアルゴリズム
世界モデル
データエンジン
Dojoスーパーコンピューターセンター：概要
道場スーパーコンピュータセンター：D1チップ統合に基づくトレーニングタイル
道場スーパーコンピューターセンター：計算能力開発計画
NIO
インテリジェントドライビング部門の組織構造調整、2024年～2025年
モデルベースからエンドツーエンドへ、ワールドモデルが主流の技術パラダイムとなる
エンドツーエンドの大規模モデルの進化経路
インテリジェントドライビングシステムの詳細な説明
NIO世界モデル（NWM）
世界モデルの想像力再構築能力と群知能
NSimシミュレーター（NIOシミュレーション）
ワールドモデル2.0
エンドツーエンドモデルとワールドモデルの比較
VLAと世界モデルの比較
Changan
Dubhe Plan 2.0-天樹インテリジェントドライビング
TOPS ADのソフトウェアアーキテクチャ
ブランドレイアウト
ADAS戦略：「Dubhe Plan」戦略
エンドツーエンドシステム：BEV+LLM+GoT
エンドツーエンドシステムを搭載した量産車：NEVO E07
Chery
製品マトリックスと車種
インテリジェントドライビングシステムの進化の歴史
2025年にファルコンパイロットの4つのバージョンを発売
エンドツーエンドのインテリジェントドライビング大型モデルの進捗状況
GAC Group
インテリジェントドライビング大型モデル戦略
ADiGOインテリジェントドライビングシステムの進化ロードマップ（ADiGO1.0からADiGO6.0まで）
2025年に5つの主要なインテリジェントドライビングプラットフォームを発売
L2.9車両および都市型NOAアルゴリズム／インテリジェントドライビングシステムサプライヤー
「デュアルグラディエントインテリジェントドライビングサプライヤー＋シナリオ価格精密マッチング」戦略により、都市型NOAの「ハイエンド志向＋大衆普及」を実現
華旺は「GACスマートマニュファクチャリング＋ファーウェイインテリジェンス」モデルを採用し、ハイエンド市場の拡大とブランドマトリックスの強化を図る
華王愛達ランドF03の第一弾モデルは2026年第2四半期に発売予定
Momenta 5.0のワンモデルエンドツーエンドアルゴリズムが15万元クラスの車両に搭載され、都市部NOA機能も利用可能になりました。
トランプチ・シャンワンS7にモメンタR6強化大型モデルを搭載
ADiGOエンドツーエンド具現化推論モデルのアーキテクチャ
ADiGOの中核技術
Leapmotor
2026年に世界モデルをリリース
D19はVLA大型モデルを採用し、全シナリオ対応のドアツードアNOAを実現
インテリジェントドライビングシステムの自社開発モデルを採用
Leapmotor Pilotの進化ロードマップ
エンドツーエンドの高度なインテリジェントドライビング
エンドツーエンドの高度なインテリジェントドライビングの応用シナリオ
IM Motors
インテリジェントドライビングシステムの反復履歴
インテリジェントドライビングに関するMomentaとの協力
IM ADエンドツーエンド2.0インテリジェントドライビング大型モデル
IM ADエンドツーエンド2.0インテリジェントドライビング大型モデルのコアテクノロジー
IM ADエンドツーエンド2.0インテリジェントドライビング大型モデル間のアプリケーションシナリオ比較
FAW Hongqi
Sinanインテリジェントドライビングの技術アーキテクチャ
エンドツーエンドの大規模モデルのコアテクノロジー
シナンインテリジェントドライビングソリューション
Sinanインテリジェントドライビングソリューションの車両展開スケジュールと将来計画
Sinanインテリジェントドライビングシステム：DJI Zhuoyu Technologyと共同開発
Sinanインテリジェントドライビングシステムの導入車両と主要構成
卓宇エンドツーエンド4.0システムが2026年に思南インテリジェントドライビングでデビュー
FAW紅旗9シリーズモデルは2026年にファーウェイのハイモードを採用予定
Dongfeng
インテリジェントドライビング戦略計画：2026年～2030年
2025年に天元インテリジェントドライビング製品マトリックス4段階を発表：レベル2からレベル4/レベル5までを網羅
Tianyuan T100/T200/T500を初めて搭載した量産車におけるインテリジェントドライビング構成の比較
天元インテリジェントドライビング技術アーキテクチャ研究開発
インテリジェントドライビング戦略：短期的には自社開発＋外部調達の並行運用、長期的には段階的な自社開発別代替
BYD
2026年インテリジェントドライビング計画の概要
インテリジェントドライビング分野におけるレイアウト：世界モデルに関する事前調査
インテリジェントドライビングチームの組織構造調整（１）：二つのインテリジェントドライビング部門を統合し、リソースを共有することで、普遍的なインテリジェントドライビングの実現を加速する
インテリジェントドライビングチームの組織構造調整（２）：先進技術研究開発センターの設立別投資の増加

インテリジェント・ドライビングのエンドツーエンド大規模モデルに関する調査レポート（2026年）

発行日: 2026年05月08日
発行: ResearchInChina
ページ情報: 英文 595 Pages
納期: 即日から翌営業日

ライセンス/価格

USD 4,500 換算

725,760円(税抜)より

本日の銀行送金レート: 1USD=
161.28円

ライセンスについて

レポートPDFを1名のみがご利用頂けるライセンスです。PDF内のテキスト等のコピー＆ペーストはできません。PDFの印刷もできません。

USD 6,800 換算

1,096,704円(税抜)より

本日の銀行送金レート: 1USD=
161.28円

ライセンスについて

レポートPDFの購入企業、およびその子会社の全世界の方にご使用頂けるライセンスです。ご利用人数に制限はありません。PDF内のテキスト等のコピー＆ペーストは可能です。PDFの印刷は何回でも可能です。印刷したもののご利用はPDFのご利用範囲に準拠します。

インテリジェント・ドライビングのエンドツーエンド大規模モデルに関する調査レポート（2026年）

目次

第1章エンドツーエンド自動運転技術の基礎

第2章エンドツーエンド自動運転の技術的ルートと開発動向

第3章エンドツーエンドの自動運転サプライヤー

第4章エンドツーエンドの自動運転におけるOEMのレイアウト

インテリジェント・ドライビングのエンドツーエンド大規模モデルに関する調査レポート（2026年）

目次

第1章 エンドツーエンド自動運転技術の基礎

第2章 エンドツーエンド自動運転の技術的ルートと開発動向

第3章 エンドツーエンドの自動運転サプライヤー

第4章 エンドツーエンドの自動運転におけるOEMのレイアウト

関連レポート

第1章エンドツーエンド自動運転技術の基礎

第2章エンドツーエンド自動運転の技術的ルートと開発動向

第3章エンドツーエンドの自動運転サプライヤー

第4章エンドツーエンドの自動運転におけるOEMのレイアウト