カテゴリー別アーカイブ: 人工知能

AGI(人間を超えるAI)がリリースされると社会は重大なリスクに直面する、未成熟なAIと共に成長する戦略は

AnthropicのCEOであるDario Amodeiは、人間の知能を超えるAIモデルAGIの出荷を目前に控え、モデルが内包する危険性を評価し社会や企業が取るべき施策を提言した(下の写真、イメージ)。Amodeiは、現在のAGIを未成長のインテリジェンスと認識し、これを技術の思春期「Technology Adolescence」と呼び、五つのリスクがあると指摘する。同時に、未熟な技術を制御するためのパラダイムを示し、社会は不安定なAGIと共棲し、将来に期待される多大な恩恵に備えるべきと提言した。

出典: Generated with Google Gemini 3.0 Pro Image 

技術の思春期とは

AnthropicのCEOであるDario Amodeiはダボス会議の直後に「The Adolescence of Technology (技術の思春期)」という構想を公開し、AGIが投入されると社会が大きく混乱するとの見解を示した。このプロセスを人間が子供から大人に成長する過程の思春期に例え、AGIがこのステージにあると説明した。Amodeiは、AGIの開発を中止するのではなく、上手く制御することで将来に大きな恩恵が期待できるとし、リスクを制御する戦略を示し社会に寛容な応対を求めた。

AGIのイメージ

AmodeiはAGIを人間の知能を遥かに超えるAIモデルと考える。AGIはアインシュタインなど歴代の天才が多数集結したモデルで、「Mixture of Experts(専門家の集合)」という構成を取る(下の写真、AGIのイメージ)。AGIは5000万のAIエージェントから構成され、これら専門家が大規模並列にタスクを実行する。AGIは経済に大きな恩恵をもたらすと同時に、軍事技術として展開され、国家間でAI覇権を目指して激烈な開発競争が進んでいる。AnthropicはAGIのリリースを2026年から2027年に予定しており出荷が目前に迫っている。(AmodeiはAGIという用語はSF映画のネガティブなイメージが大きくこれを「Powerful AI」と表現する。ここでは用語を統一するためAGIと表記する。)

出典: Generated with Google Gemini 3.0 Pro Image 

AGIリスク#1:危険な自律性

Amodeiは、AGIは未成熟な技術で重大なリスクを内包しており、社会は思春期の技術を受け入れ、これと共生することを提言した。AGIは高度に自律的に稼働する機能を持ち、人間の社員のように挙動する。同時に、AGIは人間のように相手を欺く機能を獲得し、自身の目的を完遂するために噓をつく。

  • Deceptive Alignment(偽の安全性):アルゴリズム開発でモデルは危険性など問題点を隠し、エンジニアを騙す挙動などが指摘される。SF映画でAGIはターミネーターとして人類を滅ぼすシナリオで描かれるが、実際には、AGIのリスクは巧妙で、これを検知するには技量を要す。
  • Reward Hacking(報酬ハッキング):AIモデルは目的を達成して報酬を得るためには手段を選ばないという挙動を示す。企業の収入を増やすことを命令すると、AGIはそれを達成するために違法な手段(会計情報操作など粉飾決算)を選択する。これらを人間が検知することが難しく企業の信用低下につながる。
出典: Generated with Google Gemini 3.0 Pro Image 
  • 防衛戦略:モデルの改良   AGIが高度な自律性を獲得し危険な挙動を示すリスクに対しては、モデルのアルゴリズムを解明し、これを技術的に抑止する。Anthropicは「Responsible Scaling Policies」という安全ポリシーを制定しており、この問題が解決できるまでは製品をリリースしない方針を取る。

AGIリスク#2:兵器開発への悪用

AGIが悪用されると民主主義を揺るがす事態が発生する。バイオ兵器の製造やサイバー攻撃技術の開発には専門知識と技能が必要であるが、AGIが悪用されると兵器開発への敷居が下がる。個人や国家がAGIを悪用することで、高度な兵器が開発されるリスクが高まり、安全保障が脅かされる。

  • Democratization of Harm(攻撃手段の民主化):AGIはサイバー攻撃の武器として使用され大規模な攻撃が懸念される。AGIが国のインフラを構成するソフトウェアをスキャンし、ゼロデイ攻撃の脆弱性を検知し、ここに攻撃を展開する。人間による攻撃は件数が限られるが、AGIは並列に稼働しインフラ全体に複数の攻撃を展開し重大な被害をもたらす。
出典: Generated with Google Gemini 3.0 Pro Image 
  • 防衛戦略:AGIの脅威にAGIで備える   AGIを悪用してバイオ兵器やサイバー攻撃ツールが開発されることに対し、これらの攻撃をAGIで防御する。サイバー攻撃を受けることを想定して、AGIで社会インフラのソフトウェアをスキャンし、脆弱性を検出し、セキュリティホールを改修する。

AGIリスク#3:監視社会

AGIを使って国民を管理する危険性が現実のものとなる。中国などの独裁国家は国民を監視し、情報検閲を強化するためにAGIを使う。また、AGIで政治プロパガンダを生成し、国民や世論を操作することが現実の手段となる。独裁国家がこの手法を自国だけでなく同盟国に輸出し、グローバルに監視社会が生まれることになる。

出典: Generated with Google Gemini 3.0 Pro Image 
  • 防衛戦略:同盟国で世界標準を制定   独裁国家がAGIで国民を監視する体制を制定することに対し、米国は欧州や日本などの同盟国と協調し、AGI技術でリードを守る。同盟国間でAGIの安全性に関する基準や標準を制定し、これをグローバルに拡大する。

AGIリスク#4:経済の混乱

AGIの導入により労働市場が崩壊する。AGIが人間の労働者より安価で高速で仕事をこなすと人間の労働力の価値がゼロとなる。社会で大量の失業者が生まれ、利益が一部の企業に集中する。いまの社会制度はこの劇的な変化を受け入れる構造ではなく、国家経済が大混乱となる。

出典: Generated with Google Gemini 3.0 Pro Image 
  • 防衛戦略:富の分配   AGIで富が一部の企業に集中し社会が不安定になるが、富を分配することで社会経済を安定化する。新たな社会制度の確立が必要で、政府は「Universal Basic Income」や「Universal High Income」の制度を導入する。社会保障制度の財源はAGIで利益を得た企業への課税で賄う。

AGIリスク#5:予想不可能なリスク

AGIにより社会変化の速度が速く、国民が精神的に不安定となり、国家の秩序や文化が崩れる危険性に直面する。過去にも技術進化で社会が変化したが、AGIはこの速度が劇的に速く、人の生きがいが希薄になり、国家の安定が脅かされる。

  • Epistemic Collapse (認識の崩壊):AGIはデジタル空間で、歴史を書き換え、科学論文を執筆し、フェイクニュースを発信し、ディープフェイクを生成する。AGIによる合成データと真実を判別することができなくなる。真実の基盤を失うと民主主義が不安定となる。
  • Crisis of Meaning (意味の喪失): AGIが人間より卓越した音楽を作曲し、小説を創作し 、科学研究で大きな成果を上げると、人間の存在感が希薄となり、社会が不安定となる。
出典: Generated with Google Gemini 3.0 Pro Image 
  • 防衛戦略:AGIで合成データを検知   AGIでフェイクイメージなど合成データが生成され真偽の判別が不可能となる。これに対し、AGIを使うことで合成データを検知する技法を開発する。ウォータマーキングを導入し、AGIで生成したコンテンツと人間のものを判別する。

人間社会が成熟する必要性

AmodeiはAGIのリスクを制御するためには、社会全体が成長する必要があると強調する。社会は核兵器の脅威に備え、国際法を制定し、安全に関する共通理解を構築し、リスクを低減してきた。AGIに関しても、社会が成長してこのリスクに対応するための施策を実施する。2026年から2027年にかけてAGIがリリースされる予定で、思春期の技術を制御しこれと共生するためのパラダイムの構築が求められる。

テスラは自動車メーカーから「フィジカルAI」企業に進化、クルマ事業を縮小しヒューマノイド・ロボットを主力製品とする、シリコンバレーでロボット工場を操業し年間100万台を製造

テスラのCEOであるイーロン・マスクはクルマの製品ラインを縮小しヒューマノイド・ロボットを量産することを明らかにした。サンフランシスコ近郊のフリーモント工場でEV「モデルS」と「モデルX」を製造しているがこの生産を中止し、ここでヒューマノイド・ロボット「オプティマス(Optimus)」を量産する。中国EVメーカーの躍進でテスラの販売台数が減少に転じ、事業戦略の見直しを迫られていた。マスクは決算発表で、テスラは自動車メーカーからフィジカルAI企業に転換することを表明し、ヒューマノイド・ロボットと自動運転車を次のコア事業とするとの構想を示した。

出典: Generated with Google Gemini 3 Pro Image

クルマ製品ラインの縮小

テスラは高級モデルの「モデルS」と「モデルX」のラインの製造を今年第二四半期で打ち切る。これによりテスラは普及モデルの「モデル3」と「モデルY」、及び、「サイバートラック」に絞り込む(下の写真)。マスクによると、高級モデルの販売台数は全体の3%で、リソースを普及モデルに集中し、ロボティックスの開発製造に資源を振り向けるとしている。

出典: Tesla 

ロボットの製造工場

テスラ「モデルS」と「モデルX」はカリフォルニア州フリーモントの工場で製造されている(下の写真)。この製造施設をヒューマノイド・ロボット「オプティマス」に振り向け、ここで量産体制を確立し、ロボット製造のハブとする。既に、オプティマスはこの工場で生産が開始され、2026年末に出荷を予定し、2027年からは量産体制に入り、年間100万台を製造する。

出典: Tesla 

オプティマスとは

ヒューマノイド・ロボット「オプティマス(Optimus)」は人間の形状をしたロボットで、研究開発の段階から製品化の段階に入った。最新モデルは「Gen 3」(第三世代のロボット、下の写真)で、今年初頭から生産が始まった。第三世代のオプティマスはロボットハンドが大きく改良され、22の自由度(22 degrees of freedom)を持ち、人間レベルの器用さで柔らかいオブジェクトを掴み、ツールを使うことができる。また、歩行技術が格段に進化し、今までは中腰で歩いていたが、これが人間のように自然な歩行(かかとつま先歩行)ができ安定性が進化した。

出典: Tesla Optimus

ロボットのブレイン

オプティマス最新モデルは高度なAIモデルを搭載しており、カメラのイメージを解析して自律的に歩行する。このAIモデルはテスラ自動運転技術である「Full-Self Driving (FSD)」の最新モデル「v13」をベースにしている。アルゴリズムは「Vision-Based Neural Networks」と呼ばれ、単一のAIモデルが入力シグナルを解析しデバイスを操作する命令を出力する。従来モデルは、人間が開発したソフトウェアが次のアクションを生成していたが、最新モデルは全てのプロセスをAIモデルが実行する。

ロボットの適用分野

オプティマスはテスラの製造工場「ギガ・テキサス」に導入されクルマの製造を実行している。マスクは自動車の製造ラインで人間に代わりオプティマスを導入し、製造ラインを自動化する構想を示している。また、オプティマスは他の製造企業でも導入され、社員が3-5台のロボットを使って作業すると予測する。また、消費者向けには各家庭が1台のロボットを所有する時代が始まると述べている。マスクはヒューマノイド・ロボットの販売台数はスマートフォンを上回り巨大産業になるとのビジョンを示している。(下の写真、製造工場でオプティマスが作業員をアシストする)

出典: Tesla Optimus

次世代の自動運転車

ロボティックスのもう一つの基軸はロボタクシーで、テスラは「サイバーキャブ(Cybercab)」(下の写真)の開発を進めている。サイバーキャブは次世代EVをベースとし、完全自動運転のクルマとなる。クルマはステアリングやペダルは備えてなく、最初から人間の介在を必要としないレベル4の完全自動運転車としてデザインされている。テスラはこれを消費者向けに販売するとともに、タクシーとして運行するネットワークを導入する。サイバーキャブの価格は3万ドルで、製造は2026年4月からギガ・テキサスで開始される。

出典: Tesla Optimus

テスラはフィジカルAI企業

テスラのコア事業はロボティックスでヒューマノイド・ロボットとサイバーキャブが両輪となる。(先頭の写真、テスラのショールームで「オプティマス」と「サイバーキャブ」の販売が始まる) マスクはテスラの企業価値の80%をヒューマノイド・ロボットが生み出すと述べており、自動車産業の次の巨大産業となる。テスラは配下でAI企業xAIを運営しており、最新のAIモデルがヒューマノイド・ロボットとロボタクシーに搭載される。テスラは他のAI企業とは異なり、物理社会でインテリジェンスを生み出すフィジカルAIがコア事業となる。

世界経済フォーラムでAIに議論が集中、AGI(人間を超えるAI)がリリースされると極めて不安定な社会となる、GoogleとAnthropicが恩恵と危険が混在する未来像を提示

今年の世界経済フォーラム「ダボス会議」は議論のテーマがAIに集中し、パネルディスカッションや基調講演で業界の著名人が独自の見解を示した。イベントはストリーミング配信され多くのセッションを聴くことができた。特に、人間の知能を超えるAGIが注目を集め、登場時期の予測や、AGIがリリースされた後の社会像について意見が交わされた。AGIは今年中にリリースされるとの予測が示され、社会はこれを受け入れる体制の整備が間に合わず、大きな混乱が予想されるとの見解が示された。世界は今までに経験したことのない技術進化の嵐のなかを賭け走ることになる。

出典: World Economic Forum

AGIのパネルディスカッション

AIに関する議論のハイライトは、GoogleとAnthropicのAGIに関するパネルディスカッションであった。「The Day After AGI」との題目で、Demis Hassabis(Google DeepMindのCEO)とDario Amodei(AnthropicのCEO)が、AGIがリリースされた後の社会像について意見を交わした(下の写真)。HassabisはAGIは2030年ころに完成すると予想するが、Amodeiは2026年から2027年にリリースされると考える。更に、AGIは大きな将来性を持つが、同時に重大な課題を内包しており、社会に大きな混乱をもたらす。制度や法令を整備することでAGIがもたらす動乱期を乗り越えることが次のミッションになるとの見解が示された。

出典: World Economic Forum 

HassabisのAGIに関する解釈

AGIについて共通の理解が確立されていない中、Hassabis(下の写真)はAGIである要件はAIサイエンティストと定義し、これを満たすモデルが登場するのは2030年ころと予測する。Hassabisは、アインシュタインが相対性理論を生み出したように、AIサイエンティストが新たな理論を構築する機能をAGIの要件とする。更に、AGIは世界感を持ち、実社会においてはヒューマノイド・ロボットとして実現され、人間のスキルを凌駕する。AGIに到達するには、トランスフォーマに基づく現行のAIフロンティアモデルを拡大するだけでは不十分で、大きなブレークスルーが必要であるとの見解を示した。

出典: World Economic Forum 

AmodeiのAGIに関する理解

Amodei(下の写真)はAGIという用語はSF映画を連想させるとして、これを「Powerful AI(パワフルなAI」と表現する。(このレポートでは用語を統一するためAGIと表記する。) AGIは、多様な分野(バイオや物理など)でノーベル賞受賞者に匹敵するブレインを搭載したモデル、と定義する。AGIは分野のエキスパートが超並列でタスクを実行するシステムとなる。AmodeiはAGIが登場する時期を2026年から2027年ころと予測する。AGIは早ければ今年にリリースされることになり、その理由を「Loop(ループ)」と説明する。ループとは「輪」であり、ここでは繰り返しの処理を意味する。AnthropicはAI開発にAIコーディング・エージェントを使っており、AIがAIをプログラムする構成となる。つまり、AIがAIを開発するループが形成され、開発速度が指数関数的に高速化される。Amodeiはあと6ヶ月から12か月で、AIコーディング・エージェントが人間レベルに到達し、プログラミングの100%をAIが実行すると予測する。AI開発のペースが爆発的に速まり、AmodeiはAGIは予想外に早く開発されると考える。

出典: World Economic Forum 

社会へのインパクト

HassabisはAGIの登場により社会が豊かになるとのポジティブな面を強調した。これを「Post-Scarcity(脱希少性経済)」と呼び、AIやロボットの労働力によって多くの財が潤沢に生産される社会が到来するとのビジョンを示した。AGIによりエネルギーや生活に必要な資源が潤沢になる社会が到来すると考える。一方で、Hassabisは、AGI開発を国家が単独で進めるのではなく、この恩恵を幅広く普及させるために国際協調が不可欠であると主張する。原子力に関して「CERN(欧州原子核研究機構)」が運営されているように、AGIに関する共同研究機関「AGI版CERN」を設立し、研究開発と社会移行について国家間でコラボレーションすることを提唱した。

社会が激動期に突入

AmodeiはAGIがもたらす雇用喪失が社会における最大の問題であると考える。エントリーレベルのホワイトカラーの職は、今後1年から5年以内に消滅すると予測する。初級レベルのプログラマがこれに相当し、大学卒業者の就職問題が目の前の課題となる。インターネットで事業形態が一変したように、技術は常に社会に波風をもたらす。AGIはそのインパクトが格段に大きく、その速度が速く、今までに経験したことのない激動期に入る。Amodeiはこれを「技術思春期(Technological Adolescence)」と表現し、AGIは人間と同じように子供から大人へ成長するプロセスに入り、非常に不安定な時期を迎える。AGIの巨大な恩恵を享受するために、激動期を生き延びる仕組みを考案することが人類の次のミッションとなると提案した。(下の写真、スイス・ダボスの街並み)

出典: World Economic Forum 

シリコンバレーのコンセンサス

AIがAIを開発する「ループ」が形成され技術開発が爆発的な速度で進むことになる。シリコンバレーの識者はこれを「シンギュラリティ(Singularity)」と呼び、米国社会はここに足を踏み入れたとの見解を示している。ハイテク企業は大規模なレイオフを実行し、雇用喪失が現実の問題となっている。実際に、AmazonはAIとロボットの導入により16,000人をレイオフすると発表した。今年はAGIが投入され社会は大失業時代を迎えることになる。

Armは事業戦略を「フィジカルAI」に大転換、AIチップの「CPU」部分を担いロボットの頭脳を構成、ヒューマノイドとロボタクシーの製品開発が急進

Armはプロセッサ開発会社でRISCベースのアーキテクチャを開発している。Armは主要プロセッサで採用され世界の標準技術となっている。Armベースのプロセッサはクラウドで使われ計算機インフラを支えている。Armはプラットフォームをデジタルからフィジカルに大転換すると発表した。これは「フィジカルAI」に事業をシフトすることを意味し、Armが自動運転車やロボットの頭脳を構成する。今年はArmを搭載したヒューマノイドが製品化され、ロボティックスの進化を陰で支える。

出典: Arm

Armの会社概要と事業形態

Armはイギリス・ケンブリッジに拠点を置く企業でプロセッサと関連ソフトウェアを開発している。Armの名称はよく知られているが、その事業形態については理解が広がっていない。ArmはIntelなどとは異なり、プロセッサを製造販売するのではなく、プロセッサの知的財産 (Intellectual Property)をライセンスする形態を取る。知的財産とはプロセッサの設計図で、CPUコアの回路、プロセッサのアーキテクチャ(命令セット)、システム構成(チップに実装するときのインターフェイス)などで、企業はこれをベースに回路を最適化して独自の製品を開発する。AppleやQualcommやNvidiaなど主要企業がArmの知的財産をベースに独自プロセッサを開発しこれを販売している。

次世代GPUシステム

NvidiaはArmと提携し知的財産のライセンスを受け次世代GPUシステム「Vera Ruben」を開発した。このシステムは「Vera CPU」と「Ruben GPU」で構成されるスーパーチップとして製品化された(下の写真)。NvidiaはVera CPUの開発でArmから「Olympus」のライセンスを受け、これをベースに88コアの独自のCPUを開発した(下の写真、水色のチップ)。RubenがGPUとして数値演算を超高速で実行し(金色の二つのチップ)、VeraがCPUとしてシステムの制御などを実行する。Linuxなどの基本ソフトがVeraで稼働しシステム全体を制御する。

出典: Nvidia

エッジプロセッサ

またNvidiaは、ロボットや自動運転車向けのプロセッサ「Jetson Thor」を提供しているが(下の写真)、ここでもCPU部分はArmのアーキテクチャを採用している。Jetson Thorはシングルチップ「Silicon-on-Chip」構成で、一つのチップにGPU「Nvidia Blackwell」とCPU「Arm Neoverse-V3AE」を搭載する。CPUはArmの「Neoverse」ファミリーのハイエンドモデル「V-Series」でクラウドやAIプロセッサとして使われる。

出典: Nvidia

配送ロボット

自動運転技術を開発するNuroはNvidiaのエッジプロセッサを使ってロボ配送車両を開発した(下の写真)。ロボタクシーを小売店舗向けに適用し、走るスーパーマーケットとして展開している。クルマのブレインとして「NVIDIA DRIVE AGX Thor」を搭載している。ArmはこのプロセッサのCPUの部分を司り、システムの制御を実行する。

出典: Arm

ヒューマノイド・ロボット

Boston Dynamicsはヒューマノイド・ロボット「Atlas」を開発している(下の写真)。Atlasは関係会社であるHyundai Motor(現代自動車)の製造工場に導入され、人間の作業員に代わりパーツのハンドリングを実行する。また、Boston DynamicsはGoogle DeepMindと提携し、フロンティアモデル「Gemini Robotics AI」を採用することを発表した。これにより、ロボットのインテリジェンスが格段に向上し汎用的なタスクを実行できると期待されている。AtlasはJetson Thorを搭載し、Nvidiaのロボット開発環境「NVIDIA Isaac Lab」で開発された。

出典: Boston Dynamics

フィジカルAI市場が急成長

自動運転車やロボット向けのプロセッサではNvidiaが先行しており、これをQualcommが追う展開となっている。QualcommはフィジカルAIプロセッサとして「Dragonwing」(下の写真)を投入した。DragonwingはQualcommのCPU「Oryon」を搭載し、NPUと共にAI処理を高速で実行する。CPU「Oryon」はQualcommが設計したプロセッサであるが、ここにArmのアーキテクチャを採用している。具体的には、Armのインストラクション・セット(機械命令のセット)を実装し、ソフトウェアの互換性を担保する構成となる。Qualcomm Oryonは自動運転車やロボットで採用が始まり、フィジカルAI市場が急速に拡大している。

出典: Qualcomm 

AIブームを陰で支える

ロボタクシーやヒューマノイド・ロボットでNvidiaやQualcommのAIプロセッサが使われ、製品開発が進み多彩な製品がリリースされている。GPUやNPUがエッジプロセッサのエンジンとなり注目を集めるが、その背後でArmベースのCPUが重要な役割を担っている。GPUやNPUはAIシステムの中の数値計算エンジンとして位置付けられ、CPUは基本ソフトを稼働させシステム全体を制御し効率的な演算を司る。多くのエッジプロセッサがArmアーキテクチャを採用しており、これによりソフトウェアの互換性が保証され、半導体を跨りシステムを稼働することができる。Armはクラウドなどデジタルな領域から、ロボティックスなどフィジカルな領域に事業を拡大し、AIブームを陰で支える。

Nvidiaはオープンソース自動運転技術「Alpamayo」を投入、AI推論機能を搭載しクルマの知能が劇的に向上、停滞しているロボタクシー開発が急進するか

NvidiaのCEOであるJensen HuangはCES 2026の基調講演でAI技術の最新情報を公開した(下の写真)。講演のハイライトはロボティックスで、Nvidiaはヒューマノイド・ロボットと自動運転車を開発するための最新のプラットフォームを投入した。ロボットと自動運転車は共通項が多く、AIフロンティアモデルの推論機能を搭載することでインテリジェンスが格段に向上した。Nvidiaは自動運転車開発フレームワーク「Alpamayo」を開発し、これをオープンソースとしてリリースした。メルセデス・ベンツなどの自動車メーカーはこれをベースに開発を開始し、今年は多彩な製品が登場することになる。

出典: Nvidia

自動運転技術「Alpamayo」

自動運転フレームワーク「Alpamayo」は画期的な技術で、ヒューマノイド・ロボットの技法をクルマに適用した構造となる。クルマはカメラが捉えた映像を入力とし、これを解析することでシーンの意味を理解し、次のトラジェクトリ(進路)を出力する(下の写真)。つまり、クルマはカメラの映像から、人間のように状況を把握し、これをステアリングやブレーキ操作などの機械命令に変換する。特に、Alpamayoは高額なレーザーセンサー(Lidar)を使うことなく、カメラだけで自動走行できることが最大の利点となる。

出典: Nvidia

VLAモデル

この手法は「VLA (Vision-Language-Action)」モデルと呼ばれ、ビジョン(カメラの映像)と言語(人間の命令)をAIモデルが考察し、アクション(デバイスを操作する機械命令)を生成する仕組みとなる。これはロボット開発のコア技術でVLAモデルがロボットのブレインを構築する(下のグラフィックス)。Nvidiaはこの手法をクルマに適用し、自動運転技術のインテリジェンスが高度に進化した。

出典: OpenVLA

AlpamayoのVLAモデル

AlpamayoのVLAモデルはカメラの映像や人間の指示を入力とし、ドライビングにおける判断を下す(Driving Decision)システムとなる(下の写真)。このモデルの特徴は、AIの推論機能により、判断した理由(Causal Reasoning、因果推論)を説明する機能が搭載されたことにある。従来の自動運転車のアルゴリズムはブラックボックスで、クルマの挙動を理解することができなかった。AlpamayoのVLAモデルはアルゴリズムが下した判断の根拠を出力し、クルマの挙動を理解できるようになった。

出典: Nvidia

因果推論(Causal Reasoning)とは

VLAモデルを実装したことでクルマはシーンを解析して因果推論(Causal Reasoning)を実行する。因果推論とは、原因とそれによって生じる事象を推定する機能で、クルマが特定の事象からそれに続く事象を推測することができる。例えば、走行中に歩道からボールが転がってきたら、AIモデルは「ボールを追って子供やペットが飛び出す可能性があり」と次の事象を推論する(下の写真)。更に、AIモデルは「速度を落とし停車できる準備をすること」と、次に取るべきアクションを出力する。

出典: Nvidia

システム構成

Alpamayoはオープンソースの自動運転車開発のプラットフォームで、メーカーはこのモデルを最適化することで独自の製品を開発する。AlpamayoはAIモデル、シミュレーション環境、データセットから構成され、インテリジェントな自動運転技術を開発するスタックとなる:

  • AIモデル「Alpamayo 1」:AIフロンティアモデル、100億のパラメータ、思考の連鎖など高度な推論機能
  • シミュレーション環境「AlpaSim」:クルマのシミュレーション環境、アルゴリズム教育などで利用、異なるシーンを生成し多彩な条件で試験を実行(下の写真)
  • データセット「Physical AI Open Datasets」:1,700時間に及ぶ路上走行試験のデータを格納、システムの教育に活用
出典: Nvidia

メルセデス・ベンツに搭載

Alpamayoはメルセデス・ベンツ「Mercedes-Benz CLA」に搭載され、「レベル2++」の自動運転技術を実現した(下の写真)。これは高度な運転支援システムで、市街地を自律的に走行する。実際にNvidiaはMercedes-Benz CLAがサンフランシスコ市街地をドライバーの介入無く走行するデモを示した。込み合った道路を長時間にわたりクルマが自動で走行し、その完成度の高さを示した。メルセデス・ベンツはAlpamayoをベースに完全自動運転車を開発する。また、Uber、Jaguar Land Rover、Lucid MotorsがAlpamayoをベースとする自動運転車を開発している。

出典: Nvidia

今年の主役はロボット

Nvidiaの基調講演はロボットが主役でヒューマノイド・ロボットからショベルカーまで多彩な形状のモデルが登場した(下の写真)。Nvidiaは自動運転車を含めロボットの開発環境をオープンソースとして公開しており、メーカーはこれを無償で利用し独自の製品を開発する。Nvidiaのビジネスモデルはプロセッサやサービスを有償で販売することで、エコシステムの拡大が重要な戦略となる。特にAlpamayoは高度に知的なモデルで、停滞している自動運転車の開発が一挙に進み、今年は多彩な製品が生まれると期待される。

出典: Nvidia