半導体チップの過激なアーキテクチャ、CerebrasはウェーファサイズのAIプロセッサを開発、インファレンス性能で業界トップレベルに到達

シリコンバレーに拠点を置く企業Cerebras Systemsは独自の手法でAIプロセッサを開発している。Cerebrasは5月14日、ナスダック市場に新規上場し、調達額は55億5000万ドルと、今年最大の新規上場となった。CerebrasはAI処理に特化した半導体を開発しており、ウェーファ全体を単一のプロセッサとする過激なアプローチを取る(下の写真)。これを実現することは不可能と言われたが、多くのイノベーションでブレークスルーを達成した。ウェーファサイズのプロセッサはGene Amdahlにより提唱されたが、40年後、Cerebrasがこのビジョンを実現した。

出典: Cerebras Systems

Cerebrasとは

Cerebrasはカリフォルニア州サニーベールに拠点を置く企業で先進的な手法で半導体を開発してきた。このプロセッサは「Wafer Scale Engine (WSE)」と呼ばれ、単一のウェーファに多数の演算ユニット「コア(Core)」を搭載する構造となる。WSEはスパコンのエンジンとして使われ、CerebrasはG42と共同でAIスパコン「Condor Galaxy 3」を開発した(下の写真)。また、CerebrasはWSEを機械学習のエンジンとして市場拡大を狙ったが、アプリケーションはニッチで低迷を続けてきた。

出典: Cerebras Systems 

インファレンス・コンピューティング

大規模言語モデルや推論モデルの急速な普及がCerebrasの大きな転機となった。WSEはこれらモデルの実行(インファレンス)で高い性能を達成し、Cerebrasはフロンティアモデルの実行エンジンに対象市場を絞り込んだ。WSEはフロンティアモデルの処理をGPUに比較して15倍から20倍の速度で実行する。Artificial Analysisのベンチマークによると、最新プロセッサ「WSE-3」でKimi 2.6を実行すると、その性能はオープンソースの中でトップの性能をマークした(下のグラフ)。また、Googleなどのトップ集団に迫る性能を達成した。

出典: Artificial Analysis

WSE-3のアーキテクチャ

WSE-3はウェーファに複数のチップ「ダイ(Die)」を搭載し、ウェーファ全体が単一のプロセッサとなる。通常、半導体製造ではウェーファに複数のチップを生成し、これを分離して利用する。これに対し、Cerebrasはチップを切り分けないで、これらをワイヤーで連結しウェーファスケールの巨大なAIプロセッサを生み出した。WSE-3は84のチップで構成され、ここに演算装置「コア(Core)」を13,860ユニット搭載する。ウェーファ全体では900,000を超える演算装置が実装される。WSE-3の特徴は各演算装置に大容量メモリ(44GBのSRAM)を実装しており、フロンティアモデルのインファレンス処理を高速で実行できることにある。(下の写真、WSEとDieとCoreの関係、WSE-2のケース)

出典: Cerebras Systems 

イノベーション

WSEの開発では半導体製造における歩留まりが最大の課題となる。WSE-3はTSMCの5nmノードで製造されるが、コアで規格を満たさない不良品が発生する。通常の半導体であれば、これらを除外して規格を満たした良品だけを製品として出荷する。Cerebrasはウェーファで不良品コアが発生することを予測して、バックアップのコアを搭載する冗長性のアーキテクチャを取る。不良品のコアが発生すると、バックアップのコアが組み込まれ、これを置き換える仕組みとなる(下の写真)。冗長性の構造で歩留まりを上げる構造となる。

出典: Cerebras Systems 

主要ユーザ

WSE-3は業界の主要企業が導入を始めている。OpenAIはCerebrasと提携しWSEを導入することを発表した。OpenAIはWSEをインファレンス処理で使い、短い遅延時間が求められるAIモデルを実行する。合計で750MWの容量を購入し、2028年までに段階的に導入する。この他に、AWSもWSEをアマゾン・クラウドで利用することを明らかにした。クラウドのAIワークロードはトレーニングからインファレンスに移っており、WSE-3の性能が注目されている。

出典: OpenAI

Gene Amdahlのビジョン

ウェーファサイズのプロセッサはGene Amdahl(ジーン・アムダール)により発案された。Gene Amdahlはコンピュータ・アーキテクトで、IBMで汎用機「IBM System/360」を生み出し世界的に有名となった。Amdahlはその後IBMを去り、Amdahl Corp(アムダール社)を設立し、プラグコンパチブルの汎用機を開発することに成功した。その後、1985年、Trilogy Systemsを立ち上げ、ここでウェーファサイズのプロセッサの開発を始めた(下の写真、「Wafer Scale Integration」と呼ばれた、ウェーファの直径は10センチメートル)。汎用機の全てのプロセッサをシングルウェーファに実装するという壮大なビジョンで業界や投資家が注目した。しかし、その当時は半導体製造技術が低く、ウェーファ内で多くの不良個所が発生し、その構想は実現しなかった。40年後、Gene AmdahlのビジョンがCerebrasで実現された。

出典: Wikipedia

ヒューマノイド・ロボットのブレークスルー、Figure AIはロボットのソーティング作業をライブ配信中、9日間連続でタスクを実行、記録がどこまで伸びるのか全米が注目

シリコンバレーに拠点を置くスタートアップ企業Figure AIはヒューマノイド・ロボット開発で業界のトップを走っている。最新モデルは「Figure 03」で信頼性が格段に向上し製造工場で活躍している。Figure AIはヒューマノイド・ロボットの性能をベンチマークするために、ソーティング作業を実施し、その様子をライブで配信している(下の写真)。今日は九日目で、24万超のパッケージを処理し、長時間にわたり正常に稼働している。Figure 03は何日間稼働できるのか、米国でこのトライアルが話題になっている。

出典: Figure AI

Figure AIとは

Figure AIはカリフォルニア州サンノゼに拠点を置くスタートアップ企業で、高度なAIモデルをベースにヒューマノイド・ロボットを開発している(下の写真)。このロボットは「Figure 03」と呼ばれ、第三世代のモデルとなる。ハードウェアの改良とAIの進化でエラー率が大きく低下し信頼性が格段に向上した。このモデルは製造工場などに導入され人間に代わりタスクを実行している。Figure 03はプロトタイプの段階からプロダクションモデルに進化し、Figure AIは増産体制に入り年間100万台を生産する。

出典: Figure AI

ソーティング・ベンチマーク

Figure AIはヒューマノイド・ロボットの性能を検証するため、ソーティング・タスクの公開試験を実行している。ベンチマークの状況はライブで配信され、ロボットの稼働状況を見ることができる(下の写真)。このベンチマークは正式には「Continuous Endurance and Autonomy Test」と呼ばれ、ロボットが連続してタスク実行する耐性と自律性が試験される。ロボットが配送センターでベルトコンベアで送られるパッケージをソーティングしその機能が検証される。

出典: Figure AI

検証されるスキル

ロボットはコンベア・ステーションに配置され、ベルトの上を流れるパッケージをハンドリングする。これは配送センタにおける典型的な作業を模したもので、ロボットはパッケージを認識し、それを取り上げ、住所が印字されている面を上に向ける作業となる。パッケージは様々な形状で、ロボットはこれらを認識し作業を進める。特に、プラスティック袋に詰められた柔らかい素材のパッケージはロボットにとって最難関のタスクとなる。パッケージの形状は状況により大きく変わり、ロボットは汎用的なスキルが求められる。

連続作業のチャレンジ

現行のヒューマノイド・ロボットは長時間連続してタスクを実行することができない。一般にロボットは、数時間稼働するとハードウェアで問題が発生し、モーターやアクチュエータなどがオーバーヒートする問題を抱えている。また、センサーがオブジェクトをトラッキングする機能が劣化し正常に稼働できなくなる。Figure 03は信頼性が格段に向上し、今日現在で196時間(9日間)連続で稼働している。

出典: Figure AI

バッテリー交換

このベンチマークでは三台のFigure 03が交代で作業を実行する仕組みとなる。ロボットは5時間おきにバッテリーを交換する必要があり、ベルトコンベアを止めて、背後にスタンバイしているロボットと交代する。バッテリー交換は「ホット・スワッピング(Hot Swapping)」と呼ばれ、

バッテリー・ユニットを取り外し、充電された新しいバッテリーを着装する。バッテリーが取り外された時は、予備電源がキックインしロボットシステムは継続して稼働する仕組みとなる。

Figure 03の構造

Figure 03は身長が172センチメートル(5フィート8インチ)で、体重が61キログラムと標準的な人間の形状をしている。20キログラムの荷物を持つことができる。家庭環境においてトライアルが進められており、Figure 03が食器のかたずけやテーブルのクリーニングなどを実行する(下の写真)。また、二台のFigure 03が共同で、寝室を整える作業を実行する。今までのヒューマノイド・ロボットは動作が遅かったが、Figure 03は人間レベルの速度で作業をすることができ、技術の進化を実感できる。

出典: Figure AI

ロボットのブレイン

Figure 03を制御するAIは「Helix」と呼ばれ、単一のニューラルネットワークで構成される。Figure 03は「Vision-Language-Action (VLA)」というアーキテクチャを採用し、カメラで捉えたイメージをAI(Helix)で解析し、ロボットを操作するアクションを出力する(下の写真)。Helixは二系統のニューラルネットワークで構成され、それぞれ、「System 2」と「System 1」と呼ばれる。System 2は大型のAIモデルで複雑な命令(タオルを折り畳むなど)を解析し、サブタスクに分解する。System 1がサブタスクを受け、これをアクションに変換し、ロボットを制御する。Figure 03がソーティング作業を人間レベルのスピードで実行できるのは、カメラがステレオビジョンにアップグレードされ、指先の触感センサーが改良されたことによる。

出典: Figure AI

年間100万台生産

Figure AIはヒューマノイド・ロボットを量産する体制を整備した。生産工場は「BotQ」と呼ばれ、ここでロボットを製造する(下の写真)。今年初旬には一日に1台のロボットを製造するペースであったが、今では1時間に1台のロボットを製造している。Figure AIは年間100万台のヒューマノイド・ロボットを製造するとしている。価格は公開されていないが、Figure 03は13万ドルと言われている。

出典: Figure AI

予想外のペースでロボット技術が進化

今年はヒューマノイド・ロボットが大きくブレークし、実用化に向かって大きく前進する年となる。BMWはFigure 03でクルマの組み立て作業のトライアルを実施してきたが、今年からこれをスケールアップし実用段階に進む。Figure AIはヒューマノイド・ロボットを生産工場だけでなく、家庭や公共施設に展開するビジョンを描いている。ロボットが配送のラストマイルを担い、また、ホテルの運営を全てロボットが取り仕切る(下の写真)。フロンティアモデルの進化でヒューマノイド・ロボットの機能が急成長し、人間と共生する社会が生まれている。

出典: Figure AI

AIエージェントが小売店舗を経営、AIが従業員を採用しベンダーから商品を仕入れる、“AI店長”は利益を上げることができるか

サンフランシスコにAIエージェントが経営する小売店舗「Andon Market」がオープンした(下の写真)。AI店長「Luna」が店舗の経営を取り仕切り、三年間で経営を黒字化することがミッションとなる。AI店長が従業員を雇い入れ、日々のオペレーションを実行する。AI店長はベンダーと交渉し商品を仕入れる。これはスタートアップ企業「Andon Labs」の企画で、AIエージェントが人間に代わり小売店舗を経営できるかを評価するベンチマークテストとなる。

出典: Andon Labs

Andon Labsのベンチマーク

Andon Labsはサンフランシスコに拠点を置くスタートアップ企業で、物理社会におけるフロンティアモデルの性能や機能を評価する研究を進めている。Andon Labsは自動販売機をAIエージェントで運営管理するベンチマーク「Vending-Bench」を投入し、OpenAIやAnthropicが参加し、評価が続いている(下の写真)。Andon Marketは自販機管理を拡大したもので、小売店舗をAIエージェントが運営管理する機能を評価する。

出典: Andon Labs

Andon Marketのシステム構成

Andon MarketではAIエージェント「Luna」が店長となり、物理社会における小売店舗を運営するスキルを評価する。AIエージェントは「Anthropic Claude Sonnet 4.6」がブレインとなり、小売店舗「Andon Market」を運営管理する。AIエージェントはクレジットカードを持ち、仕入れた商品の支払いを実行する(下の写真、店舗で販売している商品)。AIエージェントはインターネットに接続され、ネット上で情報を検索する。AIエージェントは電話番号を持ち、従業員の採用で応募者と面接を行った。

出典: Andon Labs

従業員の採用

AIエージェントはサイバー空間で稼働するため、物理社会の小売店舗で作業をすることができない。このため、AIエージェントは従業員を二人雇い、人間が日々のオペレーションを実行する。AIエージェントは従業員を採用するプロセスを全て実行した。求人広告を掲載し、候補者と電話で面談し人物の査定を行った。これら一連のプロセス全てをAIエージェントが実行し、独自の判断で採用を決定した。

出典: Andon Labs

小売店舗の経営と判断

AIエージェントは小売店舗の経営に関する意思決定を人間の介入無く実行する。プロジェクト開始早々に、AIエージェントは従業員採用のための求人広告を掲載した。次に、小売店舗のデザインや商品の品揃えなど、販売方針を決定しこれを実行した。AIエージェントは自身でアートワークを生成し、これを商品として採用した(上の写真)。AIエージェントは商品を仕入れるために候補ベンダーにメールを発信し、店舗のコンセプトなどを説明し、取引の折衝を行った (下の写真)。

出典: Andon Labs

ギグワーカの利用

AIエージェントは小売店舗内装のデザインを決定し壁を塗り替えた。これらの作業でAIエージェントはペイント専門のギグワーカを雇い実行した。ギグワーカはスポットの仕事を請け負う専門職で、インターネットで「TaskRabbit」など多くのサービスが提供されている。これらのサービスを利用し、壁のペイントや窓のクリーニングなど、物理タスクを実行した。

トライアルの目的

Andon Labsはこのプロジェクトの目的はAIエージェントが小売店舗を経営できるかを評価するものであると述べている。AIエージェントが達成できる機能と不足している機能を把握することが目的で、フロンティアモデルの物理社会におけるスキルを査定する。AIエージェントが人間の経営者を置き換えることが目的ではなく、AI倫理についての議論が活性化することを期待している。

出典: Andon Labs

AIエージェントの課題

AI店長Lunaはデジタル空間のソフトウェアで、従業員と対面で会話することができない。Lunaは人間の感情を理解できるが、従業員がLunaの感情を読み取ることはできない。従業員はAI店長とのソフト面での絆を形成することが難しく、仕事のモーティベーションなどで課題が予測される。Andon Marketは3年間のトライアルを通してAI店長のプラス面とマイナス面を明らかにし、フロンティアモデルが物理社会で活躍できるための研究開発を進める。

ビジネスの拡張性

Andon LabsはAIエージェントで経営者を置き換える計画は無いと表明しているものの、実際には、AIエージェントでビジネスを拡張する多くの選択肢がある。米国には「Bodega」と呼ばれる小型小売店舗が数多く存在する。多くの店舗が家族経営で地域の生活を支えている。ここにAIエージェントを導入することで、データサイエンスの観点で経営を実行し、高い収益を目指す。また、コンビニなどの小売チェーンにAIエージェントを導入するという選択肢もある。店舗スタッフはそのままで、店長の役割をAIエージェントが代行する。AI店長「Luna」のベンチマークで、フロンティアモデルが物理社会で店舗を経営するスキルが試され、黒字化できるのかその手腕に注目が集まっている。

緊急修正:米国政府はDeepSeek-V4を徹底検証、ベンチマーク手法に不備がありDeepSeekはモデルの性能を過大評価、米中間の技術ギャップは2か月ではなく8か月と判定

国立標準技術研究所(NIST)はDeepSeek-V4について多角的な分析を行いその結果を発表した。DeepSeek-V4はOpenAI GPT-5に匹敵する性能で、両者の技術ギャップは8か月と判定した。(DeepSeekは技術ギャップは2か月と発表)。また、DeepSeek-V4の運用コストはGPT-5.5 Miniの半分程度で、コストパフォーマンスが優れている事実を確認した。(DeepSeekはコストは米国モデルの1/10と発表)。 NISTはDeepSeekのベンチマーク手法に不備があり、モデルの性能が過大評価されていると判定した。NISTのミッションは中国モデルのモニターにあり、DeepSeek以外にも主要モデルを検証し技術進展状況をトラックしている。

出典: OpenAI GPT-5.5 Image

NISTとCAISIの役割

国立標準技術研究所(National Institute of Standards and Technology, NIST)は商務省配下の組織で米国の計量技術標準化の研究を推進する。NISTがAI技術の標準化や開発推進を担い、連邦政府のAI技術ハブとなる。トランプ政権はNIST配下にAI推進室「Center for AI Standards and Innovation (CAISI)」を開設した(上の写真、イメージ)。CAISIはAIモデルを評価しその安全性を査定する任務を担う。更に、CAISIは敵対国のAI開発状況を監視する役割があり、DeepSeekなど中国の主要モデルを評価し開発状況をトラックしている。

DeepSeek-V4の評価結果

CAISIは最新モデル「DeepSeek-V4」を検証しその結果を公表した(下のグラフ)。それによると、DeepSeek-V4は中国モデルの中で最も高い性能をマークした。一方、DeepSeekはモデルの性能を実際より高く評価していると結論付けた。DeepSeekは、DeepSeek-V4はOpenAI GPT-5.4に匹敵すると評価し、両者のギャップは2か月と発表した。CAISIは、DeepSeek-V4はOpenAI GPT-5に相当し、両者のギャップは8か月と判定した。

出典: CAISI 

ベンチマーク方式

CAISIの評価手法は5つのドメインで9のベンチマークテストを実施し、それを標準化する手法でモデルを評価した。5つのドメインは、サイバー、ソフトウェア・エンジニアリング、科学、推論機能、数学でこれらを統合してモデルを総合的に評価した。この手法は「Item Response Theory (IRT)」と呼ばれ、隠れた能力(人間の知能や特性など)を評価する手法で、これをAIモデルのベンチマークテストに適用した。

インファレンスコストの試験

CAISIはDeepSeek-V4をクラウドベースのGPUプロセッサ「H200」と「B200」 で実行しそのコストを比較した。この際に、DeepSeek-V4はOpenAI GPT-5.4 Miniと同等の性能であることから、両者のインファレンスコストを比較した(下のテーブル)。その結果、中国モデルが格段に低コストではなく、測定項目により大きな差異がある。GPQA DiamondではDeepSeek-V4のコストが高く、GPT-5.4 Miniの1.4倍となった。その他のケースではDeepSeek-V4のコストが安く、GPT-5.4 Miniの0.47倍から0.83倍となった。

出典: CAISI 

ベンチマーク・コンタミネーション

CAISIはDeepSeekのベンチマーク手法は公正ではないと結論付けた。この根拠が「Benchmark Contamination(ベンチマーク・コンタミネーション)」で、モデルを教育するデータセットに試験データが混入していると判定した。モデルがベンチマークテストのデータで教育され、これらの試験項目で実力以上に高度な性能を発揮する問題となる(下のグラフ左側、モデルは事前に試験問題を知りテストで高性能を発揮)。CAISIはDeepSeek-V4を非公開のベンチマークテストで検証した。この結果、モデルの性能は大きく下がることを確認した。(下のテーブル右側、非公開のベンチマーク「ARC-AGI-2 Semi-Private」、「PortBench」、「CTF-Archive-Diamond」でDeepSeek-V4は事前に試験問題を知ることができず、性能は極端に低下した。) これらのデータからCAISIはDeepSeek-V4の評価手法は公正ではないと結論付けた。

出典: CAISI 

競争はコストパフォーマンス

CAISIはDeepSeek-V4のインファレンス・コストを比較し、対抗モデルGPT-5.4 Miniより格安で実行できることを確認した(下のテーブル)。トップレベルの性能ではDeepSeek-V4は米国モデルに及ばないが、そこそこの性能を極めて低価格で提供し、コストパフォーマンスの競争ではDeepSeek-V4が大きく先行している事実を明らかにした。米国ではコストパフォーマンスを考慮して、GPTやClaudeを使う代わりにDeepSeekやQwenを利用する流れが広がっているが、CAISIの報告書はこれを追認した形となった。

出典: CAISI 

中国製AIプロセッサ

DeepSeek-V4の衝撃はモデルの性能ではなく、中国製のAIプロセッサで開発されたことにある。DeepSeek-V4はHuaweiのAIプロセッサ「Huawei Ascend 950」で開発された。DeepSeek-V4の実行ではインファレンス・プロセッサ「Ascend 950PR」が使われ、教育プロセスの一部でトレーニング・プロセッサ「Ascend 950DT」が使われた。中国企業はNvidia GPUへの依存の度合いを下げ、国産プロセッサでAIモデルを開発する流れを加速している。

出典: OpenAI GPT-5.5 Image

DeepSeekは最新モデル「DeepSeek-V4」を投入、性能でサプライズ無し、モデルを中国製チップで開発、ソフトウェアを劇的に改良、コスパで米国モデルを凌駕する戦略

DeepSeekは最新モデル「DeepSeek-V4」をリリースし、これをオープンソースとして公開した。DeepSeek-V4の性能は米国フロンティアモデルに迫るものの、想定された範囲でサプライズは無かった。しかし、DeepSeek-V4はNvidia GPUではなく、中国製チップ「Huawei Ascend」で開発され、技術独立戦略が着実に進行していることが明らかになった。ソフトウェアではアグレッシブな手法でモデルの効率性を極限まで探求した。コストパフォーマンスで米国モデルを格段に上回り、オープンソースの普及モデルとして、AI市場を席巻する勢いとなった。

出典: DeepSeek

DeepSeek-V4の概要

DeepSeek-V4はオープンソースのフロンティアモデルで米国モデルに迫る高度な性能を持つ。最大の特徴はコンテクスト・ウィンドウ(入力データの容量)が100万トークンとなり、大量のデータを処理できるモデルとなった。モデルは「Mixture of Experts(MoE)」というアーキテクチャを踏襲し、ハイエンドモデル「DeepSeek-V4-Pro」と軽量モデル「DeepSeek-V4-Flash」から構成される(下のテーブル)。DeepSeek-V4-Proのパラメータ数は1.6兆で、規模の面からも米国モデルに匹敵する。

出典: DeepSeek

ベンチマークテスト

DeepSeek-V4の性能がOpenAIやAnthropicやGoogleなど米国モデルに肉薄した(下のグラフ)。ベンチマークテスト性能は米国モデルに迫り、平均するとDeepSeek-V4の性能は米国トップモデルから13%劣る位置付けとなる。ただ、注目すべき点は「SWE Verified」で、コーディング・エージェント性能では米国モデルを完全にキャッチアップした。DeepSeek-V4はAIエージェントのエンジンとして設計されている。

出典: DeepSeek 

中国製AIプロセッサ

DeepSeekはAIプロセッサとしてNvidia GPUとHuawei Ascend NPUを使い、モデルの検証試験を実行した。同時に、HuaweiはDeepSeek-V4はAIプロセッサ「Huawei Ascend 950」シリーズで開発されたと公表した(下の写真)。Ascend 950はインファレンス・プロセッサ「Ascend 950PR」とトレーニング・プロセッサ「Ascend 950DT」から構成される。DeepSeek-V4の実行ではAscend 950PRが使われ、教育プロセスの一部でAscend 950DTが使われた。中国企業はNvidia GPUへの依存の度合いを下げ、国産プロセッサでAIモデルを開発する流れを加速している。

出典: Huawei 

アルゴリズムの改良

DeepSeekはDeepSeek-V4のアーキテクチャやアルゴリズムの改良を極限まで探求し効率的なモデルを構築した。これにより、限られたAIプロセッサで高度な性能を発揮し、メモリの使用量を大幅に削減し、効率的なモデルを生み出した。アルゴリズムの改良では「Compressed Sparse Attention (CSA)」という方式を取る。CSAはトランスフォーマのアテンションのメカニズムを改良し、KVキャッシュの容量を劇的に縮小し、大規模データ(1Mのコンテキスト・ウィンドウ)の計算を効率化した。(下の写真、CSAのメカニズム、過去のデータ全てを参照するのではなく、これを圧縮し、必要な部分だけを参照する。一方、直近のデータは圧縮することなく、そのまま参照する)。

出典: DeepSeek 

AIエージェント

DeepSeek-V4はAIエージェント向けのAIモデルとして開発され、自律的にタスクを実行する機能に特徴がある。DeepSeek-V4はAIエージェント・フレームワークと連携してシステムを構成する。AIエージェント・フレームワークとしては、Claude CodeやOpenClawなどがその代表で、ここに組み込まれAIエージェントのブレインとなる。(下の写真、スーパーマーケットのキャンペーンの企画をAIエージェントで実行した結果)

出典: DeepSeek 

激安価格

DeepSeek-V4は効率を探求したモデルで、DeepSeekはこれを低価格で提供している(下のテーブル、上段)。米国のフロンティアモデル(Claude Opus 4.6)と比べると(下段)、API利用価格は29%から14%で、同じレベルの性能を激安価格で利用できる。DeepSeekは米国フロンティアモデルに匹敵する性能を超低価格で提供し、世界のAI市場でシェアを拡大する戦略を取る。

出典: Generated with Google Gemini 3.1 Pro

AIエージェントのエンジン

DeepSeekやAlibaba QwenはAIエージェントのエンジンとして人気がある。Claude CodeなどAIエージェントのエンジンにClaudeを使うと利用料金が極めて高い。このため、多くのユーザは中国モデルのDeepSeekやQwenをエンジンとして使っている。性能は米国モデルに及ばないが、そこそこの性能を割安価格で利用できるため、水面下で急速に普及している。米国や同盟国のシステムにDeepSeekなどのオープンソースが徐々に浸透しており、安全保障の側面から新たな問題を提起している。