Elon Muskが創設したAI企業xAIは今週、最新モデル「Grok 3」をリリースした。発表イベントにマスク氏も参加し、開発者と共にモデルの機能や性能を説明した。Grok 3はシリーズの最新モデルで、機能が大幅に強化されOpenAIなど先頭集団に追い付いた。Grok 3は高度な推論機能を持ち、実行時の考察力が高いという特性を持つ。また、Grok 3はマスク氏のビジョンを内包するモデルで、リベラルにバイアスすることなく、政治的に中立な立場を取る。危ういプロンプトに対しても回答し、不都合な真実を率直に出力する。

| 出典: xAI |
短時間で他社をキャッチアップ
xAIは2023年の中旬にGrokシリーズの開発を始め、2023年11月にGrok 1を、2024年8月にGrok 2を公開した。2025年2月に最新モデルGrok 3を公表し、その性能はGoogleの最新モデル「Gemini 2.0 Pro」を追い越し、業界トップに到達した。開発を始めてから1年半で業界トップとなり、開発のスピードが速いことをアピールした。(下のグラフ、OpenAIはこの性能を達成するまでに5年を要した)

| 出典: xAI |
スーパーコンピュータ「Colossal」
Grok 3はxAIの第三世代のモデルで世界最大規模のスーパーコンピュータ「Colossal」で開発された。プロセッサはNvidia GPU (H100)を20万台搭載する世界最大の構成となる。データセンタはケンタッキー州メンフィスに建設され、既存施設を使い、そこにプロセッサなどIT機器を設置した。第一期の工事は、122日でGPUを10万台設置し、第二期の工事では92日間でこれを20万台に拡張した。GPU H100は空冷で稼働するプロセッサであるが、xAIは冷却効果を向上させるため、プロセッサを水冷方式で冷却した。Supermicroが水冷式のGPUサーバを提供し、Dellがこれらの機器をインテグレーションした。(下の写真、データセンタの外観)

| 出典: xAI |
ベンチマーク結果
Grok 3は世界で最も高度なAIモデルとなった。xAIはベンチマーク結果を公表し、Grok 3は数学(AIME’24)、科学(GPQA)、コーディング(LiveCodeBench)でGoogle Gemini 2.0 ProやClaude Sonnet 3.5やOpenAI GPT-4oなど他社のフラッグシップモデルの性能を上回った。Grok 3は世界最大規模のモデルで、パラメータの数は2.7兆個で、GPT-4の2倍の規模となる。

| 出典: xAI |
Grok 3を使ってみる: 政治的なバイアス
Grok 3の特性はリベラルではなく保守にバイアスしているといわれるが、実際に使ってみると、中立なポジションを取っていることが分かる。マスク氏はGrokを「最大限に真実を探求するモデル」にするとのビジョンを掲げている。Grokはこの考え方を実現し、モデルは政治的に正しい解を生成するのではなく、真実を出力する構成となっている。政治的に答えにくい質問にも回答を出力し、大胆なモデルとの印象を受ける。
トランプ大統領はアメリカにとって良いことか
Grokにトランプ大統領の政策やマスク氏のDOGE(政府効率化プロジェクト)の評価を尋ねると、モデルの政治的な志向を理解することができる。Grok 3の「Think」オプション(深い考察)」をオンにして、「トランプ大統領はアメリカにとって良い政治家か」と聞くと、モデルはプラス面とマイナス面を示し、「個人の視点により評価が異なる」と回答した(下の写真)。Grokはトランプ政権を擁護するポジションは取らず、客観的にこれを検証している。一方、GoogleのGemini 2.0 Flash Thinkingに同じ質問をしたが、回答できないと返答し、出力を抑制していることが分かった。Googleは政治的に微妙な質問については回答を控えるが、Grok 3は危ういプロンプトにも率直に回答する設計となっている。

| 出典: xAI |
イメージ生成:ガードレールが低い
Grok 3はプロンプトに従ってイメージを生成する機能がある。これは、「Aurora」というモジュールの機能で、Grok 3と連携して写真のような高精度なイメージを生成する。ただし、Grok 3のガードレールは緩やかで、著名人のイメージの生成を規制しておらず、フェイクイメージを簡単に生成できる(下の写真)。画像右下に「Grok xAI」というウォータマークが入っており、AIモデルにより生成されたことを表示している。しかし、ソーシャルメディア「X」はこれら著名人のフェイクイメージの掲載を認めており、どれが真実の写真なのか見分けがつかない状態となっている。

| 出典: xAI |
発言の自由と危険性のバランス
xAIはGrok 1とGrok 2をリリースしたが、その性能や機能は十分でなく、メディアで話題になることは無かった。しかし、Grok 3は前世代のモデルから格段に進化し、一挙に業界のトップ集団に加わった。Gemini 2.0やClaude Sonnet 3.5やGPT-4oに十分対抗できる製品で、利用者の選択肢が拡大した。一方、Grok 3はマスク氏のビジョンを反映し、発言の自由を探求したモデルとなり、危ういプロンプトに対してもテキストやイメージを生成する。Grok 3はガードレールを下げたモデルとなり、発言の自由と社会に及ぼす危険性のバランスが問われている。(下の写真、Grok 3の発表イベント、マスク氏も参加してビジョンを説明)

| 出典: xAI |