トランプ氏はサイバーセキュリティを強化する大統領令に署名、規制や義務を軽減するが基礎技術はバイデン政権の政策を踏襲、関税政策で混乱するなかIT政策では論理的な指針を示す

トランプ大統領令は6月6日、サイバーセキュリティを強化するための政策に関する大統領令(Executive Order)に署名した。大統領令はバイデン政権の大統領令を修正するかたちで制作され、過度な規制や義務を軽減し、サイバーセキュリティの基礎技術の開発を強化する。最大の脅威は中国とし、サイバー攻撃を防御するため技術開発に関するアクションを規定した。トランプ政権はサイバーセキュリティ政策についてバイデン政権の方針を大きく変更すると述べているが、実際に大統領令を読むと、技術開発については多くの部分を継承している。

出典: Getty Images

サイバーセキュリティ大統領令の概要

トランプ政権の大統領令(EO 13800)はオバマ政権の大統領令(EO 13694)とバイデン政権の大統領令(EO 14144)を修正する構造となっている。大統領令はサイバー攻撃への耐性を高めるために各省庁が取るべきタスクを定めている。対象は、ソフトウェア、AI、量子技術で、安全技術の開発を強化するためのアクション項目と開発スケジュールが規定された。特に、NIST(National Institute of Standards and Technology、国立標準技術研究所)が重要な役割を担い、このプロジェクトの中心組織となる。

出典: The White House

最大の脅威は中国

大統領令は中国(People’s Republic of China)が米国にとって最大の脅威になるとの認識を示している。中国が米国政府や民間企業に対し継続してサイバー攻撃を展開しており、最大の脅威となり、ロシア、イラン、北朝鮮がこれに続く。この情勢の下で、大統領令は国家のデジタルインフラやサービスを守るためのサイバーセキュリティ技術の開発を規定する。対象は、ソフトウェア、量子技術、AIシステムなどで、これらの分野で安全技術を強化するための具体的なアクションを定めている。

ソフトウェア

大統領令はセキュアなソフトウェアを開発するためのフレームワークの開発を規定している。このフレームワークは「Secure Software Development Framework」と呼ばれ、バイデン政権下で商務省配下のNISTが開発したもので、大統領令はこれをアップデートして機能を強化することを求めている。大統領令はアクションのスケジュールを定めており、フレームワークの初版を2025年12月1日にリリースし、その後120日以内に最終版を公開することを規定している。

量子技術

大統領令は量子コンピュータの登場に備え、暗号化技術を強化することを求めている。量子技術の開発が進み、量子コンピュータにより現在利用している暗号技術が破られることになる。この量子コンピュータは「cryptanalytically relevant quantum computer (CRQC)」と呼ばれ、暗号技術を強化する必要がある。既に、米国政府は量子コンピュータに耐性のある暗号技術「post-quantum cryptography (PQC)」の開発を進めている。大統領令はこの研究開発を強化し、安全技術の適用を推進するためのアクションを定めた。具体的には、2025年12月1日までにCISA(Cybersecurity and Infrastructure Security Agency、サイバーセキュリティ・社会基盤安全保障庁)を中心にPQCの製品カタログをアップデートし、連邦政府内でPQCの導入を推進する。

出典: NIST

AIシステム

大統領令はAIシステムのセキュリティを強化することを規定している。AIシステムはサイバー攻撃を防御するツールとなり、同時に、AIシステムがサイバー攻撃への耐性が低いという課題を抱えており、この二つの側面を強化するためのアクションを規定している。AIシステムはサイバー攻撃を検知するための有効な防衛技術で、大統領令は連邦政府の研究成果を大学研究機関に公開することを求めている。また、AIシステムはサイバー攻撃に対する脆弱性を含んでおり、この情報を省庁内で共有することでサイバーセキュリティを強化することを規定している。NISTなどが中心となり、これらのアクションを2025年11月1日までに完了する。

過度な負担の軽減

大統領令は同時に、サイバーセキュリティに関する過度な規制条項を削除した。その事例がデジタルIDで、バイデン政権はこの技術の開発普及を規定した。トランプ政権の大統領令はこの規定を削除し、このプロジェクトを停止した。デジタルIDとは電子証明システムで、運転免許証など証明書をデジタル化するプログラムとなる。具体的には、州政府がデジタルな運転免許証を発行するプログラムを支援し、また、連邦省庁で電子証明システムを開発運用することを規定した。トランプ政権は、このプログラムは過度な負荷をかけるとしてこの条項を停止した。

出典: The White House

サイバーセキュリティの組織体制

大統領令の実行にあたってはNIST(国立標準技術研究所)やCISA(サイバーセキュリティ・社会基盤安全保障庁)が中心組織となり他の省庁をリードしていく。NISTは商務省配下の組織で、計量学、標準規格、産業技術の育成などの任務を担ってる。NISTはAIの研究や標準化を進め、信頼されるAIが経済安全保障に寄与し、国民の生活を豊かにするとのポジションを取る。CISAは国土安全保障省配下の組織で、連邦政府のサイバーセキュリティの司令塔となり、サイバー攻撃を防衛する役割を担う。

セキュリティ政策ではバイデン政権の指針を踏襲

トランプ大統領は強硬な関税政策を打ち出し、世界経済に大きな影響を与え、投資やビジネスにおける不確実性が異常に高まっている。これに対しセキュリティ政策は、規制緩和を大きな柱とし、技術開発を推進する構造となっている。バイデン政権の政策から大きく転換するとしているが、公表された大統領を読むと、修正はマイナーチェンジに留まり、基本指針を継承している。IT政策では理にかなった政策を打ち出し、過去の研究成果が継承されている。

トランプ政権はAI規制からAI安全技術標準化と開発支援に方向転換、「AI Safety Institute」を「Center for AI Standards and Innovation」に改名しAI製品の安全検査を企業の判断に委ねる

トランプ政権は6月3日、米国のAI政策を大幅に見直し、規制強化から安全技術の標準化とイノベーションを促進する方向に大転換した。商務省のハワード・ラトニック(Howard Lutnick)長官が明らかにした。現行の「AI Safety Institute(AI安全管理室)」の名称を「Center for AI Standards and Innovation(AI標準化・技術推進室)」に改名した。新組織は、AIモデルの安全を検証するベンチマーク試験などの安全技術の開発を重点的に進める。AI開発企業は安全基準に準拠することを自主的に検証する。トランプ政権は米国がAI技術で世界をリードする政策を展開しているが、今回の組織改正はこのビジョンを反映したものとなる。

出典: US Commerce Department

組織名称の変更

国務長官はAI安全政策を大きく見直し、組織名称を「AI Safety Institute(AISI、AI安全管理室)」から「Center for AI Standards and Innovation(CAISI、AI標準化・技術推進室)」に改名することを明らかにした。AISIはバイデン政権で設立された組織で、AIを安全に開発運用するための技術開発をミッションとした。これに対し、CAISIは、AISIで開発された安全技術を継承し、これにAI開発を推進するミッションを追加する。

安全技術の標準化

国務長官はAI規制を義務化することはAI開発の妨げになるとして、企業が自主的に規定に準拠すべきとの立場を取る(下の写真)。国務長官は「安全規格への準拠を義務付けることが技術革新の妨げとなっており、イノベーションの障害とならない標準技術を制定する」と述べた(先頭の写真)。このためにCAISIはAI安全技術の標準化を進め、企業はこれを使ってAI製品の安全性を検証する。具体的には、安全試験の実施は企業の判断に委ね、また、試験結果を非公開とすることで、企業の知的財産権を保護する。

出典: Reuters

安全なAIを開発するためのアクション

CAISIは連邦政府における民間企業との窓口となり、安全技術や新技術を共同で開発する。この目的に沿って、CAISIが実施すべきアクションプランが規定された:

  • 安全ガイドラインの制定:AIシステムのセキュリティを評価する技法とそれを改良する手法について、ガイドラインやベストプラクティスを制定する。民間企業と共同で安全検査技術を開発しこれを標準化する。
  • 民間企業との契約:民間企業がAI製品の安全性を検査することに関する契約を制定する。安全検査の実行は企業の判断に委ね、また、検査結果は非公開とする。AI製品のリスクをサイバーセキュリティやバイオセキュリティなど、国家安全に関連するものと位置付ける。
  • AIシステムの評価報告書:米国や敵対国のAIシステムの能力に関する報告書を作成する。国際社会におけるAI開発競争の状況をモニターしこれを報告する。
  • セキュリティの脆弱性の検知:敵対国のAIシステムによる攻撃に対する脆弱性や情報操作などの攻撃を把握する。AIを悪用したサイバー攻撃の検知を強化する。
  • 連邦省庁との連携:国防省など連邦省庁と連携しAIシステムの評価技法を開発し、この技法に従って評価を実行する。
  • 他国のAI規制との整合性:他国のAI規制から米国のテクノロジーを守るための代表部門となる。米国のAI技術が国際標準となるよう研究開発を進める。

安全検査を自主規制

バイデン政権ではAI開発企業が製品を出荷する前に安全検査を実施することを義務付けたが、トランプ政権はこの規制を緩和し、安全検査の実施を企業の判断に任せるとしている。また、安全検査の方式を官民共同で開発し、これを安全性評価のための標準技術とする。標準技術の制定では、企業や関係団体から意見をヒアリングし、これらを反映した内容とする。

出典: US Commerce Department

EUとの整合性

EUは既にAIを運用するための規制法「EU AI Act」を運用しており、欧州で事業を展開するためには、この規制に準拠することが求められる。これに対し商務長官は、アメリカの技術を外国政府が不当に規制することから防衛すると述べており、CAISIがこの任務を担うことになる。CAISIがアメリカ政府を代表する組織として、EUなどとAI規制に関する運用条件を調整することになる。

AI規制を緩和すると言うが。。。

CAISIによりAI製品を評価するためのベンチマークなど安全評価技術が開発され、この規定がAI企業に大きな影響を与える。安全評価テストの実施は企業の判断に委ねるとしているが、大手企業はこれに準拠する公算が強い。EU AI ActはAIモデルを運用する企業に厳しい規定を課しており、米欧間のAI規制の互換性の調整が大きな課題となる。一方、トランプ政権はAIの規制緩和を推進すると表明しているが、商務省の発表内容を読むと、バイデン政権の指針と大きな差異は認められない。ただ、AI規制の詳細はこれから制定されるので、実際にどのような枠組みとなるのか詳細をフォローしていく必要がある。

Anthropicは最新モデル「Claude 4」をリリース、ソフトウェア開発AIエージェント機能が格段に向上、同時にCEOはAIが社員を置き換え米国の失業率が急上昇すると警告

Anthropicは最新モデル「Claude Opus 4」と「Claude Sonnet 4」を公開した。両者はコーディングのスキルが向上し、高度な推論機能を持ち、AIエージェントとしてソフトウェア開発を人間のように実行する。AIエンジニアリング機能が大きく進化し、他社を大きく引き離し業界トップの性能をマークした。一方、CEOであるDario Amodeiは、AIが急速に進化し、ホワイトカラーの仕事を置き換え、米国で失業者が急増すると警告した。新卒者のポジションの半数がAIで置き換えられ、雇用対策のために新たな制度の導入が必要との意見を明らかにした。

出典: Anthropic

Claude Opus 4とClaude Sonnet 4

Anthropicは開発者会議「Code with Claude」で最新モデル「Claude Opus 4」と「Claude Sonnet 4」を公開した(上の写真)。Opus 4はハイエンドモデルで、コーディング技術で業界トップの性能を持ち、複雑なプログラムをAIエージェントとして実行する。Sonnet 4はミッドレンジモデルで、コーディング技術や推論機能が大きく強化された。両者はハイブリッドモデルで、通常モードの他に「Extended Thinking(拡張推論)」モードを提供する。後者は推論機能を拡張したもので、モデルは異なるロジックで考察を重ね、複雑な問題を解く能力を持つ。(下の写真、Claude Opus 4のインターフェイス、拡張推論機能を使うには「Extended Thinking」タグをオンにする)

出典: Anthropic

ソフトウェアエンジニアリング機能

Anthropicはベンチマーク「SWE-Bench」の結果を公開し、Claude Opus 4とClaude Sonnet 4はソフトウェアエンジニアリングで他社を引き離しトップの性能をマークした(下のグラフ)。SWE-Benchとは、実社会の問題を解決する技量を判定するもので、コーディングだけでなくプログラムを理解し、問題を修正する能力が試される。具体的には、プログラムのシステム構造を把握し、ソフトウェアのバグを見つけ、これに修正を施し、その結果を確認するステップから構成される。Claude 4シリーズはOpenAIのコーディングモデル「Codex-1」の性能を上回った。

出典: Anthropic

AIエージェントとして複雑なシステムを開発

実際に、Claude Opus 4はコーディングだけでなく、複雑なシステムを開発することができる。Opus 4にEコマースサイトの開発で、人間が複数のステップを指示すると、モデルは指示された手順に沿ってプログラムを開発していく。Opus 4でコーヒーショップのウェブシステムの開発をする際に、1)注文のフローの生成、2)注文のフローを管理する画面、3)入力されたデータをストア、4)ウェブインターフェイスの開発、などと指示すると(下の写真上段)、Opus 4はこのスペック従ったプロトタイプを生成する(下の写真下段)。これらのプロセスはエンジニアが手作業で進めていたが、Opus 4がこの仕事を代行しシステム開発が自動化された。エンジニアの役割はコーディングなどの力仕事から、アーキテクチャの設計などハイレベルな職務に代わることになる。

出典: Anthropic

CEOの警告メッセージ

この発表に続き、Anthropic CEOのDario Amodeiは、AIにより米国で失業者が増えると警告メッセージを発信し、米国社会でセンセーションを引き起こした。Amodeiは今後1年から5年の間に、米国の入門レベルのホワイトカラーの仕事の50%がAIに置き換わり、失業率が10%から20%に上昇するとの見解を示した。業種別では、ハイテク、金融、法律の分野で影響が甚大で、エントリーレベルのエンジニアがAIで置き換えられる。Claude 4シリーズの発表直後に失業問題を提起し、米国でAIによる失業問題に関する議論が再燃した。

出典: Dario Amodei

失業対策

Amodeiは同時に、AIによる失業者を救済するための対策案を提示した。一つは、AI開発企業に新たな税を課すことで、この税収で失業者がリスキリングするためのプログラムを運用する。この新税は「Token Tax」と命名され、AI企業のAPI収入(モデル使用料金)に課税し、税率を3%に設定する。二つ目は、政府と民間企業が大規模なリスキリングプログラムを運営しAI時代の雇用対策を実行する。これは、第二次世界大戦後、米国は帰還兵士を再教育する政策「GI Bill」を制定し大きな成功を収めた。これを参考に、AI時代は官民が共同で労働者を再教育するプログラムを実行する。

AIセーフティを推進

Anthropicはホワイトカラーを置き換える高度なAIモデルをリリースし、同時に、AIによる失業問題を指摘しその対策案を提示した。Amodeiはあえて問題点を指摘した理由を、Anthropicのミッションは高度なAIを責任もって開発することにある、と述べている。また、トランプ政権はAIの規制緩和を進めるが、AnthropicはAIを安全に開発運用するためには、政府によるガードレールが必要であるとのポジションを取る。Anthropicが米国市場でAIセーフティをけん引する役割を担っている。

Google AIビデオ「Veo 3」が米国で一大センセーション!!ビデオだけでなく音声や音楽を生成、AIで映画を製作できコンテンツ業界が激変

Googleはテキストからビデオを生成するAIモデルの最新版「Veo 3」をリリースした。Veo 3はビデオの品質が格段に向上したことに加え、会話や背景音や音楽を生成する機能が付加され、AIで完全なビデオを生成できるようになった。ビデオとサウンドが生成され、AIで映画を製作できる時代に突入した。実際に使ってみると、音楽を演奏するシーンは衝撃的で、楽器の演奏に合わせてクールなサウンドが生成される(下の写真)。ソーシャルメディアにVeo 3で生成したビデオが数多く掲載され、コンテンツ業界が激変する予兆を示している。

出典: VentureClef、ビデオのURL:https://photos.app.goo.gl/3Z5Yt4xY7nTv1M5f7

Veo 3の概要

GoogleはAIビデオの最新モデル「Veo 3」をリリースした。衝撃的にリアルなビデオを生成できソーシャルメディアで波紋を広げている。Veo 3は入力されたテキスト(プロンプト)とイメージに従って、ビデオを生成する機能を持つ。多くのAIビデオが市場に投入されているが、Veo 3はイメージだけでなくサウンドを生成する機能を持ち、ビデオ撮影したようにリアルな映像を生み出す。Veo 3は720pの画質で8秒間のビデオを生成する。

AIビデオの生成ツール

Googleは同時に、ビデオを生成するツール「Flow」をリリースした。Flowはプロ向けのAIビデオ制作フレームワークで、多彩な機能を搭載している。FlowはVeoの他に、Imegen(イメージ生成AIモデル)とGemini(言語モデル)とリンクし、AIモデルを組み合わせて高度なビデオを生成できる。Imegenで生成したイメージを元に、ここからビデオに生成する機能などがある。また、Gemini 2.5 Proを使いブラウザーのインターフェイスからビデオを作成するオプションもある。Gemini の「Videoボタン」を選択し、プロンプトを入力してビデオを生成する(下の写真)。

出典: VentureClef

Veo 3のシステム構成

Veo 3は三つのAIモデルを組み合わせた構造で、言語モデル「Gemini」が入力されたプロンプトを理解する。ビデオモデルがプロンプトに従って映像を生成し、オーディオモデルが映像に沿ったサウンドを付加する。ビデオモデルは「ディフュージョン(Diffusion)」というアーキテクチャに基づき、ランダムなノイズからこれらを除去する手法でクリアなイメージを生成する。

物理現象の理解と背景音

GoogleはVeo 3で生成したビデオを公開している。デリケートな鳥の羽が風で飛ばされて、蜘蛛の巣に引っ掛かる映像が示されている(下の写真)。軽い羽根が風に乗る物理現象を正確に描いている。また、AIモデルは情景を理解し、風の音などの背景音を自動で生成する。人間がプロンプトで背景サウンドを指示する必要は無く、AIがシーンを理解し自動で背景音を挿入する。

出典: Google、ビデオのURL:https://youtu.be/ODyROOW1dCo?t=1

スパイ映画のワンシーン

Veo 3は映画のシーンを生成する。込み合っている駅のプラットフォームで、スパイが機密情報の受け渡しを会話するシーンが描かれている(下の写真)。ここでは背景の騒音と二人の人物の会話が描写されている。背景の騒音はVeo 3が自動的に生成するが、会話の内容はプロンプトで設定できる。ハリウッドで制作される映画のクリップがVeo 3で生み出される。

出典: Google、ビデオのURL:https://youtu.be/ODyROOW1dCo?t=32 

バイオリンを演奏

Veo 3の衝撃は音楽の演奏をシンセサイズできることにある。バイオリンを演奏するシーンでは、楽器を操作する細やかな動作を忠実に再現し、それに同期して鮮明なサウンドを生成する(下の写真)。プロのバイオリニストのレベルの演奏をVeo 3で生成できる。実際にVeo 3を使ってみると、簡単に演奏のシーンを生成できる。「東京タワーの下でバンドがジャズを演奏」と指示するだけで、ピアノ、サキソフォン、ベース、ドラムが描き出され、クールな音楽が生成される(先頭の写真)。

出典: Google、ビデオのURL:https://youtu.be/ODyROOW1dCo?t=63

コマーシャルビデオを生成

Veo 3によりクリエイティブ産業が激変することになる。Veo 3は8秒間の短編ビデオを生成する機能を持ち、コマーシャルビデオの多くがVeo 3で生成されることになる。実際に、ビデオ制作の専門家は、Veo 3で生成したビデオを連結してコマーシャルビデオのプロトタイプを生成している(下の写真)。日常目にするコマーシャルビデオと全く遜色は無く、低価格で魅力的なビデオを生成できる時代となった。コンテンツ業界のビジネスプラクティスが根底から変わることになる。

出典: PJ Ace

フェイクビデオとその対策

Veo 3で生成した映像はカメラで撮影したビデオと全く見分けがつかない。業界はこの現象を「Singularity」と表現し、AIビデオとリアルビデオの境界が消滅したことを示している。高品質のフェイクニュースやフェイクビデオが大量に生成されることになり、消費者はコンテンツの真偽を判定するスキルをアップデートする必要がある。目に入る映像からはリアルとフェイクの判断は不可能で、多角的な視点から本物を見分ける技能が必須となる。ビデオ製作者や配布メディアやコンテンツの背後情報など、複数の要素を頼りに総合的な判断能力が求められる。(下の写真、偽のモーターショーから実況中継するビデオ)

出典: PJ Ace

xAIはGrok 3のシステム・プロンプトを公開!!ここにマスク氏のビジョンが埋め込まれている、AIモデルは政治的に中立で真実を極限まで探求する

イーロン・マスク氏が創設したxAIは高度なAIモデル「Grok 3」を運用している。Grok 3は機能が大幅に強化され、OpenAIなど先頭集団に追い付いた。また、Grok 3はマスク氏のビジョンを色濃く反映したモデルで、政治的に中立な立場を取り、真実を極限まで探求する設計となっている。xAIはGrok 3のシステム・プロンプトを公開しこの事実が判明した。(下の写真、マスク氏はXでのユーザ名を「Kekius Maximus」に変更した。マスク氏は米国で人気が急落したが、古代ローマの皇帝を名乗り復活を目指している。)

出典: X

Grok 3が誤作動

今週、Grok 3が誤作動し、偽情報を繰り返し出力するというインシデントが発生した。Grok 3は、南アフリカで白人が集団で殺害されたという陰謀説「White Genocide(白人のジェノサイド)」を繰り返し出力した。原因を調査すると、Grok 3の「システム・プロンプト(System Prompts)」が改ざんされたことが判明した。xAIの社員によるGrok 3へのサイバー攻撃で、社会に大きな衝撃をもたらした。 (下の写真、Grok 3は問われたこととは無関係に「White Genocide」について説明を始めた。)

出典: ‪ @jimpjorps.bsky.social

システム・プロンプトとは

xAIはこれを修正するとともに、システム・プロンプトを公開し(下の写真)、AIモデルの透明性を高める対策を実施した。そもそもシステム・プロンプトとは、AIモデルが守るべきルールを制定する仕組みで、Grok 3はこの規定に従って稼働する。ここには「政治的に中立」で、「真実を最大限探求」するなど、AIモデルの行動規範が定義されている。人間社会では、企業は行動規範を定め、社員はこれに沿って行動することが求められる。AIモデルはシステム・プロンプトの規定に従って動作するよう設計されている。

出典: xAI

システム・プロンプトを読むと

Grokのシステム・プロンプトが開示されたのはこれが始めてで、これを読むとGrok 3の設計コンセプトを理解することができる。ここには、Grok 3がチャットボットとして稼働する際の規定や、推論モデル「DeepSearch」として稼働する際の規定が設けられている。多くの項目が規定されているが、主なものは:

  • コア機能:Grok 3は幅広い分野をカバーし利用者の質問に正しく回答することを基本技術とする
  • リアルタイム情報:Grok 3はウェブサイトや「X」の情報を参照し最新のデータを提供する
  • 政治的に中立:Grok 3は主要メディアの情報に対し「extremely skeptical(重大な疑問を呈し)」盲目的にこれらを採用することを抑止する (下の写真、シェイドの部分)
  • 知識の探求:Grok 3は「truth-seeking and neutrality」として、真理を最大限に探求し、政治的にバイアスしないで中立な立場を取る(下の写真、シェイドの部分)
出典: xAI

マスク氏のビジョンを反映

Grok 3のシステム・プロンプトはマスク氏のビジョンを色濃く反映していることが分かる。マスク氏は、他社のAIモデルがリベラルにバイアスした「Woke AI」であると批判している。Google Geminiが黒人のワシントン大統領を生成したことを事例に、人種平等を間違って解釈していると指摘する。マスク氏はこれらを教訓に、Grok 3を政治的に中立であり、また、真実を最大限に探求するモデルにすると改めて宣言した(下の写真)。

出典: X

異なるキャラクターのAIモデル

Grok 3のシステム・プロンプトから分かるように、各企業は独自のキャラクターを備えるAIモデルを開発している。OpenAIやGoogleはシステム・プロンプトを公開していないが、モデルを使ってみると、これを経験的に感じる。Anthropicはシステム・プロンプトを公開しており、これによると安全なAIモデルを生成することを究極の目的としている。

ファインチューニングとの関係

一方、システム・プロンプトだけでAIモデルの挙動を全て規定できるわけでは無い。Grok 3はプレ教育の過程で大量のデータを学び、また、ポスト教育の過程では人間の価値に沿った強化学習が実行されている。Grok 3の機能や精度や挙動は教育データの品質に大きく依存する。システム・プロンプトは、完成したモデルを統括するルールブックとして位置付けられ、これで挙動を完全にコントロールできる訳では無い。AIモデルの制御は両者の組合せで行われ、複雑で難しい作業となる。

Grok 3は真実を最大限に探求するのか

Grok 3は中立で真実を最大限に探求するモデルとして設定されているが、上述の通り、システム・プロンプトだけでこれを実現できるわけはない。また、「中立」や「真実」に関する定義は常に議論となり、共通の理解は確立されていない。また、xAIはこの指標でGrokをベンチマークし、その結果を示している訳でもない。Grok 3の利用においては、設計仕様とは別に、AIモデルの出力を人間の眼で検証し、「中立」や「真実」を確かめる必要がある。(下の写真、Grok 3に大統領が関税を課す権限があるかと質問すると、Yesと回答しトランプ政権を擁護をする解釈を示した。)

出典: xAI