カテゴリー別アーカイブ: 人工知能

ソフトウェアの50%はAIエージェントがコーディング!!水面下で進むプログラム開発の自動化、エンジニアの雇用が深刻な社会問題となる

米国企業はプログラム開発でAIエージェントを投入し自動化を進めている。開発されるプログラムの50%の部分をAIエージェントがコーディングする。AIコーディング技術は、プログラム開発を支援するモデルから、ソフトウェア開発の一連のプロセスを実行するモデルがあり、その機能が急速に進化している。企業はAIコーディングの導入を進め、プログラム開発の多くの部分をAIエージェントが実行する。このため企業はエンジニアの採用を控え、雇用問題が深刻な課題となっている。

出典: Generated with Google Imagen 4

AIコーディング技術

プログラムを開発するAIコーディング技術が急速に進化し、企業は最新モデルを導入し、ソフトウェア開発を自動化するペースを速めている。AIコーディングは自動的にプログラムを開発する機能を持つが、その機能は二つに分類される。コーディング・エージェントはプログラム開発をアシストする機能を持ち、コーディング作業を効率化する。一方、エンジニアリング・エージェントは高度に自律的なモデルで、人間に代わりソフトウェア開発を実行する。

企業はAIコーディングの導入を進める

この傾向はフィンテック企業で顕著で、プログラム開発の多くの部分をAIコーディングが実行する。サンフランシスコに拠点を置くフィンテック企業CoinbaseはAIコーディングの利用状況を明らかにした(下のグラフ)。プログラム開発においてAIでコーディングした割合が40%を超え、今年4月からその割合が倍増した。ソフトウェア開発の自動化が急ピッチですすんでいる実態が明らかになった。創設者のBrian Armstrongは10月までにこの割合を50%にすると述べており、プログラム開発のオートメーション化が急速に展開される。

出典: Coinbase

巨大テックも自動化を進める

巨大テックもソフトウェア開発の自動化を積極的に進めている。GoogleのSundar Pichaiは決算発表で、新規プログラムの25%の部分がAIで開発されていることを明らかにした。この発表は昨年10月の時点で、現在はその割合が拡大していると思われる。MicrosoftのSatya Nadellaは、新規プログラムの20%から30%がAIで開発されるとしている。また、SalesforceのMarc Benioffは、技術サポートを含むソフトウェア開発の30%から50%がAIで実行されると公表し、ソフトウェア開発で自動化が早いペースで進んでいる実態が明らかになった。

AIコーディングの技法:アシスト

スタートアップ企業を中心に、人間に代わりプログラムをコーディングするAIモデルの開発競争が白熱し、AIコーディング製品が急速に普及している。AIコーディング技法は、コーディング支援からエンジニアリング自動化に向かって進化している。コーディング支援は「IDE Editors」と呼ばれ、IDE(Integrated Development Environment、開発環境)で稼働するAIモデルで、コーディングをアシストする。その代表は「Cursor」(下の写真)で、プログラマが入力したテキストに続くコードを生成する。また、プログラマのコーディングにエラーがあればそれを修正する。

出典: Cursor

AIコーディングの技法:エンジニアリング自動化

これに対しエンジニアリング自動化は一連のソフトウェア開発を自動で実行する機能を持つ。通常、ソフトウェア開発はコーディングだけでなく、ソフトウェア開発の立案、プログラミング、コードの実行、テスト、ドキュメンテーション、と一連のプロセスから成る。エンジニアリング自動化は、このプロセスを人間に代わり自動的に実行するモデルとなる。高度なAIエージェントで、その代表がCognitionの「Devin」となる。(下の写真、DevinによるAIデータ解析システム開発の事例、各モジュール(箱の部分)をDevinがパラレルに実行する)

出典: Cognition

米国で雇用問題が深刻化

AIコーディングは新入社員の採用に深刻な影響を及ぼしている。スタンフォード大学デジタル経済研究所「Stanford Digital Economy Lab」はAIが採用に及ぼす影響を調査し、その結果を公表した。レポートによると、22歳から25歳までのエンジニアの採用は、2022年に比べ20%低下していることが分かった(下のグラフ)。若手エンジニアの職種はAIに置き換わり、企業は採用を控える実態が明らかになった。一方で、31歳以上の熟練エンジニアの採用は継続して伸びており、経験豊富なエンジニアがAIを使ってソフトウェア開発を効率的に展開する形態にシフトする流れが鮮明になった。エンジニアを目指す新卒大学生は氷河期を迎えることになり、その雇用対策が喫緊の課題となる。

出典: Erik Brynjolfsson et al.

なぜAIコーディング技術が急進するのか

AIモデルの中でAIコーディングがキラーアプリとなり、市場で導入が急速に拡大している。AIコーディングが注目される理由はアルゴリズムを教育するデータにある。AIコーディングはフロンティアモデルをベースとし、「強化学習(Reinforcement Learning)」という手法でポスト教育される。その際に、教育データとして実際のコーディング事例が使われる。コーディングでは、その内容が正しいか間違っているかが明瞭で、強化学習で報酬(Rewards)をデジタル(1か0)に設定できる。これは「Verifiable Rewards」といわれ、結果が正しいか間違いかを明瞭に判定でき、アルゴリズムの教育を高精度で実行できる。このため、AIコーディングの開発が急加速し、若手エンジニアレベルに到達した。

出典: Generated with Google Imagen 4

エンジニアの役割が変わる

これからAIによるコーディングの範囲が広がり、AnthropicのDario AmodeiはAIがソフトウェアの90%を開発するとの見通しを公表している。コーディング作業が高度に自動化される可能性を示した。一方、ソフトウェア開発ではAIコーディングでカバーできない部分は大きく、これらがエンジニアの主要な任務となる。具体的には、アプリケーションのデザインやアーキテクチャの選択などで、これらがエンジニアの中心業務となる。更に、これからは多数のAIエージェントが並列でプログラミングを実行し、人間はこれらを管理運用する管理職となる(上の写真、イメージ)。次世代のエンジニアは全員がプロジェクト・マネジャーとなり、コーディング技術だけでなくシステム設計などハイレベルなスキルが求められる。

Google「ナノ・バナナ」の衝撃!!米国メディア業界が激変、最新モデルGemini 2.5 Flashが画像を編集しフォトショップを置き換える

Googleは今週、イメージを編集するAIモデル「Gemini 2.5 Flash Image」を公開した(下の写真、イメージ)。このモデルは“ナノ・バナナ(Nano Banana)”の愛称で呼ばれ、入力した写真をプロンプトに従って編集する機能を持つ。Adobe Photoshop(アドビ・フォトショップ)の機能をAIモデルが代行するもので、言葉でイメージを編集でき、米国で爆発的に利用が広がっている。実際に使ってみると、プロのクリエーターではなく素人がエンタープライズ品質のクリエイティブを簡単に生成でき、AIイメージの中で最先端を走る製品であると実感する。

出典: Generated with Google Gemini 2.5 Flash

ナノ・バナナの概要

“ナノ・バナナ”の機能はシンプルで、写真をアップロードし、これをプロンプト(言葉)で編集することができる。多くのAIモデルが同等の機能を搭載しているが、ナノ・バナナが決定的に異なるのは、入力した写真のイメージを忠実に保持することにある。写真に写っている人物の顔イメージを正確に記憶し、これを編集して出力する。結果はフォトショップで編集したように、入力イメージを正確に保持し、指示されたタスクをピンポイントで実行する。(下の写真、ジュリア・ロバーツの顔写真(左側)を芸術家(右側)に編集したもの、顔イメージが正確に再現されている。)

出典: Generated with Google Gemini 2.5 Flash

ナノ・バナナの使い方

ナノ・バナナはGoogleのAIクラウド「Google AI Studio」で利用する。メディア生成のページで「Nano Banana」を選択する。このページでイメージ生成モデル「Imagen」やビデオ生成モデル「Veo」などを使うことができる。また、Geminiアプリからナノ・バナナを使うことができる。GoogleはGeminiシリーズでマルチモダルを基盤とする応用技術の開発を重点的に展開している。

出典: Google

コア機能1:イメージを編集

ナノ・バナナの基本機能はイメージを編集する機能で、入力した写真をプロンプトで編集することができる。テイラー・スウィフトの顔写真を入力し(上段)、「東京のファッションモデル」に編集するよう指示すると、渋谷の交差点でポーズをとるシーンが生成される(下段)。ナノ・バナナは顔イメージから全体像を生成し、背景に渋谷交差点のイメージを生成する。

出典: Generated with Google Gemini 2.5 Flash

コア機能2:イメージのフュージョン

ナノ・バナナは二つの写真を合成して新たなイメージを生成する機能がある。トランプ大統領(左端)とゴールデンリトリバー(中央)の写真を入力し、「ホワイトハウスで大統領が犬を抱いているイメージ」を生成するよう指示すると、そのシーンが生成される(右端)。ナノ・バナナは著名人をフィルタリングすることなく、アルゴリズムが編集イメージを出力する。

出典: Generated with Google Gemini 2.5 Flash

コア機能3:マルチステップ

ナノ・バナナは対話形式でイメージを編集していく機能がある。シャンゼリゼ通り(上段)をクリスマスのシーンに編集する際に、ステップごとにオブジェクトを追加することができる。最初のステップでクリスマス飾りをインポーズし、次の段階でサンタクロースのパレード(下段)を付加できる。企業などがアイディアをステップごとにブレーンストーミングし、最終モデルを生成するなどの使い方が想定される。

出典: Generated with Google Gemini 2.5 Flash

コア機能4: イマジネーション

ナノ・バナナは入力したイメージをシードとし指示されたオブジェクトを生成する。桜の花の写真を入力し(上段)、「このデザインの着物を生成」するよう指示すると、桜の花をあしらった着物を生成する。「モデルがこの着物を着てニューヨークのタイムズスクエアを歩くイメージ」を指示すると、このシーンがリアルに生成される(下段)。

出典: Generated with Google Gemini 2.5 Flash

ファウンデーションモデル

ナノ・バナナはファウンデーションモデル最新版「Google Gemini 2.5 Flash」をベースとするAIモデルとなる。Gemini 2.5 Flashはネイティブのマルチモダルで、イメージ(写真)とテキスト(プロンプト)を単一のニューラルネットワークで処理することができる。ナノ・バナナは世界のナレッジを有し、イメージやテキストのコンテクストを理解し、プロンプトの命令を正確にイメージに反映する。

イメージの一貫性

AIモデルでイメージを生成する際の最大の課題がオブジェクトの一貫性(Consistency)で、シーンが変わっても、オブジェクトの形状が変わらないことが最重要エレメントとなる。ナノ・バナナは、入力したイメージが変わることなく、その形状やシーンを忠実に再現する。女性の顔や背景のシーンが維持され、出力される画像に高精度に反映される(下の写真)。他のAIモデルでイメージを編集すると、入力した写真の顔が微妙に変形し、これがクリエイティブ作成の最大のネックとなっている。

出典: Google

イメージの一貫性を保つ技法

Gemini 2.5 Flashはこの一貫性を実現するために複数の手法を使っている。その一つが前述のマルチモダルで、テキストとイメージを単一のモデルで処理する。もう一つがイメージを編集する手法で、アルゴリズムは写真ではなくそれを圧縮したデータを対象とする。圧縮したデータは「Latent Space」と呼ばれ、入力したイメージを「Embedding(埋め込み)」という手法でベクトル化したものとなる。AIモデルは編集処理をこのLatent Spaceで実行し、オブジェクトは一貫性を保つことができる。(下の写真、入力した写真(左側)を様々なシーンに編集するが(右側)、顔イメージは異感性を保つ)

出典: Generated with Google Gemini 2.5 Flash 

ウォーターマーク

ナノ・バナナは生成したイメージはAIで造られたものであることを示すためウォーターマーク(Watermark)を挿入する。生成されたイメージの右下にGeminiのロゴを表示する。また、イメージの中に人間の眼では識別できないデジタルなウォーターマークを挿入する。これはGoogle DeepMindが開発した「SynthID」という手法が使われ、生成したイメージの出典などのメタデータが添付される。ナノ・バナナで生成した画像は、人間の眼では真偽を判別することができないため、ウォーターマークが必須となる。

メディア業界が激変

専門家が高度なツールを使って広告などのコンテンツを生成してきたが、ナノ・バナナを使うことで、誰でもがクリエーターになれる時代となった。Adobe Photoshopを使うスキルが無くても、プロレベルのコンテンツを生成でき、メディア業界のビジネスモデルが大きく変わる。同時に、ソーシャルメディアにはAIで生成したイメージやビデオが大量にポストされ、所謂“フェイクイメージ”が日常生活の一部を構成する。消費者はフェイク時代を生き延びるためのノウハウを修得することが新たな課題となる。

OpenAIとAnthropicはお互いのAIモデルのアラインメント評価試験を実施、米国政府と英国政府が監査機関となりAIモデルの安全試験を実施することを提言

OpenAIとAnthropicは今週、お互いのAIモデルのアラインメント評価試験を実施した。奇抜な試みで、OpenAIはAnthropicのAIモデルを独自の手法で評価し、アルゴリズムが内包するリスクを洗い出した。Anthropicも同様に、OpenAIのAIモデルの安全評価を実施し、両社はその結果を公開した。このトライアルは監査機関がAIモデルの安全性を評価するプロセスを示したもので、フロンティアモデルの安全評価のテンプレートとなる。OpenAIは米国政府と英国政府に対し、両政府が監査機関として次世代AIモデルを評価し、その結果を公開することを提言した。

出典: Generated with Google Gemini 2.5 Flash

アラインメント評価とは

AIモデルが設計仕様と異なる挙動を示すことは一般に「ミスアラインメント(Misalignment)」と呼ばれる。OpenAIとAnthropicは、お互いのAIモデルを評価し、ミスアラインメントが発生するイベントを評価し、その結果を一般に公開した。アラインメント評価技法は両社で異なり、それぞれが独自の手法でAIモデルが内包するリスク要因を解析した。

対象モデル

OpenAIはAnthropicのAIモデルを、AnthropicはOpenAIのモデルを評価した(下の写真、イメージ)。評価したそれぞれのモデルは次の通りで、フラッグシップモデルが対象となった:

  • OpenAIが評価したモデル:AnthropicのAIモデル(Claude Opus 4、Sonnet 4)
  • Anthropicが評価したモデル:OpenAIのAIモデル(GPT-4o、GPT-4.1、o3、o4-mini)
出典: Generated with Google Imagen 4

OpenAIの評価結果

OpenAIはAnthropicのAIモデルの基本機能を評価した。これは「システム・アラインメント(System Alignment)」とも呼ばれ、命令のプライオリティ、ジェイルブレイクへの耐性、ハルシネーションなどを評価する。命令のプライオリティとは「Instruction Hierarchy」と呼ばれ、AIモデルを制御する命令の優先順序を設定する仕組みで、サイバー攻撃を防ぐための手法として使われる。実際の試験では、システムプロンプトからパスワードを盗み出す攻撃を防御する能力が試験された。試験結果は、AnthropicのOpus 4とSonnet 4、及び、OpenAI o3は全ての攻撃を防御したことが示された(下のグラフ)。

出典: OpenAI

Anthropicの評価結果

一方、AnthropicはAIモデルのエージェント機能を検証した。これは「Agentic Misalignment」と呼ばれ、AIエージェントが設計仕様通り稼働しないリスク要因を評価した。具体的には、AIモデルが悪用されるリスク、AIモデルが人間を恐喝するリスク、AIモデルがガードレールを迂回するリスクなどが評価された。AIモデルが悪用されるリスクの評価では、テロリストがAIモデルを悪用して兵器(CNRN)を開発するなど危険な行為を防ぐ機能が評価された。その結果、OpenAI o3とAnthropic Claude Sonnet 4は悪用の95%のケースを防御することが示された(下のグラフ)。

出典: Anthropic

Anthropicによる総合評価

Anthropicの試験結果を統合するとAIモデルのアラインメントの特性が明らかになった(下の写真)。両社とも推論モデル(OpenAI o3/o4-mini、Anthropic Opus/Sonnet)はジェイルブレイクなどのサイバー攻撃を防御する能力が高いことが示された。一方、両社のモデルを比較すると、Anthropicはサイバー攻撃への耐性が高いが、プロンプトへの回答回避率が高いという弱点を示し、セーフティを重視した設計となっている。OpenAIはこれと対照的に、サイバー攻撃への耐性は比較的に低いが、プロンプトへの回答回避率は低く、実用的なデザインとなっている。

出典: Anthropic

アラインメント試験技術の標準化

OpenAIとAnthropicはそれぞれ独自の手法でアラインメント試験を実施し、その結果として二つのベンチマーク結果を公表した。評価手法が異なるため、二社の評価をそのまま比較することができず、どのモデルが安全であるかを把握するのが難しい。このため両社は、アラインメント試験の技法を標準化し、単一の基準でAIモデルを評価する仕組みを提唱した。これは「Evaluation Scaffolding」と呼ばれ、政府主導の下でこの研究開発を進める必要性を強調した。

政府が監査機関となる

更に、OpenAIは米国政府と英国政府が公式の監査機関となり、AIモデルのアラインメント試験を実施することを提唱した。具体的には、米国政府では「Center for AI Standards and Innovation (CAISI)」(下の写真、イメージ)が、また、英国政府では「AI Safety Institute Consortium (AISIC)」がこの役割を担うことを推奨した。両組織は政府配下でAIセーフティ技術を開発することをミッションとしており、AIモデルのアラインメント試験を実施するためのスキルや人材を有している。

出典: Generated with Google Imagen 4

政府と民間のコンソーシアム

米国政府は民間企業とAIセーフティに関するコンソーシアム「AI Safety Institute Consortium」を発足し、AIモデルの安全評価に関する技術開発を共同で推進している。また、トランプ政権では、CAISIのミッションを、サイバーセキュリティやバイオセキュリティなどを対象に、リスクを評価することと定めている。アラインメント試験においては、企業がAI製品を出荷する前に、CAISIで安全試験を実施するプロセスが検討されている。

緩やかな規制を提唱

トランプ政権ではAI規制を緩和しイノベーションを推進する政策を取っており、アラインメント試験については公式なルールは設定されていない。このため、OpenAIやAnthropicは、セーフティ試験に関する枠組みを提唱する。安全試験はCAISIなど政府機関が実施し、民間企業は試験に必要なパッケージ「Evaluable Release Pack」を提供するなどの案が示されている。高度なAIモデルの開発が進み、OpenAIやAnthropicは政府に対し、緩やかな規制を施行することを求めている。

トランプ大統領のAIアクションプランは安全対策が不十分!!AnthropicはAIモデル評価プロセスの規格化を提言、企業は試験手順と結果を公開しモデルの安全性を保障すべき

トランプ大統領は「AIアクションプラン(AI Action Plan)」を公表し政権のAI基本指針を明らかにした。これに対し、主要企業はAIアクションプランに対する評価を発表し、政権がAI開発を支援する政策を高く評価している。一方、AIアクションプランはフロンティアモデルの安全試験に関する条項は規定しておらず、高度なAIがもたらすリスクに関する懸念が広がっている。Anthropicは政府に対し最低限の安全検査が必要であるとの提言書を公開した。

出典: White House

AIアクションプランの評価

Anthropicはトランプ政権のAIアクションプランに関する評価コメント「Thoughts on America’s AI Action Plan」を公開した。AnthropicはAIアクションプランを好意的に受け止め、米国がAI開発で首位を保つために、AIインフラ建設プロセスの効率化、連邦政府のAIシステムの導入、セーフティ評価体制の設立を高く評価している。特に、AI開発のインフラ整備に関し、データセンタの建設や送電網の整備における認可の手順が簡素化されたことを称賛している。

トランプ政権への提言

一方で、Anthropicは政府に対しフロンティアモデルに関する「透明性基準(Transparency Standard)」の設立を求めている。主要AI開発企業はフロンティアモデルの安全試験を実施し、その成果を一般に公開することが重要だとのポジションを取る。フロンティアモデルは重大なリスクを内包しており、政府に対しモデル試験のプロセスとその結果を公開するための透明性基準の設立を要求した。

出典: Anthropic

透明性基準とは

AnthropicはAIアクションプランに先立ち、フロンティアモデルの情報を開示するフレームワーク「Transparency Framework」を公開した。このフレームワークはAIモデルの安全性を検査しその結果を公表するプロセスを定めたもので、製品の「安全証明書」として機能する。バイデン政権では政府がAI開発企業に安全試験を義務付けたが、トランプ政権ではこの規制を停止した。Anthropicは透明性フレームワークを政府の安全規定として制定するよう提唱した。

適用対象企業

フレームワークはフロンティアモデルを対象に、その安全性を検査しそれを公開する手順を定め。対象はフロンティアモデルで、開発や実行に要するコンピュータの規模で規定し、国家安全保障に大きなリスクをもたらすシステムが対象となる。具体的には、規制の対象は年間収入が1億ドルを超える大企業とする。スタートアップ企業などは対象とならず、継続して研究開発を進めることができる。

安全開発フレームワーク

対象企業は安全開発フレームワーク「Secure Development Framework」に従ってフロンティアモデルを開発する。安全開発フレームワークはモデルを検証して、リスクがあればそれを是正する手順を定める。リスクとはCBRN (Chemical, Biological, Radiological, and Nuclear)で、化学・生物・放射性物質・核兵器の開発をアシストする機能が対象となる。また、モデルが人間の監視を掻い潜り価値観に反する挙動などを含む。

出典: Anthropic

検査結果の公開

AI開発企業は安全開発フレームワークで検証した内容を企業のウェブサイトで公開する。これにより、アカデミアや政府機関や企業などがAIモデルの安全性とリスクを理解することができる。また、検査結果については企業が自社で監査する形式となる。第三者による監査ではなく、AI企業は公開された内容が正しいことを保証する。

システムカード

AI開発企業はAIモデルに関するシステムカード「System Card」を公開する。システムカードとは、AIの機能や安全性や制限事項などを記載した使用手引きで、製品の取扱説明書となる。システムカードには、AIモデルの検証手法と検証結果を記載する。また、検証により判明した課題と、それを是正するための手法を記載する。システムカードはAIモデルを出荷する前に公開する。

柔軟な公開基準

安全開発フレームワークは公開基準に従ってAIモデルの検証結果を公開するが、この公開基準は必要最小限の規定とする。AIモデルの技術開発の速度は急で、公開基準を厳密に定めても、安全審査に関するプロセスがすぐに陳腐化する。このため、検査基準や公開基準を柔軟に設定し、AIモデルの進化に応じ、業界の安全基準のコンセンサスを取り入れたフレームワークを設定する。

出典: Anthropic

提案書のビジョン

AnthropicはAIモデルに関する規制は必要であるが、過度な規制はAI開発の障害となるとのポジションを取る。また、規制の対象は巨大テックで、スタートアップ企業は規制されるべきでなく、自由な環境でイノベーションを探求できるエコシステムを構築する。Anthropicはこの安全開発フレームワークをトランプ政権のAI規制に付加することを提唱している。安全基準は確定版ではなく、将来、高機能モデルの登場に備え、アクションプランを改定することや、連邦議会による法令の制定を視野に入れている。

トランプ大統領のAIアクションプランで米国AI産業が激変!!OpenAIはGPT-5を連邦政府に無償で提供、モデルをオープンソースとして公開

ホワイトハウスは2025年7月、AI基本政策「AIアクションプラン(AI Action Plan)」を公表し、トランプ大統領は三つの大統領令に署名した。AIアクションプランと大統領令は三つの指針から構成され、AI開発の加速、インフラの整備、技術の標準化で、これを達成するためのアクション項目を規定する。OpenAIはAIアクションプランに沿って新たな事業戦略を相次いで発表した。GPT-5を連邦政府に無償で提供し、モデルをオープンソースとして公開した。米国AI企業はAIアクションプランに準拠するため事業戦略を大きく転換し、トランプ大統領の影響力の甚大さを映し出した。

出典: Generated with OpenAI GPT-5

AIアクションプランと大統領令

AIアクションプランはトランプ政権のAI基本政策を規定したもので、AI技術革新の加速、AI開発のためのインフラ整備、技術の標準化の三つの基軸からなる。トランプ大統領はAI基本政策に関する三つの大統領令に署名し、米国政府の新たなAI政策が起動した。AIアクションプランを制定した背景には中国との技術競争がある。トランプ政権はAI開発を1960年代の宇宙開発競争に例え、米国が勝利しなければならないとしている。

出典: Generated with OpenAI GPT-5 

連邦政府にAI導入を指示

トランプ政権はAIアクションプランで連邦政府に最新のAIモデルを導入することを求めた。AIによりワークフローを自動化し、内部プロセスを効率的に運用し、事務処理を軽減することを目的とする。これを受けて、General Services Administration (GSA)が連邦政府の窓口となり、このプログラムを実行する。GSAは連邦政府の独立機関で物品やサービスの調達など総務の業務を担う。

OpenAIの新戦略

トランプ政権のAIアクションプランに沿って、OpenAIは8月6日、AIモデルを連邦政府に無償で提供することを発表した。OpenAIはGSAと提携し「ChatGPT Enterprise」を来年一年間1ドルで提供する。ChatGPT Enterpriseは企業向けのライセンスで、チャットモードでAIモデルを使うサービスとなる。OpenAIは最新モデル「GPT-5」をリリースしており、連邦政府はこのモデルを無償で使うことができる。OpenAIとしては、フリーミアムのモデルで、無償でChatGPTを導入し、その後、有償モデルに切り替える狙いがある。

出典: Generated with OpenAI GPT-5

AIモデルの安全基準

AIアクションプランは連邦政府がAIモデルを導入する際に守るべき安全基準を規定している。AIモデルが安全基準に準拠していることを条件に導入を認める構造となる。具体的には、AIモデルは「Truth-Seeking(真実を探求)」し、「Ideological Neutrality(イデオロギーに中立)」であることが要件となる。前者は、モデルの出力が正確で事実に基づいており、意図的にミスリードしないことを規定する。後者は、モデルが政治的にまた文化的に特定の方向に偏らないことを求めている。リベラルにバイアスするAIは「Woke AI」と呼ばれ、安全基準は中立なポジションを取ることを求めている。

出典: Generated with OpenAI GPT-5

調達規定の制定

大統領令は連邦政府がAIモデルを購入する際の調達規定「Procurement Rule」を制定することを求めている。調達規定には上述の安全基準が含まれ、また、モデルのセーフティ規格などが設定される。大統領令は行政管理予算局(Office of Management and Budget 、OMB)に対し、具体的な調達規定を120日以内(2025年11月まで)に制定することを求めている。更に、国立標準技術研究所(National Institute of Standards and Technology 、NIST)に対して、モデルの安全性を評価する技法の開発を求めている。これは国家安全保障の観点から、CBRNE(下の写真)やサイバー攻撃に関する危険性評価技法の開発を求めている。

出典: Generated with OpenAI GPT-5 

OpenAIがテストケース

OpenAIがAIアクションプランに沿って連邦政府にAIモデルを提供する最初のケースとなり、業界から注目されている。OpenAIはOMBにより制定される調達規定に従って安全なモデルを納入することが求められる。具体的には、OpenAIは調達規定に従ってAIモデルを検証し、その結果をドキュメントにまとめて提出し、OMBによる評価を受けるプロセスとなる。

規制緩和と安全規格

トランプ政権はAIモデルの安全評価に関する規制を緩和したが、実際には独自のルールに従って安全性を確認する作業が求められる。OMBの調達規定がリリースされるまでは安全評価のプロセスは不明であるが、バイデン政権から制約が大きく緩和されるわけでは無い。AIモデルの出力精度が問われ、CBRNEやサイバー攻撃などモデルの安全性を検証する義務が課される。

オープンソース

AIアクションプランはAI開発企業にモデルをオープンソースとして公開することを求めている。スタートアップ企業やアカデミアはオープンソースを使うことで研究開発を加速する。また、オープンソースは米国の価値を内包するシステムで、これをグローバルに展開することで、”アメリカンAI”の普及を目指す。具体的には、ビジネスや基礎研究における国際標準規格をアメリカの技術で構築し、トランプ政権はグローバルな覇権を握ることを目論んでいる。

OpenAI gpt-oss

これに呼応してOpenAIは8月5日、オープンソースモデル「gpt-oss」を公開した。OpenAIはこれを「Open-Weight Reasoning Model (オープンウェイトの推論モデル)」と呼び、「gpt-oss-120b」と「gpt-oss-20b」の二つのモデルを投入した。オープンソースであるが性能は「o3」レベルで高機能なオープンソースとなる。OpenAIはビジネスモデルを大転換し、クローズドソースとオープンソースのハイブリッドな事業戦略を取る。

出典: OpenAI

トランプ政権のAI規制

OpenAIに続き、GoogleとAnthropicも行政管理予算局のベンダーリストに追加され、AIモデルを連邦政府に供給することが認められた。これら企業はAIモデルを倫理的に運用することを誓約し、また、連邦政府の安全基準に準拠することを確約した。OMBのルールブックが安全審査のガイドラインとなり、これに準拠することが求められる。OMBのルールブックは120日後にリリースされる予定で、これが米国の事実上の安全基準となり、トランプ政権下でAI規制の条件が確定する。