作成者別アーカイブ: nad00251

ヒト受精卵の遺伝子解析で健康でIQの高い赤ちゃんを出産、AIでスーパーベイビーを誕生させることは許されるか

米国でヒトの受精卵の遺伝子解析が静かに広がっている。体外で受精した卵子の遺伝子を解析し、病気発症を予測する。複数の受精卵の中から、病気を発症する確率が低いものを選び、健康な赤ちゃんを出産する。更に、遺伝子解析でIQの高い受精卵を特定でき、賢い赤ちゃんを産むことができる。しかし、スーパーベイビーを生むことに対しては、深刻な倫理問題を内包し、社会的な批判が大きい。

出典: Genomic Prediction

受精卵の遺伝子解析技術

この技術を開発したのはGenomic Predictionという新興企業で、受精卵の遺伝子を解析し、生まれてくる子供の特性を把握する。受精した卵子から細胞を取り出し、その遺伝子配列を把握し、生まれてくる子供が罹りやすい病気を予測する。更に、子供の将来の身長やIQなど、身体特性を予測することもできる。

成人向けの遺伝子解析との相違

ヒトの遺伝子解析は幅広く普及しており、米国では23andMeなどが個人向けに解析サービスを提供している。唾液などの検体を送れば、発症する可能性が高い病気や身体の特性について知ることができる。これに対し、受精卵の遺伝子解析では、複数個(例えば5個)の受精卵を準備し、これらの遺伝子を解析し、その中で最も優れている受精卵を選んで出産する。23andMeは将来の健康状態を把握するために利用するが、Genomic Predictionは健康で優秀な子孫を残すために使われる。

受精卵の遺伝子解析のプロセス

この検査は体外受精(In Vitro Fertilization) のプロセスの中で実施される。体外で卵子と精子を受精させ、受精卵は細胞分裂を開始し胚(Embryo)となる。胚から細胞を取り出し、遺伝子の配列を解析する。体外受精は不妊治療として実施されるが、この際に受精卵の遺伝子検査を受ける。また、家系に重大な遺伝子病がある場合は、体外受精を実施し、病気発症の遺伝子を持っていない受精卵を選び出産する。

出典: UC San Francisco

体外受精の件数が増加

受精卵の遺伝子解析が広がっているが、この背景には体外受精で出産する件数が増えていることがある。世界的に女性の出産年齢が上昇する傾向にあり、体外受精で子供を授かるケースが増えている。特に、デンマークやベルギーでこの傾向が高く、出生する子供の10%が体外受精といわれている。これに対して、日本は5%で、米国は3%であるが、先進国で体外受精の割合が増加している。

病気発症のリスク

Genomic Predictionは受精卵の遺伝子解析「Pre-Implantation Genomic Testing」により、生まれてくる子供が一生のうちに病気を発症するリスクを査定する。対象となる病気は、糖尿病、乳がん、心臓疾患など10を超え、発症する確率を予測する。(下の写真、病気の種類と発症の確率)。このケースでは糖尿病を発症するリスクが平均より高いと査定された。被験者はこの受精卵を避け、病気発症のリスクが低いと判定された受精卵を選び出産する。生まれてくる赤ちゃんは糖尿病を発症する確率がぐんと低くなり、健康な生活を送ることができる。

出典: Genomic Prediction

病院で検査を受ける

Genomic Predictionの遺伝子解析サービスは医療機関を通じて提供される。提携している医療機関の数は少ないが、米国ではスタンフォード大学大学病院(Stanford Medicine Fertility and Reproductive Health、下の写真)経由でサービスを提供している。被験者は病院で診察を受け、必要に応じて受精卵の遺伝子検査を受ける。議論を呼ぶ治療法であるため、受精卵の遺伝子解析は慎重に進められている。

出典: Stanford Medicine

IQを予測する

Genomic Predictionの遺伝子検査で生まれてくる赤ちゃんの将来の身長やIQを推定することができる。身長やIQなど身体特性は受精卵の遺伝子配列から決まり、身長のケースでは予測誤差は3センチメートルとしている。また、IQについても、知能の高さと遺伝子配列の間で強い相関関係が認められ、高い精度で予測できる。ただし、IQの予測は重大な倫理問題を含んでおり、Genomic Predictionはこの解析サービスを中止した。

遺伝子解析と倫理問題

受精卵の遺伝子を解析することで、健康状態や身体特性を予測し、ベストな受精卵を選び出産することに関し、社会の意見は割れている。病気発症を予測するなど医療目的で使うことに対しては、一定の理解が得られている。しかし、この技術をIQなど身体特性の予測に適用し、優秀な赤ちゃんを生むことに対しては厳しい批判が相次いでいる。このため、米国においてGenomic Predictionの予測技術は健康状態を把握することに限定して使われている。

出典: Genomic Prediction

スーパーベイビーの誕生

人間の欲望は貪欲で、重大な倫理問題を抱える手法であるが、優秀な赤ちゃんを産むことに対し根強い願望がある。これからは、多くの赤ちゃんが体外受精で生まれてくることになり、優秀な受精卵を選択する機会が増える。また、iPS細胞(Induced pluripotent stem cell)を使えば、体細胞(例えば皮膚の細胞)から卵細胞を生成できる。これにより、数個ではなく数多くの受精卵を生成でき、スーパーベイビーの誕生に繋がる。倫理的にも科学的にも許容されるものではないが、世界のどこかで研究が進んでいるのは間違いない。

[技術情報:遺伝子解析とAI]

Predictor

遺伝子変異から病気発症や身体特性を予測するために高度なAIが使われている。Genomic Predictionは遺伝子特性(Genotype)から身体特性(Phenotype)を推定するAI「Predictor」を開発した。このAIは受精卵の遺伝子配列から、生まれてくる赤ちゃんの特性を算定する。遺伝子特性では一塩基多型(Single-nucleotide polymorphism、SNP)をシグナルとして使っている。対象としたSNPの数は80万で、遺伝子特性の99%をカバーする。

UK Biobank

AI開発では教育データがカギを握るが、Genomic Predictionは遺伝子バンク「UK Biobank」のデータを利用した。UK Biobankとは英国の非営利団体が構築した遺伝子データセットで、ここに50万の遺伝子と、4000億を超えるSNPが格納されている。これらのデータを使ってアルゴリズムを教育し、完成したアルゴリズムの精度が検証された。

Polygenic Prediction

Genomic Predictionは「Polygenic Prediction」という手法を使って病気発症を予測する。病気を引き起こす遺伝子は一つではなく、複数の遺伝子が関与している(下の写真右側、乳がんのケース)。AIはこれら複数の遺伝子変異から病気発症の確立を算出する。これに対し、「Monogenic Prediction」という手法は一つの遺伝子から病気発症の確立を算定する(下の写真左側)。Genomic PredictionはMonogenic Predictionに比べ予測精度が高い。

出典: Genomic Prediction

病気発症リスクの低下

この試験(Preimplantation Genetic Testing)により病気発症のリスクを下げることができる。体外受精で受精卵をランダムに選択した場合と、この試験によりリスクの低い受精卵を選択した場合を比較すると、生まれてくる子供が将来病気を発症する確率が大きく下がる(上のグラフ)。11の病気で発症リスクが下がり、心臓発作は46.9%、糖尿病(タイプI)は33%低下する。

出典: Nathan Treff et al.

IQの予測精度

Genomic PredictionはSNPとIQの間に強い相関関係(Correlation coefficientが0.7)があるとしている。また、アルゴリズムを教育するデータ数を増やせば、高い精度でIQを予測することができる。IQは遺伝するのか、それとも生活環境に依存するのか議論が続いているが、Genomic PredictionはIQを決定する要因の80%が遺伝子であるとしている。

研究課題

AIはUK Biobankに登録されている人の遺伝子情報で教育された。UK Biobankには英国を中心に欧州の人々の遺伝子情報が登録されている。このため、このアルゴリズムを他の人種に適用すると予測精度が低下する。このため、人種ごとの遺伝子情報でアルゴリズムを教育する必要がある。その際に、Transfer Learning(アルゴリズムを手直しすることなく他のデータで教育)の手法を用いることができるかがこれからの研究課題となる。

遺伝子解析とデータ

遺伝子解析による予測精度はアルゴリズムを教育するデータの量と質に依存する。このため、国や企業が大規模な遺伝子データセットを構築することが遺伝子工学の進歩に繋がる。米国ではNIHや23andMeなどが遺伝子データセットの整備を進めている。23andMeはGoogleが出資している新興会社で、消費者の個人データを収集し、これを解析することで収益を上げる構造となっている。検索や広告事業と同様に、遺伝子解析事業では消費者の個人データを大規模に収集することが成功に繋がる。

サンフランシスコで世界最大のネオバンクChimeが誕生、コロナを契機にフィンテック銀行が急成長

米国においてコロナ感染拡大でネオバンク(Neobank)が急成長している。ネオバンクとは新興企業が運営する銀行で、店舗を持たないでスマホアプリだけでサービスを提供する。Chimeはネオバンクの最大手で、口座手数料は無料で、給与を前受できる機能などを搭載し、手軽な銀行として大人気となっている。コロナを契機に利用者が一気に増え、世界最大のネオバンクとなった。

出典: Chime

Chimeとは

Chimeはサンフランシスコに拠点を置く新興企業で、銀行に挑戦するフィンテックと位置付けられている。専用アプリ「Chime – Mobile Banking」でデジタルバンキングを利用する。口座手数料はゼロでミレニアル層からの支持を得て急速に顧客数を増やしている。日本では普通預金口座の手数料は無料であるが、米国主要銀行は口座維持のために手数料を徴収する。Citi Bankのケースでは預金残高が1500ドルを下回ると月額12ドルの手数料を徴収する。これが銀行の収益を構成するが、消費者としてはこの手数料が重荷となる。

Chimeは手軽な銀行

Chimeは2013年に創業しTwitterなどから出資を受け、企業価値は58億ドルと評価されている。米国主要メディアによると、Chimeは4.85憶ドルの出資を受け、企業価値は145億ドルとなった。現在、最大のネオバンクはブラジルのNubankで企業価値は100億ドルとされる。Chimeはこれを抜き世界最大のネオバンクとなった。

世界最大のネオバンク

Chimeは2013年に創業しTwitterなどから出資を受け、企業価値は58億ドルと評価されていた。米国主要メディアによると、Chimeは4億8500万ドルの出資を受け、企業価値は145億ドルとなった。現在、最大のネオバンクはブラジルのNubankで企業価値は100億ドルとされる。Chimeはこれを抜き世界最大のネオバンクとなった。

コロナを契機に急成長

Chimeはコロナで成長のスピードを速めている。米国連邦議会はコロナ救済策として大型経済対策法CARES Act(Coronavirus Aid, Relief, and Economic Security Act)を可決し、企業や個人に補助金を出している。個人向けには大人一人当たり1200ドルの補助金が支給された。補助金は小切手で郵送されるが、銀行口座を登録すれば短期間で資金が振り込まれる。このため、Chimeに口座を開設し、ここで補助金を受け取る人が急増した。他の銀行と異なり、Chimeで口座を開くと、補助金が振り込まれる前に200ドルを前受することができる。このような事情から、Chimeの利用者が急増した。

出典: Chime

ネオバンクとは

ネオバンクとは営業店舗を持たないでオンラインだけで運用する銀行を指す。具体的には、Chimeは銀行の認可(Bank Charter)を受けてなく、顧客インターフェイス(Deposit Account)だけを提供し、銀行業務はBancorp Bankという銀行が担う。Bancorp Bankはデラウェア州の地方銀行で全米で215位の規模の中堅銀行である。ChimeはBancorp Bankの上に構築されたデジタルバンクとなる。Chimeは同行を通じて連邦預金保険公社(Federal Deposit Insurance Corporation)の預金保険に加入しており、仮にChimeが倒産しても顧客の預金は25万ドルまで補償される。

Chimeと銀行の関係

Chimeは銀行機能をモバイルアプリで提供するデジタルバンクであり、大手銀行とは正面から競合する関係となる。一方、ChimeとBancorp Bankは補完関係にある。中堅銀行のBancorp Bankは自社でモバイルバンキングを開発することは難しく、Chimeをデジタルバンキングのチャネルとして利用する。これは「Banking as a Service(BaaS)」といわれるビジネスモデルで、銀行が新興企業に銀行機能をクラウドとして提供し事業を拡大する。

Chimeの収益源は

口座手数料や貸し越し手数料が無料であり、Chimeはここから収益を上げることはできない。Chimeの収益源はデビットカードで、顧客がこれを使ったときに、店舗から手数料を得る構造となっている。Visaはトランザクションごとに店舗から手数料「Interchange Fee」を徴収し、この一部がChimeに支払われる。

出典: Chime

米国の法令

米国では銀行が徴収できるInterchange Feeについて法令で定められている。地方銀行は大手銀行に比べ格段に高いレートで手数料を徴収でき、ここでビジネスを構築しているChimeはカード手数料で大きな利益を上げている。(Interchange Feeは法令「The Dodd-Frank Act of 2010」で定められているが、その改定規則「Durbin Amendment」で地方銀行に有利な条件が付加された)。

ネオバンクとチャレンジャーバンク

新興企業が運営する銀行は二種類あり、ネオバンクとチャレンジャーバンク(Challenger Bank)に分類される。ネオバンクは銀行の上に構築されたデジタルバンクであるが、チャレンジャーバンクは銀行ライセンスを取得し、独立した銀行として事業を運営する。どちらもデジタル・ネイティブの銀行で手数料が無料で使いやすい点に特徴がある。(下の写真、チャレンジャーバンク最大手Revolut(レボリュート)、英国企業であるが米国市場で事業開始。)

出典: Revolut

米国メガバンクの応戦

米国のメガバンクはネオバンクの躍進に応戦するため、独自ブランドのネオバンクを投入してこの市場に参入した。JPMorgan Chaseは「Finn」というネオバンクを設立し事業を開始した。しかし、ビジネスは軌道に乗らず、Finnを停止し、ネオバンク事業から撤退した。同行は既にオンラインバンキング「Chase Online Banking」を運用しており、Finnとの差別化が難しかったことが失敗の要因とされる。JPMorgan Chaseの事例が示すように、米国のメガバンクはネオバンクの対応に苦慮している。

ネオバンクの将来

「銀行のイノベーションはATMだけである。」これはリーマンショックの際に連邦準備制度理事会議長であったポール・ボルカー(Paul Volcker)が述べた言葉である。この発言は銀行の消費者サービスが進化していないことを意味する。厳しい指摘であるが、ニューヨーク大学によると、銀行はITに積極的に投資しているが、その恩恵は消費者ではなく銀行が得ていると分析する。米国の銀行はデジタル化を進めているが、この目的はコストダウンであり、必ずしも消費者が恩恵を受けているわけではない。このような背景からネオバンクが急成長し、米国の金融サービスを大きく変えようとしている。

手数料ゼロのネット証券Robinhoodが大ブーム、やはりタダで使えるサービスほど高いものは無い

コロナの感染拡大でネット証券「Robinhood(ロビンフッド)」の会員数が急増している。アプリはお洒落なデザインで使いやすく、手数料はゼロで、個人の株式投資への敷居がぐんと下がった。手数料ゼロで利益を出せるのは訳があり、その背後で高度な情報通信技術が使われている。会員の注文は極めて短時間で決済できる超高速取引で処理され、これが収益の源泉となっている。

出典: Robinhood

Robinhoodとは

Robinhoodはカリフォルニア州メンロパークに拠点を置く新興企業で証券取引のプラットフォームを提供している。Robinhoodは手数料ゼロのネット証券として2015年に事業をスタートし、ディスラプターとして証券取引ビジネスを一新した。ミレニアル世代を中心に人気が沸騰し、2020年には会員数が1300万人を超えた。

人気の秘密

Robinhoodの人気の秘密は証券取引数料が無料であることと、アプリのデザインが若者世代のテイストにマッチしていることがあげられる。白をベースとしたシンプルなデザインで、フレッシュな印象を受ける(下の写真)。今までのフィンテックアプリとは異なり、操作性も大きく向上した。更に、0.1株から購入できるため初心者でも安心して取引できる。

出典: Robinhood

アプリ利用方法

Robinhoodはスマホアプリから利用する。最初に、会員登録のプロセスで個人情報などを入力し、銀行口座をリンクする。株を購入するときは銘柄を指定し、株数と単価とオプションを指定する。例えば、テスラ「TSLA」1株を330ドルでMarket Orderで購入するなどと指定する。このほかに、Limit Orderを指定すると条件を満たす価格で購入できる。

ビジネスモデル

Robinhoodは利益を得る仕組みを説明している。それによると、株式やオプションの手数料はゼロであるが、信用取引口座(Margin Account、Robinhoodから資金を借りて投資する口座)は有償で、会員は手数料(5ドル/月)と金利(年率5%)を支払う。また、Robinhoodは会員の余剰現金を貸付事業に展開している。これらがRobinhoodの収益を構成すると説明している。

もう一つのモデルが存在

これだけではなく、Robinhoodは「Payment for Order Flow」と呼ばれる手法で収益をあげていることが判明した。Robinhoodはこのモデルについては公開しておらず、証券取引委員会(Securities and Exchange Commission)が捜査に乗り出した。Payment for Order Flowは合法的な手法であるが、Robinhoodはこの事実を会員に公開していなかった。これが情報開示義務違反に該当する可能性があるとされる。

Payment  for Order Flowとは

Payment  for Order Flowとは、顧客の注文をブローカー間で超高速で取引し、利益を上げる手法を指す。Robinhood会員が株式やオプションを発注すると、これがそのまま証券取引所で売買されるのではなく、ブローカー(Market Maker)に渡る。Market Makerとは金融サービス企業で、お互いに買い値(Bid)と売り値(Ask)を提示し、相対取引を実行する機関を指す。Market MakerはRobinhoodからの注文を受け、他のMarket Makerと取引し、売り買いの幅(Bid-ask spread)で利益を上げ、その後、注文の処理結果をRobinhoodに返す。

Payment  for Order Flowの流れ

例えば、Robinhood会員がTesla株を330ドルで買う注文を出すと、それがMarket Makerに渡る。Market Makerは他のMarket Makerが提示する価格をスキャンし、好条件の提示価格を見つける。例えば、Tesla株を他のMarket Makerから329ドルで買い、それをRobinhoodに330ドルで売り、1ドルの利益を上げる。

出典: Robinhood

Robinhoodが利益を得る仕組み

RobinhoodはMarket Makerから利益に応じた手数料を受け取り、これがRobinhoodの利益となる。SECの資料によると、Robinhoodは2020年4月-6月期にMarket Makerから1億8026万ドルの手数料を受け取っている。これがRobinhoodの収益を支え、手数料無料でネット証券を運営できる理由となる。

Market Makerと高速取引

Robinhoodは提携しているMarket MakerはCitadel SecuritiesやVirtu Financialなどであることを公開している。これらは証券取引を極めて短時間で実行できる高速取引(High-Speed Trading)と呼ばれるシステムを構築し事業を展開している。トランザクションを超高速で実行し、他社より有利な条件で証券を売買し、これがPayment  for Order Flowが成立する基盤となる。

他のネット証券も利用

Payment  for Order FlowはRobinhoodだけでなく、他のネット証券も利用しており、業界では取引モデルとして定着している。E-TradeやTD AmeritradeはRobinhoodに追従して証券取引手数料をゼロとしたが、これらネット証券もPayment  for Order Flowを使って利益を上げている。

Robinhoodの特殊性

ただ、Robinhoodが受け取る手数料が他社に比べて高いことが議論となっている。Robinhood会員は株取引を始めたばかりのアマチュアが多く、これが高い手数料に繋がっているとの見方もある。プロの投資家と違いアマチュア投資家は甘い条件で取引を発注するので、スプレッドが大きくなり、Market Makerが利益を上げやすい構造になる。Robinhoodが投資家初心者を勧誘する理由はここにある。

出典: Robinhood

ネット証券の新たなビジネスモデル

GoogleやFacebookをタダで使えるが、その背後で個人情報が集められ、広告収入に結び付いていることを消費者は理解している。ネット証券も同様に、タダで株を売買できる代わりに、利用者の注文から利益が絞り出されることを理解する必要がある。この手法が倫理的でないとの議論もあるが、ネット証券の新しいビジネスモデルになっている。

ネット証券の新たなイメージ

Robinhoodの功績はミレニアル層など若い世代に投資の魅力を説いたことにある。若者はリーマンショックなどを経験し、株式投資に消極的な世代とされてきた。Robinhoodはこれら世代を対象に、ブログ「Snacks」で株式市場の動向を発信している(冒頭の写真)。食べやすいスナックという意味があり、複雑な政治・経済情勢を消化しやすい形で解説する。ポッドキャスト「Snacks Daily」はこれをヒップホップな音楽に乗せて若者に語り掛ける。この軽快さがRobinhoodの顔となり、アマチュア投資家の案内人として資産形成を支援する。

イーロン・マスクはNeuralinkのライブデモを実施、脳にチップをインプラントし老化を抑止する

Neuralinkはブタの脳にチップ(下の写真)を埋め込み、ニューロンのシグナルを読み出すデモを実施した。これは脳マシンインターフェイスと呼ばれ、脳内にインプラントしたチップと交信する。この技術を使うことで、事故で肢体を動かせなくなった患者を救うことができる。また、加齢とともに記憶力が落ちるが、チップがこれを補強する。将来的には、チップがAIと交信し、人間のインテリジェンスを飛躍的に高めることができると期待される。

出典: Neuralink

Neuralinkとは

Neuralinkはサンフランシスコに拠点を置く新興企業で、脳科学に基づく応用技術(Neurotechnology)を開発している。脳にインプラントするチップ「Link」(上の写真)を開発し、これが脳とマシンのインターフェイスを形成する。Neuralinkは2016年にイーロン・マスク(Elon Musk)により創設され、ステルスモードで開発を続けてきた。大学の脳科学研究者などから構成され、脳に埋め込む“ウエアラブル”を開発することを目標にしている。

発表イベント

Neuralinkは2020年8月28日、最新技術を紹介するイベントを開催し、その模様がストリーミングで配信された(下の写真、イーロン・マスクとチップをインプラントするロボット)。この会場でブタを使ってNeuralinkのデモが実施された。チップをインプラントしたブタの脳のシグナルをスマホで読み取り、それが大型モニターに表示された。

出典: Neuralink

Neuralinkを開発する意義

Neuralinkは脳と脊椎の障害を解決することをミッションとする。人間は年を取るにつれて脳と脊椎に問題が発生する。加齢により記憶機能が低下し、不眠症などの障害が起こる。また、脳や脊椎に損傷を受けると肢体の麻痺を引き起こし、体を動かすことができなくなる。Neuralinkは脳にチップをインプラントする技術で、これらの病気を治療することを目標にしている。

大学などでの研究

脳とマシンのインターフェイスの研究は早くから進んでおり、大学などでデバイスが開発されている。その代表が「Utah Array」(下の写真)で、ニューロンのシグナルを計測するデバイスとして使われている。脳にチップ(Brain Chip)を埋め込み、脳のシグナルを箱状のデバイスで計測する。失明した人がこの技術を使うことで視覚を取り戻したとの報告もある。ただ、頭部にデバイスを装着し、マシンとの接続にはケーブルが使われ、日常生活で使うには支障がある。

出典: Neuralink

Neuralinkのアーキテクチャ(2019年)

これに対してNeuralinkはデバイスやケーブルを必要としないコンパクトな技術を開発している。Neuralinkは2019年7月、プロトタイプを公開した。Neuralinkは脳にインプラントされたセンサー(N1 Sensor)からのシグナルを耳の背後に着装されたデバイスで受信する仕組みとなる(下の写真)。

出典: Neuralink

Neuralinkのアーキテクチャ(2020年)

今年はこの技術が進化し、耳の背後に装着するデバイスは不要となり、インプラントされたチップ「Link」のシグナルを直接スマホで受信する。チップは円盤状のセンサーで(下の写真)、これを脳内にインプラントする。センサーは自律型で、脳のシグナルをセンシングし、それをBluetoothでスマホに送信する。

出典: Neuralink

Linkのシステム構成

Linkは脳のシグナルを受信するため1024のチャネルから構成される。チップから1024本の極細のワイヤーが出ており(下の写真最下部、デバイスから出ている幅広のリード)、先端の電極の部分を大脳皮質に差し込む。Linkのサイズは23mm x 8 mmで、日本の10円硬貨程度の大きさとなる。Linkは加速度計や温度計などのセンサーを内蔵し、バッテリーで稼働する。稼働時間は1日で、バッテリーはワイアレスで充電する。

出典: Neuralink

インプラントのプロセス

Linkをインプラントするためには病院で外科手術を受けることとなる。頭蓋骨に円形に穴をあけ、そこにLinkをインプラントする(下の写真)。Linkを着装したあと、切り出した頭蓋骨を戻し、穴を特殊な接着剤で塞ぐ。所要時間は1時間で局所麻酔で実施する。

出典: Neuralink

インプラントロボット

脳にLinkをインプラントするプロセス全てをロボット(Surgical Robot、下の写真)で行う。ロボットは頭蓋骨をくり抜き、Linkの電極を脳の表皮に差し込む。ロボットはコンピュータビジョンを使い、大脳皮質で血管が通っていない場所を探し、ここに電極を差し込む。

出典: Neuralink

Linkから出ている線状のワイヤーが表皮に差し込まれる(下の写真)。ロボットは血管の部分を避け、針で縫物をするように電極を挿入する。これにより出血が無く表皮を傷つけないで電極を差し込むことができる。電極は皮質から5mmの深さに差し込まれる。

出典: Neuralink

ブタを使ったデモ

発表イベントではLinkをインプラントしたブタを使って脳のシグナルを計測するデモが実演された。ブタにインプラントしたLinkがニューロンのシグナルを計測し、それをブルートゥース(BLE)でスマホに送信する。受信したシグナルが大型モニターに表示された(下の写真)。このシグナルが脳の活動状況を示している(ドットの部分がシグナル特性で青色のグラフはそれを合計した値)。青色のグラフは、ブタの鼻が何かに触れた時、脳のシグナルがピークになることを示している。

出典: Neuralink

シグナルの意味を理解する

ニューロンのシグナルを機械学習の手法で解析することでその意味を理解する手法も示された(この部分は事前に録画されたビデオ)。ブタをトレッドミルで歩行させ(下の写真右側)、そのシグナルを解析した(下の写真左側)。解析したシグナル(太線のグラフ)はブタの体(肩や足首など)の動きを予想したもので、これが実際の動き(細線のグラフ)と一致することが示された。つまり、ニューロンのシグナルを解析することでアクションの意味を理解できることを意味する。

出典: Neuralink

ニューロンにシグナルを入力

Linkから脳にシグナルを入力すると、脳のニューロンが活性化されることが示された(下の写真、事前に録画されたビデオ)。電極(赤色の線)にシグナルを入力すると、周囲のニューロン(緑色の部分)が活性化する。特定のニューロンを活性化することで脳をコントロールし、病気の治療などに応用される。

出典: Neuralink

人間へのインプラント

Neuralinkはアメリカ食品医薬品局(FDA)にこのデバイスを医療機器として申請し、認可を受ける手続きを進めている。FDAは2020年7月、NeuralinkをBreakthrough Device(難病を治療する機器)と認定し、認可プロセスが加速された。NeuralinkはFDAの認可を受け、安全技術を確立し、人間へのインプラントを計画している。

難病治療から脳機能の補強まで

Neuralinkのゴールは脳や脊椎に障害がある患者の治療で、頚髄損傷(Tetraplegia)で手足を動かせない患者がキーボードでタイプできることを目指している。1分間に40語のタイプができることを目標とする。また、一般消費者が脳機能をエンハンスするためにNeuralinkをインプラントする方式も検討されている。レーシック(Lasik)で視力を矯正する手術が普及したように、Neuralinkで記憶力を補強するなど、脳機能をエンハンスする研究を進めている。

Neuralinkの評価

Neuralinkがデモした技術について評価が分かれている。既に、動物や人間の脳へのインプラントの研究は進んでおり、マスクがデモした内容は新鮮味に欠けるという指摘がある。一方、Linkは既存のデバイスより大幅に小型軽量化が進み、更に、ニューロンのシグナルを高解像度で把握できる点が評価されている。脳インプラント技術が研究室を出て、商用化に一歩近づいたことを意味する。

次のステップ

次のステップはニューロンのシグナルを解析しその意味を理解することとなる。脳のシグナルとアクションの関係は解明が進んでおらず、シグナルが何を意図するのか未開の部分が多い。ニューロンの特定のグループがどのような機能を司っているかの研究が進むこととなる。

出典: HaeB

究極の目標

マスクは、究極の目標はNeuralinkがAIとのインターフェイスを司り、人間のインテリジェンスを補強することと述べている。一方、マスクはOpenAIを創設し、人間レベルのAIの開発を進めている。NeuralinkとOpenAIの関係についてのコメントは無かったが、脳科学とAIの研究が並行で進んでおり、大きなブレークスルーが起こる兆しを感じた。(上の写真、OpenAIとNeuralinkは同じビルにオフィスを構えている。)

OpenAIの言語モデルGPT-3は人間のように少ない事例で学習、AIを巨大にすると人間になれるか

OpenAIは世界最大規模のAI「GPT-3」を公開した。GPT-3は言葉を生成するAIであるが、数少ない事例で言語能力を習得することができる。また、GPT-3は文章を生成するだけでなく、翻訳や質疑応答や文法の間違いの修正など、多彩な機能を習得する。AIの規模を大きくすることで、人間のように少ない事例で学習し、多彩な言語能力を身につけた。

出典: OpenAI

GPT-3の概要

OpenAIはGPT-3について論文「Language Models are Few-Shot Learners」で、その機能と性能を明らかにした。GPT-3は世界最大規模のAIで1750億個のパラメータから構成される。GPT-3は言語モデル(autoregressive language model)で、入力された言葉に続く言葉を推測する機能を持つ。多くの言語モデルが開発されているが、GPT-3の特徴は少ない事例で学習できる能力で、これは「Few-Shot Learning」と呼ばれる。

Few-Shot Learningとは

Few-Shot LearningとはAIが数少ない事例で学習するモデルを指す。例えば、英語をフランス語に翻訳する事例を三つ示すと、AIは英仏翻訳ができるようになる(下の写真左側)。これを進めると、一つの事例で機能を習得し、これは「One-Shot Learning」と呼ばれる。究極のモデルは、事例を示すことなく言葉で指示するだけでAIが英仏翻訳を実行する。これは「Zero-Shot Learning」と呼ばれる。GPT-3はこれらの技法を獲得することが研究テーマとなる。

出典: Tom B. Brown et al.

GPT-3はアルゴリズム最適化が不要なモデル

これは、GPT-3は最適化教育(Fine-Tuning)を必要とせず、基礎教育(Pre-Training)だけで学習できることを意味する。通常、言語モデルは基礎教育を実施し、次に、適用する問題に応じてAIを最適化する。例えば、英語を仏語に翻訳するAIを開発するには、まず基礎教育を実施し、次に、英語と仏語のデータを使いモデルを最適化する(上の写真右側)。GPT-3はこのプロセスは不要で、基礎教育だけで英語を仏語に翻訳できる。

GPT-3の異なるモデル

GPT-3は「Transformer」というニューラルネットワークから構成される言語モデルである。Transformerとは2017年にGoogleが発表したアーキテクチャで、従来モデル(recurrent neural networks)を簡素化し、性能が大幅に向上した。GPT-3はニューラルネットワークのサイズと性能の関係を検証するために8つのモデルが生成された(下のテーブル)。最大構成のシステムが「GPT-3」と呼ばれ、1750憶個のパラメータで構成される。

出典: Tom B. Brown et al.

教育データ

GPT-3の基礎教育では大量のテキストデータが使われた。その多くがウェブサイトのデータをスクレイピングしたもので、Common Crawlと呼ばれるデータベースに格納されている情報が利用された。この他にデジタル化された書籍やウィキペディアも使われた。つまり、GPT-3はインターネット上の情報で教育されたAIとなる。

出典: Tom B. Brown et al.  

GPT-3は多彩な機能を習得

開発されたGPT-3は多彩な言語能力を習得した。GPT-3は自然言語解析に強く、文章の生成だけでなく、言語翻訳、質疑応答、文章の穴埋め(cloze tasks)を実行できる。また、因果関係を把握する(Reasoning)機能、文字の並べ替え(unscrambling words)、3桁の計算を実行する能力がある。 (下の写真、GPT-3が文法の間違いを修正する機能。文法の間違い(灰色の部分)を修正し正しい文章(黒色の部分)を生成する。)

出典: Tom B. Brown et al.  

GPT-3の機能の限界

GPT-3が生成する文章の品質は極めて高く、恐ろしいほど人間の文章に近く、社会に衝撃を与えた。同時に、この研究で、GPT-3は多くの課題があることも明らかになった。また、AI研究者からもGPT-3の問題点が指摘された。

文法は正しいが違和感を感じる

GPT-3は高品質な記事を生成するが、しばしば稚拙な文章を生成する。例えば、GPT-3は同じ意味の記述を繰り返し、趣旨一貫しない記事も多い。また、結論が矛盾していることも少なくない。特に、推論においてはGPT-3は人間のような常識を持っておらず、社会通念に反した文章を生成する。

出典: Tom B. Brown et al.  

(上の写真:灰色の部分が人間の入力で、GPT-3はそれに続く文章を生成(黒字の部分)。人間が「映画スターJoaquin Phoenixは授賞式で同じタキシードを着ると約束した」という内容で記事を書くよう指示すると、GPT-3は「Phoenixはハリウッドの慣習を破った」という内容の記事を生成した。しかし、言葉の繰り返しが目立ち、意味は通じるが、稚拙な文章でしっくりしない。)

物理現象の常識

GPT-3は物理現象の常識(common sense physics)が欠けている。このため、「冷蔵庫にチーズを入れると溶けるか?」という質問にGPT-3は正しく回答できない。また、「2021年のワールドシリーズは誰が勝った?」という質問にはGPT-3は「ニューヨーク・ヤンキース」と答える(下の写真)。GPT-3は日常社会の基本的な概念を持たず、人間とは本質的に異なる。

出典: Kevin Lacker

社会のしきたり

GPT-3は人間社会の慣習や常識についての知識を持っていない。人間が「弁護士がスーツのズボンが汚れているのに気付いた。しかし弁護士はお洒落な水着を持っている。」と入力すると(下の写真)、GPT-3は「弁護士は水着を着て裁判所に行った」という文章を生成(太字の部分)。GPT-3は社会の常識が無く、弁護士が水着で裁判所に行くことはない、という社会通念を理解していない。

出典: Gary Marcus

課題1:言語モデルの教育方法

GPT-3はネット上のテキストだけで教育され知識を取得した。一方、人間はテキストを読んで学習することに加え、テレビやビデオで情報を得る。それ以前に、人間は日常生活で人と交わり、交流を通じて社会の常識を得る。言語モデルはテキストだけで教育すると限界に達し、これ以外のメディア(ビデオや実社会との交流など)による教育が次のステップとなる。

課題2:学習効率

GPT-3の特徴はFew-Shot Learningで、人間のように少ない事例でタスクを実行できる。しかし、GPT-3は基礎教育の課程で人間が学習するより多くのデータで教育された。GPT-3は数十億ページのドキュメントで学習したが、人間はこれほど大量の書物を読まなくても言葉を習得できる。つまり、言語モデルの教育では人間のように効率的に学習することが課題となる。このためには、教育データの範囲を広げること (実社会のデータなど)や、アルゴリズムの改良が次の研究テーマとなる。

否定的な見解

この研究ではGPT-3のサイズを大きくすると、言語能力が向上することが示された。では、GPT-3のニューラルネットワークを更に巨大にすると、人間のようなインテリジェンスを獲得できるかが議論となっている。ニューヨーク大学(New York University)名誉教授Gary Marcusはこれに対し否定的で、サイズを大きくしても機能は改良されないと表明している。GPT-3は学習した言葉を繋ぎ合わせているだけで、文法は完璧だが、その意味を理解しているわけでないと説明する。

人間に近づけるか

OpenAIは論文の中で、GPT-3が言葉の意味を理解することが課題で、次のステップとして、アルゴリズムを人間のように教育する構想を示している。AIが社会に出て、人と交わり、経験を積むことで、言葉とその意味の関係(Grounding)を学習する。この手法でAIがどこまで人間に近づけるのか、これからの研究に期待が寄せられている。

GPT-3の多彩な機能とベンチマーク結果】

穴埋め問題

GPT-3は文章を読んで最後の単語を予測する機能を持つ(下の写真)。これは「LAMBADA」といわれるタスクで、言語モデルの長期依存機能(言葉を覚えている機能)をベンチマークする。物語が展開され(下の事例では暗闇の中で岩に階段が刻まれている)、それを読み進め、GPT-3が最後の単語を推定する(正解は階段)。GPT-3の正解率は86.4%で業界トップの成績をマークした。

出典: Tom B. Brown et al.  

知識を検証する

GPT-3は幅広い知識を持っており、言語モデルの知識を検証する試験(Closed Book Question Answering)で好成績をマークした。これは「TriviaQA」と呼ばれ、言語モデルがテキストを読み質問に回答する(下の写真)。ここでは一般知識に関する幅広い質問が出され、言語モデルの知識の量を検証する。(下の事例、「Nude Descending a Staircase(階段を下りるヌード)」という絵画の制作者を問う問題。正解はMarcel Duchampであるが表記法は下記の通り複数ある。)

出典: Tom B. Brown et al.  

このケースではGPT-3の正解率は71.2%(Few-Shot Learning)をマークした。このベンチマークでは、GPT-3のサイズが大きくなるにつれ、正解率が向上していることが示された(下のグラフ)。つまり、ニューラルネットワークの規模が大きくなるにつれ、知識を吸収する技量が向上することが証明された。

出典: Tom B. Brown et al.  

文章生成

GPT-3は人間のように文章を生成するが、その性能を検証するベンチマーク(News Article Generation)が実施された(下の写真)。GPT-3が生成した記事を人間が読んで、マシンが生成したものであることを見分ける試験。その結果、最大モデルの検知率は52%で、GPT-3が生成する文章の半数は人間が真偽を判定できないことを示している。このケースでもGPT-3のサイズが大きくなるにつれ、フェイクニュースの技量が向上していることが分かる。

出典: Tom B. Brown et al.