REFOG ブログ Login

ディープフェイクとは何か——AIはどのように写真・動画・音声を偽造するのか

ディープフェイクとは、実在する人物を本物そっくりに模倣する、AIが生成または改変したメディアのことです。落ち着いた、根拠にもとづく保護者向けガイド——ディープフェイクとは何か、どのように作られるのか、そしてお子さんにとって何を意味するのかを解説します。

2026年5月27日 · 13 分で読了 · 著者 REFOG Team
くすんだ紫色の表面の上で、散らばった紙の断片から組み上がっていく一枚の白紙の仮面

ディープフェイクとは本当のところ何か

片隅がめくれ上がり、裏側が空洞であることがあらわになった一枚の白紙の仮面

ほとんどの保護者が最初にこの言葉に出会うのは、見出しのなかでです——そんなことは言っていない有名人、そこに立ってなどいない政治家、まったくの他人の体に貼りつけられた同級生の顔。見出し自体は本物ですが、そこには欠けているものがあります。それは、保護者が実際に使える、実用的な定義です。それがなければ、おかしな写真はどれも無害に見えるか不気味に見えるかのどちらかになってしまい、どちらの当て推量もお子さんの助けにはなりません。

ディープフェイク(deep fakeと二語で書かれることもあります)とは、実在する人物が一度もしていない行動や発言を本物そっくりに見せるために、人工知能によって作成または改変された合成メディア——画像、動画、または音声クリップ——のことです。Encyclopædia Britannicaはこれを、「現実には存在しないものや、一度も起こらなかった出来事を描写する」合成メディアと定義しています。この言葉自体は、それを動かすAI技術であるディープラーニング(深層学習)フェイク(偽物)を組み合わせた混成語であり——その言葉は、いまそれによって影響を受けている10代の若者たちよりも若いのです。

この用語は2017年末に生まれました。あるRedditのユーザーが「r/deepfakes」というサブレディットを作成し、そこに顔を交換した動画を投稿しはじめたことで、このカテゴリー全体にその名が与えられたのです。10年足らずのうちに、それはインターネットの目立たない片隅から、学校の廊下の問題へと移り変わりました。その速さこそが重要です。お子さんが日々向き合っている技術は、保護者がそれについて耳にしてきたたいていの助言よりも新しいのです。

いまや一つの呼び名が三つの異なるものにまたがっています——別の体に貼りつけられた顔、短い録音から複製された声、そして、最も緩やかな端では、誰のものでもない顔です。厳密には、ディープフェイクは実在する人物を模倣または改変するものであり、完全に作り出された顔はその近縁にあたるもの——偽のプロフィールや詐欺において同じように使われる合成メディアです。これらを結びつけているのは、どう作られるかではなく、何を成し遂げるかです。すなわち、信じてしまうほど本物らしい結果です。10代の若者にとってのAIのリスクを扱う柱(ピラー)ガイドは、それぞれを古くからある危険を増幅させたものとして扱っています。本ガイドはディープフェイクそのものに焦点を当てます——それが何であるか、どう作られるか、そしてなぜ突如としてどこにでもあるようになったのかを。

ディープフェイクは実際どう作られるのか

くすんだ紫色の表面の上で、同一の紙の束から立ち上がる一枚の白紙の仮面

お子さんをそれから守るために、自分でディープフェイクの作り方を知る必要はありません——そして本ガイドもその作り方は説明しません。しかし、おおまかな仕組みを理解している保護者は、はるかにだまされにくく、また懐疑的な10代の若者にリスクを説明するのもずっと上手になります。ほとんどすべてのディープフェイクの中心には、一つの単純な考えがあります。すなわち、ある顔や声の本物の例を十分な量だけAIモデルに見せれば、それは説得力のある新しいものを生み出せるようになる、というものです。

最もよく知られた手法は敵対的生成ネットワーク、すなわちGANで——2010年代半ばに登場したとき、この技術の転換点となりました。二つのAIモデルが互いに張り合わされ、いわば贋作者と鑑定人のゲームのようなものが繰り広げられ、贋作者は鑑定人がもはや見破れなくなるまで改善を続けます。

ディープフェイクはしばしば敵対的生成ネットワーク(GAN)を用いて作られる。そこでは二つの異なるAIの深層学習モデルが当て推量のゲームのなかで協働する。一方のモデルは本物の画像や動画の可能なかぎり最良の複製を作り、もう一方はその複製が偽物かどうかを検出し、誤りを見つけた場合には、それと原本との違いを報告する。

— Encyclopædia Britannica, “Deepfake”

より新しいシステムは拡散モデル——いまや画像・動画ツールで一般的になっています——を使います。これはランダムなノイズから出発し、それを一段階ずつ精緻化して、説明に合致する画像へと仕上げていくものです。顔交換の動画は、また別のツールに依存する傾向があります——MIT Sloanが「変分オートエンコーダ」と表現するネットワークで、これは顔を簡潔なパターンへと圧縮し、それを別の人の頭の上に再構築するように訓練されたものです。声は、ある人物の話し方を真似られるようになるまで本物の録音をモデルに与えることで複製されます。細部は異なりますが、原理は同じです。本物のものを機械に十分なだけ見せれば、それは偽物を製造するのです。

技術的な細部は、どの保護者が追えるよりも速く動いています——そしてそれを追う必要もありません。無害な写真フィルターや宿題の手助けを動かしているのと同じ系統のモデルが、悪用をも動かしているのであり、まさにそれゆえにこの技術は締め出すのが非常に難しいのです。そして、だからこそ役に立つ問いは「どうやって禁止するか」ではなく「いま見ているものをどうやって確かめるか」なのです。

実際に出くわす三つの形態

横一列に並んだ、それぞれがわずかに変えられた、ほぼ同一の三枚の白紙の仮面

保護者にとって役に立つ分類は、技術的なものではありません。それは何が届くのか——お子さんのスマートフォンに、あなた自身の留守番電話に、あるいはグループチャットに——についてのものです。三つの形態でほぼすべてをカバーできます。

家族が出くわす三つの形態
  1. 顔を交換した動画や写真実在する人物の顔が、別の体や、その人が一度もいなかった場面に貼りつけられたもの。これが本来の「ディープフェイク」であり、10代の若者の偽の親密な画像のほとんどの背後にある形態です。
  2. 複製された声短い公開クリップがあれば、誰かの声を本物そっくりに——とりわけ慌ただしい電話越しに——真似るのに十分なことがあります。これが「家族の緊急事態」をかたる電話詐欺を動かしており、10代の若者の口に言葉を入れることもできます。
  3. 完全に合成された人物実在する誰のものでもない顔——そして時には人物像全体。誰も模倣していないため厳密にはディープフェイクの近縁ですが、同じように使われます。すなわち、偽のプロフィールを埋め、見知らぬ人を、実在しないのに信じられそうな10代の若者として通用させるために。

境界はあいまいになります。偽のプロフィールは、合成された顔と複製された声、そして「証拠」として差し出される顔交換のクリップとを組み合わせるかもしれません。その最後の形態こそ、AIが古典的なキャットフィッシング(なりすまし)を再構築するやり方です——柱(ピラー)ではAIで作られたキャットフィッシングの人物像を詳しく扱っています。しかし形態に名前をつけることが、お子さんが送られてきた特定のものを見極める第一歩なのです。

なぜ突如として安価で、速く、簡単になったのか

くすんだ紫色の表面の上で、小さな開いた箱からあふれ出る同一の白紙の仮面の連なり

コンピューティングの歴史の大半において、顔を本物そっくりに偽造するにはスタジオと予算、そして専門家が必要でした。二つのことがそれを変えました。一つ目はすでに述べた技術的な飛躍——2010年代半ばに登場した生成的手法です。二つ目は流通でした。すなわち、無料でダウンロードできるツールやサービスが、専門家でない人々のための敷居を着実に下げていったのです。かつてはスタジオと専門家を必要としたものが、はるかに手の届きやすいものになりました。

保護者にとって最も重要な変化は、速さではなく素材そのものです。ディープフェイクはもはや、私的な、あるいは不都合な画像から始める必要がありません。必要なのは顔のありふれた写真だけ——すでに卒業アルバムやチームの名簿、友達の投稿、公開プロフィール、古いアカウントにあるような写真です。FBIは、悪意ある者が「写真や動画——典型的には個人のソーシャルメディアアカウントやオープンなインターネットから取得されたもの、あるいは被害者に求めて入手したもの」を取り、それをその人が一度もしていないものに変えてしまうと警告しています。素材となるのは、どんな10代の若者もオンラインに残すありふれたデジタルの足跡です——だからこそ、より小さく、より私的な足跡が数少ない実践的な防御の一つなのであり、それは投稿したことが決してお子さんの過ちだったからではありません。

数字がその広がりを物語っています。ディープフェイクの最初の本格的な実態調査であるDeeptraceの2019年の報告書は、オンライン上に14,678本のディープフェイク動画を数えました——その7か月前の数字のほぼ倍であり、そのうち96%が同意なきポルノでした。2023年までに、本人確認企業のSumsubは、わずか1年間で検出したディープフェイクが10倍に増加したと報告しました。この二つの集計は異なるものを測っています——オンライン上の動画と、本人確認で捕捉された偽物——が、どちらも同じ方向を指し示しています。すなわち、ほんの数年のうちに、合成メディアは物珍しいものから大規模な問題へと変わったのです。

10代の若者が実際にディープフェイクに出くわす場所

くすんだ紫色の表面の上で、閉じた扉の細い隙間をすり抜けていく一枚の白紙の仮面

お子さんが目にするAIで改変されたメディアのほとんどは無害です——顔フィルター、ふざけたアフレコ、若返り効果など——そして、そのすべてを脅威として扱えば、あなたは信頼を失うばかりです。害が始まるのは、同じ合成メディアの技術が、なりすまし、辱め、詐欺、あるいは強要のために使われるときであり、それはいくつかの見覚えのある入口を通じて10代の若者のもとに届きます。

  • 詐欺の電話やメッセージ 複製された声が「家族の緊急事態」の電話を動かします。FTCは警告しています。詐欺師に必要なのは「短い音声クリップ……オンラインに投稿されたコンテンツから入手できるもの」だけだと。電話口の声は、親族のものかもしれません——あるいは、あなたをだますために複製された、お子さん自身の声かもしれません。
  • 偽の親密な画像 ありふれた写真が露骨な偽物に変えられたもの。これは現実の学校で起きています。2023年末、ニュージャージー州のある高校の生徒が、同級生のヌード画像をAIで偽造するためにAIを使ったとして告発されました——その少女の一人は、自分が30人以上の標的の一人だったと話しています。そのような写真に写っている子どもは何も悪いことをしていません。悪いのはそれを作った者です。柱(ピラー)ではディープフェイクのヌード画像と「ヌード化」アプリを全面的に扱っています。
  • セクストーション もはや本物の画像を必要としない恐喝。FBIによれば、未成年者を含む被害者はしばしば「自分の画像がコピーされ、改変され、出回っていることに、他の誰かに知らされるまで気づかない」とのことです。AIによるセクストーションを参照してください。
  • いじめ 偽のクリップ、偽の「証拠」、そして辱めるための画像が学年内で出回ること——合成された「証拠」によって、より説得力を増した仲間からのいやがらせです。これはまさにネットいじめの領域に位置します。
  • 偽の人物 キャットフィッシング(なりすまし)のプロフィールの背後にある合成された顔や人物像で、見知らぬ人を信じられそうな10代の若者に見せかけます。オンラインの相手が実在するかどうかを確かめるための私たちのガイドはいまも当てはまります——ただ、いっそう手間をかけて働かなければならなくなっただけです。

その規模は現実のものですが、読み違えやすくもあります。2024年、National Center for Missing & Exploited Childrenは生成AIに関わる通報が1,325%増加したと記録し、2024年から2025年にかけて、AIが生成した児童性的虐待コンテンツの275人を超える直接の被害者を特定しました——多くは、すでにその子どもの身近にいる者によって虐待されていました。2025年の生の合計はさらにはるかに大きく見えますが、NCMECは、その量の大半が単一の通報元から来たものであり、対処するに足る詳細を欠いていたと注意を促しています。これらの事例は読むのがつらいものです。しかし、それらは乗り越えられるものでもあり、対応の仕方もきちんと確立されています。

お子さんが偽の画像、動画、または音声の標的にされた場合は: 支払いをしてはいけませんし、お子さんに返信させたり、これ以上何かを送らせたりしてはいけません。転送や再投稿をせずに証拠を保全してください——URL、ユーザー名、日付、プラットフォームを記録します——そして、その素材が未成年者の性的な画像である場合は、いかなるコピーも保存・共有する前に、NCMECとプラットフォームの指示に従ってください。プラットフォーム、NCMECのTake It Down、そして法律を含む段階を追った完全な手順は、柱(ピラー)のAIの悪用を通報するためのガイドと、キャットフィッシングの柱の法的・通報の見取り図にあります。お子さんが、自分は叱られているのではないということを、はっきりと聞き取れるようにしてください。

お子さんが一度も標的にされなくても、これが重要な理由

くすんだ紫色の表面の上で、白紙の仮面と、それとぴたりとは一致しない鏡像とが並んでいる様子

すべての10代の若者に、標的にされたかどうかにかかわらず触れる、より静かな帰結があります。何世代にもわたって、「この目で見た」という言葉は議論の終わりを意味してきました。ディープフェイクはその時代を終わらせます。どんな画像も偽物でありうるとき、二つのことが同時に起こります。すなわち、偽りのことが信じられやすくなり——そして、より蝕むようにですが——本当のことが否定されやすくなるのです。

皮肉なことに、自らの本当の言動の責任を逃れようとする嘘つきたちは、人々がディープフェイクのもたらす脅威についてより知識を深めるにつれ、かえって信用されやすくなるだろう。

— Bobby Chesney & Danielle Citron, “Deep Fakes: A Looming Challenge for Privacy, Democracy, and National Security,” California Law Review (2019)

法学者はこれを嘘つきの配当(liar's dividend)と呼びます。すなわち、ひとたび誰もが偽物の存在を知れば、本物の動画も「どうせAIだろう」と一蹴されかねないのです。10代の若者にとってそれは、いじめの本物のスクリーンショットがでっち上げとして退けられたり、本物の謝罪が否定されたりすることを意味しかねません。ディープフェイクの害は偽物そのものだけにとどまりません——それは、本物のすべてに投げかける疑いにあるのです。詳しい議論はCalifornia Law Reviewでお読みいただけます。

本能的には、偽物を見破れるようになろうとするものです。古典的な手がかり——不自然な手、おかしな歯、ちぐはぐな照明、不自然なまばたき——を知っておくことは価値がありますが、それは次第に効かなくなっていく技能です。MITのMedia Labは「これといった決定的な兆候はない」とはっきり述べており、研究者が2025年に現実世界の偽物に対して検出ツールを試験したところ、技術が進歩し続けているにもかかわらず、その精度は急激に低下しました。誤りを見つけることはいまも役に立ちますが、もはやそれだけでは十分ではありません。

そこで目標が移ります——偽物を見破ることから、出所を確かめることへと。それは家族が築ける習慣であり、鋭い目に頼るものではありません。

教える価値のある習慣
古い反射的反応いまも効く習慣
衝撃的なものが届く画像をじっと見つめ、自分の目を信じる立ち止まり、それが実際どこから来たのかを確かめる
取り乱した電話や音声メッセージ声を信じる——まさにその人そっくりに聞こえるからいったん切り、すでに知っている番号にかけ直す
見覚えのない写真ひと目で本物か偽物かを判断する逆画像検索を実行して原本を見つける
誰かが本人であるという「証拠」自撮りや短いクリップで決着がつく一枚の画像に頼らない。これ以上の私的なやりとりの前に、信頼できる大人やプラットフォームを通じて確認する
オンラインには決して投稿しない、家族だけの私的な合言葉を取り決めておけば、緊急の電話に対して一つの問いで確かめられる手立てになります——これはFTCとFBIの双方が勧めている一歩です。
お子さんが社会的な手がかりを読み取るのが苦手な場合は: 多くの神経発達に特性のある10代の若者がそうであり、「直感を信じなさい」は、直感がそもそもやって来ないときには使える規則ではありません。それを、毎回同じである決まった手順に置き換えてください——いったん立ち止まる。返信も転送もしない。アカウント、プラットフォーム、日付、URLを記録する。決めておいた大人のところへ持っていく。すでに信頼している経路を通じて確認する。その素材が未成年者の性的な画像である可能性がある場合は、NCMEC、プラットフォーム、または法執行機関から求められないかぎり、コピーを保存・共有しないでください。決まった手順は、そうでなければ自分自身の疑いを言いくるめられてしまいかねないお子さんを守ります。

このどれも、お子さんが自分のスマートフォンを恐れることを求めはしませんし、あなたが法科学の分析官になることを求めもしません。求められるのは、共有された一つの規則——反応する前に確かめる——と、それを手本として示せるほど落ち着いた保護者です。本ガイドの残りはリスクを一つずつ追っていきます。すなわち、偽の親密な画像がどう作られ、どう対処されるか、AIによるセクストーションがどう働くか、声を複製する詐欺がどうあなたの家族に届くか、そしてAIがどのようにキャットフィッシング(なりすまし)を再構築しているか。いったん仕組みを理解すれば、それぞれが謎であることをやめ、計画のある問題へと変わります。

よくある質問

ディープフェイクとは正確には何ですか?

ディープフェイクとは、実在する人物が一度もしていない行動や発言を、本物そっくりに見せるために人工知能が生成または改変した合成メディア——写真、動画、音声クリップ——のことです。この名称は、その背後にあるAIの手法である「ディープラーニング(深層学習)」と「フェイク(偽物)」を組み合わせたものです。通常は三つの形態のいずれかをとります。すなわち、別の体に貼りつけられた顔、短い録音から複製された声、そして——この言葉のより緩やかな端にあたるものとして——完全に作り出された顔です。最初の二つは実在する人物を模倣するものであり、完全に合成された顔はその近縁にあたるもので、同じように使われます。これらに共通するのは、信じてしまうほど本物らしく見えるという点です。

ディープフェイクはどのように作られるのですか?

ほとんどのディープフェイクは、ある人物の本物の写真・動画・音声を使ってAIモデルを訓練し、説得力のある新しいバージョンを生成できるようになるまで学習させることで作られます。最もよく知られた手法である敵対的生成ネットワークは、二つのモデルを互いに競わせるもので——一方が偽物を作り、もう一方が欠陥を見つける——結果が通用するようになるまでこれを繰り返します。ほかにも拡散モデルや顔交換ネットワークを使うものがあり、声は録音から複製されます。保護者の方が技術的な細部を知る必要はありません。原理は単純に、十分な量の本物の素材があれば機械はさらなる偽物を作れるようになる、というだけのことです。

ディープフェイクは見ただけで見破れますか?

見破れることもありますが、それは当てにならず、しかも次第に効かなくなっていく技能です。古典的な手がかりとしては、不自然な手、ゆがんだ歯、ちぐはぐな照明、おかしなまばたき、ちらつく輪郭などがあります。MITのMedia Labは「これといった決定的な兆候はない」と注意を促しており、技術はあまりに速く進歩しているため、訓練を積んだ目でさえ見分けに苦労するだろうと専門家は予想しています。より安全な習慣は、画素を判定しようとするのではなく、出所を確かめることです——逆画像検索を使ったり、すでに知っている番号にかけ直したりするのです。お子さんがオンラインでしか知らない相手については、その見知らぬ人にさらなる「証拠」を迫るのではなく、信頼できる大人やプラットフォームを通じて確認してください。

うちの子のディープフェイクを作るには、どれくらいの素材が必要なのですか?

保護者の方が思うよりもはるかに少なくて済みます。声は公開動画から取り出した短い発話クリップから複製でき、顔はありふれた写真——学校の写真、チームの名簿、友達の投稿——から偽造できます。私的な、あるいは不都合な画像は一切必要ありません。FBIは、加害者が一般に人物のソーシャルメディアアカウントやオープンなインターネットから写真を取得することを指摘しています。公開されているものを減らすことは実践的な一歩ですが——非があるのは常に偽物を作って拡散する者であって、決してお子さんではありません。

誰かのディープフェイクを作ることは違法ですか?

違法になりうるものの——通常は、作ったこと自体だけでなく、その偽物が共有されたかどうか、対象者の年齢、そしてお住まいの地域によって左右されます。米国では、TAKE IT DOWN Actにより、本人の同意なく親密な画像——AIによる「デジタル偽造物」を含む——を故意に公開すること、あるいは公開すると脅すことが連邦犯罪となりうるもので、成人と未成年者で異なる規則が定められており、対象となるプラットフォームは、有効な削除要請の対象となるコンテンツと既知の同一コピーを48時間以内に削除しなければなりません。未成年者の性的な偽物は、児童性的虐待コンテンツとして訴追されることもあります。法律は国によって異なるため、これは法的助言ではありません。

10代の若者がディープフェイクに最も出くわしやすいのはどこですか?

お子さんがAIで改変されたメディアに出くわすのは、たいていは無害な場面です——フィルター、ふざけたアフレコ、若返り効果など。有害なディープフェイクは通常、いくつかの特定の入口を通じてやって来ます。すなわち、声を複製した「家族の緊急事態」をかたる詐欺電話、ありふれた写真から作られた偽の親密な画像、合成画像を使ったセクストーション、偽の「証拠」を用いたAI支援によるいじめ、そして作り出された顔の上に築かれたキャットフィッシング(なりすまし)のプロフィールです。自分が見ているのがどの形態なのかを知ることが、どう対処すべきかを決める第一歩です。