Wie erkenne ich Deepfakes?

Was ist ein Deepfake?

Ein Deepfake ist ein Bild, Video oder eine Tonaufnahme, die mit Deep Learning erzeugt oder verändert wurde — daher der Name, zusammengesetzt aus „deep learning“ und „fake“. Typische Formen sind getauschte Gesichter in Videos, geklonte Stimmen, die beliebige Sätze sprechen, oder komplett erzeugte Szenen, die nie stattgefunden haben. Die Technik dahinter ist frei verfügbar und wird jedes Jahr besser, billiger und schneller.

Um zu verstehen, warum Deepfakes so schwer zu fassen sind, hilft ein Blick auf das, was ein echtes Foto eigentlich ist. Ein echtes Foto ist eine Entität mit gewachsenen Relationen: zur aufgenommenen Situation, zur Kamera, zum Ort, zur Uhrzeit, zu den Menschen im Bild, zu unabhängigen Zeugen, zu anderen Aufnahmen desselben Moments. Diese Verbindungen sind nicht sichtbar, aber sie sind da — und sie lassen sich prüfen.

Ein Deepfake imitiert nur die Oberfläche dieser Entität. Es sieht aus wie ein Foto, klingt wie eine Stimme, bewegt sich wie ein Mensch. Aber die Relationen ins reale Ereignis fehlen, weil es das Ereignis nie gab. Genau das ist der Ansatzpunkt fürs Erkennen: Du prüfst nicht nur, wie etwas aussieht, sondern woran es hängt.

Woran erkennst du ein Deepfake-Video oder -Bild?

Die erste Ebene ist der Zoom ins Detail. Generatoren machen an bestimmten Stellen noch immer Fehler: Hände mit zu vielen oder verschmolzenen Fingern, unregelmäßige Zähne, Ohren und Ohrringe, die zwischen Bildern die Form wechseln, Brillenränder, die im Gesicht verschwimmen, Haaransätze, die unnatürlich weich in die Stirn übergehen. In Videos lohnt der Blick auf die Lippensynchronität, auf seltsam gleichmäßiges oder fehlendes Blinzeln und auf Schatten, die nicht zur Lichtquelle passen.

Auch der Hintergrund verrät viel. Text auf Schildern, Plakaten oder Bildschirmen ist für Generatoren schwer — oft entstehen Zeichen, die nur aussehen wie Schrift. Muster wie Fliesen, Zäune oder Tastaturen geraten aus dem Takt. Bei Stimmen fallen flache Betonung, fehlende Atemgeräusche und ein zu sauberer Klang ohne Raumhall auf.

Wichtig ist die richtige Gewichtung: Solche Artefakte sind Hinweise, kein Beweis. Und ihr Fehlen ist keine Entwarnung. Ein sauber gerechnetes Deepfake zeigt keinen dieser Fehler mehr — dann trägt die Detail-Ebene allein nicht weiter, und du musst eine Ebene höher gehen.

Warum werden Deepfakes immer schwerer zu erkennen?

Weil Erkennung und Erzeugung in einem Wettlauf stecken, den die Erzeugung strukturell gewinnt. Viele Generatoren werden genau daran trainiert, Detektoren zu täuschen: Jeder Fehler, den ein Prüfsystem findet, wird zur Trainingsinformation für die nächste Generatoren-Version. Was heute ein verlässliches Erkennungszeichen ist — die sechs Finger, das fehlende Blinzeln — ist morgen behoben.

Das heißt nicht, dass Erkennung sinnlos wird. Es heißt, dass sich der verlässlichste Hebel verschiebt: weg von der Oberfläche des einzelnen Mediums, hin zu seinen Relationen. Die Oberfläche kann ein Generator beliebig gut imitieren. Was er nicht erzeugen kann, sind echte Verbindungen ins reale Ereignis — unabhängige Zeugen, eine nachvollziehbare Veröffentlichungshistorie, andere Kameras am selben Ort.

In den Begriffen des Modells: Die Oberfläche einer Entität ist fälschbar, ihr Netzwerk nicht. Ein echtes Ereignis aktiviert viele Relationen gleichzeitig, in viele Richtungen. Ein Deepfake bleibt relational isoliert oder führt im Kreis zu sich selbst zurück — dieselbe Datei, weitergereicht von Konto zu Konto, ohne dass je eine unabhängige Quelle dazukommt.

Was sagt die Herkunft über die Echtheit?

Sehr viel — oft mehr als jedes Pixel. Die erste Frage lautet: Wo tauchte dieses Bild oder Video zum ersten Mal auf? Eine Rückwärts-Bildersuche zeigt dir, ob es älter ist als behauptet, ob es aus einem anderen Kontext stammt oder ob es überhaupt keine Spur vor dem viralen Moment gibt. Ein frisch angelegtes, anonymes Konto als einzige Quelle ist ein deutliches Warnsignal.

Die zweite Frage: Welche unabhängigen Relationen lassen sich aktivieren? Wenn ein Politiker wirklich etwas Skandalöses gesagt hat, berichten mehrere Redaktionen unabhängig voneinander, es gibt weitere Aufnahmen aus anderen Winkeln, Anwesende äußern sich, offizielle Kanäle reagieren. Jede dieser Bestätigungen ist eine eigene Verbindung ins Ereignis. Bleiben sie alle aus, obwohl das Ereignis groß sein müsste, ist das aussagekräftiger als jede Bildanalyse.

Die dritte Frage: Passt der Kontext zu nachprüfbaren Fakten? Ort, Datum, Wetter, Kleidung, wer wann wo war — vieles davon lässt sich gegenprüfen. Regnet es im Video, obwohl es an dem Tag an dem Ort trocken war, ist die Relation zwischen Behauptung und Wirklichkeit gerissen. Je mehr solcher Verbindungen du prüfst und je mehr davon halten, desto belastbarer wird die Entität.

Welche Tools und Standards helfen (C2PA, Content Credentials)?

Automatische Deepfake-Detektoren gibt es, aber verlass dich nicht allein auf sie. Sie liefern Wahrscheinlichkeiten, keine Urteile, irren sich in beide Richtungen und veralten schnell, weil die Generatoren nachziehen. Nützlicher im Alltag sind Werkzeuge, die Relationen sichtbar machen: Rückwärts-Bildersuchen wie Google Lens oder TinEye, Archivdienste für ältere Versionen einer Seite und die Arbeit von Faktencheck-Redaktionen, die genau diese Herkunftsprüfung professionell betreiben.

Der wichtigste strukturelle Ansatz heißt C2PA, umgesetzt etwa als Content Credentials. Die Idee: Kameras und Programme signieren beim Erzeugen und Bearbeiten kryptografisch, woher eine Datei stammt und was mit ihr geschah. Die Herkunfts-Relationen werden also technisch an die Entität geheftet und reisen mit ihr mit. Statt hinterher zu raten, kannst du nachsehen, welche Kette an Bearbeitungsschritten das Bild hinter sich hat.

Auch hier gilt die richtige Lesart: Vorhandene, gültige Credentials sind ein starkes Signal für dokumentierte Herkunft. Fehlende Credentials sind aber kein Beweis für eine Fälschung — die meisten echten Aufnahmen tragen heute noch keine. Der Standard verschiebt die Beweislast langsam, er ersetzt deine Prüfung noch nicht.

Deepfakes im größeren Netzwerk: Warum Vertrauen das eigentliche Ziel ist

Zoom einmal heraus. Auf der Ebene des einzelnen Videos geht es um echt oder gefälscht. Auf der Netzwerkebene geht es um etwas anderes: um die Vertrauensrelationen zwischen Menschen, Medien und Institutionen. Ein Deepfake muss dich nicht dauerhaft täuschen, um zu wirken. Es reicht, wenn es sich in den ersten Stunden schnell verbreitet — oder wenn es das Vertrauen so weit schwächt, dass du irgendwann gar nichts mehr glaubst.

Dieser zweite Effekt hat einen Namen: Wer bei einer echten, belastenden Aufnahme einfach „Deepfake“ ruft, kann sich der Verantwortung entziehen — die bloße Existenz von Fälschungen wird zum Schutzschild für Ertappte. Das Ziel des Angriffs ist dann nicht ein einzelnes Bild, sondern die Relation zwischen Aufnahme und Beweiskraft überhaupt. Beides, blindes Glauben und pauschales Abtun, schwächt dasselbe Netzwerk.

Deine eigene Rolle darin ist konkret: Jedes Teilen aktiviert Relationen weiter. Ein Deepfake, das niemand weiterreicht, bleibt eine isolierte Datei. Die Prüfung vor dem Teilen ist deshalb kein Misstrauen gegen alles — sie ist die Pflege der Verbindungen, auf die alle angewiesen sind, wenn Sehen allein nicht mehr genügt.

So sieht das mit dem Modell aus

Stell dir vor, in deinem Feed taucht ein Video auf: Ein bekannter Politiker kündigt darin scheinbar seinen Rücktritt an und beleidigt dabei die eigene Partei. Das Video ist scharf, die Stimme klingt echt, die Empörung in den Kommentaren kocht. Dein erster Impuls ist Teilen. Genau hier hältst du inne — denn die starke Gefühlsreaktion ist kein Zufall, sie ist das Verbreitungsmittel.

Jetzt prüfst du die Relationen statt der Oberfläche. Wo tauchte das Video zuerst auf? Die Spur führt zu einem sechs Tage alten Konto ohne Historie. Die Rückwärtssuche findet keine ältere Version, aber auch keine zweite Quelle. Berichtet eine einzige Redaktion unabhängig? Nein — alle Erwähnungen zitieren nur denselben Clip. Gibt es eine zweite Kamera, einen Anwesenden, eine Reaktion des offiziellen Kanals? Der offizielle Kanal zeigt den Politiker eine Stunde später bei einem ganz anderen Termin. Das Netzwerk um das angebliche Ereignis ist leer; jede Verbindung, die du zu aktivieren versuchst, führt im Kreis zum Clip zurück. Erst jetzt zoomst du ins Detail und findest die Bestätigung im Kleinen: Der Ohrring wechselt zwischen zwei Einstellungen die Form, und ein Schild im Hintergrund trägt Zeichen, die nur wie Schrift aussehen.

Dein Urteil stützt sich am Ende nicht auf ein einzelnes Indiz, sondern auf das Muster: eine Entität ohne echte Relationen ins behauptete Ereignis. Das Relationen-Modell ist dabei nur eine Linse — aber eine, die den Blick vom fälschbaren Bild auf das schwer fälschbare Netzwerk dahinter lenkt.

Schritt für Schritt

Halte inne, bevor du teilst. Löst das Video sofort Wut, Angst oder Triumph aus, ist genau das oft der Zweck — starke Gefühle beschleunigen die Verbreitung und schalten die Prüfung ab.
Suche die Erstquelle. Nutze die Rückwärts-Bildersuche, prüfe, wann und wo das Material zuerst auftauchte und wie alt das Konto ist, das es verbreitet. Eine einzige anonyme Quelle ist ein Warnsignal.
Aktiviere unabhängige Relationen. Berichten mehrere seriöse Redaktionen unabhängig? Gibt es weitere Aufnahmen desselben Moments, Aussagen Anwesender, Reaktionen offizieller Kanäle? Bleibt alles still, obwohl das Ereignis groß wäre, spricht das gegen die Echtheit.
Zoome auf die Details. Prüfe Hände, Zähne, Ohren, Brillen, Haaransatz, Schatten, Lippensynchronität und Text im Hintergrund. Artefakte sind Hinweise — ihr Fehlen ist aber keine Entwarnung.
Prüfe Provenienz-Signale und Faktenchecks. Sieh nach, ob die Datei Content Credentials (C2PA) trägt, und suche, ob Faktencheck-Redaktionen den Clip schon eingeordnet haben.
Gewichte das Gesamtbild. Je mehr echte Verbindungen ins Ereignis sich bestätigen lassen, desto belastbarer die Aufnahme. Führt alles im Kreis zum Clip zurück, teile nicht — auch Nicht-Teilen ist eine Entscheidung im Netzwerk.

Häufige Fragen

Gibt es eine App, die Deepfakes sicher erkennt?

Nein, keine App erkennt Deepfakes sicher. Detektoren liefern Wahrscheinlichkeiten, irren sich in beide Richtungen und veralten schnell, weil neue Generatoren gezielt darauf trainiert werden, sie zu täuschen. Nutze solche Tools höchstens als ein Indiz unter mehreren. Verlässlicher ist die Prüfung der Herkunft: Rückwärts-Bildersuche, Suche nach unabhängigen Quellen und der Blick auf Provenienz-Daten wie Content Credentials.

Was ist der Unterschied zwischen Deepfake und Cheapfake?

Ein Deepfake wird mit Deep Learning erzeugt oder verändert, etwa durch Gesichtertausch oder Stimmklonen. Ein Cheapfake kommt ohne KI aus: Ein echtes Video wird verlangsamt, beschnitten, falsch untertitelt oder in einen falschen Kontext gestellt. Cheapfakes sind viel häufiger, weil sie fast nichts kosten — und oft genauso wirksam. Die Prüfung ist dieselbe: Herkunft, Erstquelle und unabhängige Bestätigung des behaupteten Kontexts.

Woran erkenne ich KI-generierte Bilder an Details?

Typische Schwachstellen sind Hände und Finger, Zähne, Ohren und Schmuck, Brillenränder, Haaransätze sowie Text im Hintergrund, der nur wie Schrift aussieht. Auch Schatten, die nicht zur Lichtquelle passen, und aus dem Takt geratene Muster wie Fliesen oder Zäune verraten Generatoren. Beachte aber: Diese Fehler werden mit jeder Modellgeneration seltener. Ein Bild ohne sichtbare Artefakte kann trotzdem erzeugt sein — entscheidend bleibt die Herkunftsprüfung.

Sind Deepfakes illegal?

Das kommt auf die Nutzung und das Land an. Die Technik selbst ist nicht verboten — satirische oder künstlerische Nutzung ist vielerorts zulässig. Illegal wird es oft durch den Inhalt: Deepfakes können Persönlichkeitsrechte verletzen, als Verleumdung, Betrug oder Identitätsmissbrauch strafbar sein, und nicht einvernehmliche intime Deepfakes sind in immer mehr Ländern ausdrücklich verboten. In der EU verlangt der AI Act zudem, dass KI-erzeugte oder manipulierte Inhalte als solche gekennzeichnet werden.

Was sind Content Credentials und was bringt C2PA?

C2PA ist ein offener Standard einer Koalition aus Technik- und Medienunternehmen, Content Credentials sind seine bekannteste Umsetzung. Kameras und Bearbeitungsprogramme signieren dabei kryptografisch, woher eine Datei stammt und welche Bearbeitungsschritte sie durchlaufen hat. Diese Herkunftskette reist mit der Datei mit und lässt sich prüfen. Gültige Credentials sind ein starkes Echtheitssignal — fehlende sind aber kein Beweis für eine Fälschung, denn die meisten echten Aufnahmen tragen heute noch keine.

Wie schütze ich mich vor Deepfake-Anrufen mit geklonter Stimme?

Behandle die Stimme allein nicht mehr als Identitätsnachweis, denn wenige Sekunden Audiomaterial reichen heute zum Klonen. Wenn ein angeblicher Angehöriger oder Vorgesetzter am Telefon Geld oder Zugangsdaten fordert, beende das Gespräch und ruf die Person über die dir bekannte Nummer zurück. Vereinbare in Familie oder Team ein Codewort für Notfälle. Misstraue besonders künstlichem Zeitdruck — er soll genau die Rückfrage verhindern, die den Betrug auffliegen ließe.

Weiterdenken

Begriffe dazu: Entität, Relation, Die drei Zustände: leer, aktiv, passiv, Netzwerkebene, Zoom-in / Zoom-out

Zuletzt aktualisiert: 2026-07-02Quellen