Generative Künstliche Intelligenz
Kaum ein Thema nimmt in der öffentlichen Wahrnehmung und Berichterstattung derzeit einen derart breiten Raum ein. Dabei werden vor allem dort, wo die Vielzahl vorliegender Daten und Informationen die menschliche Wahrnehmungsfähigkeit an ihre Grenzen bringen, Anwendungen, die der Künstlichen Intelligenz (KI; AI – Artificial Intelligence) zugeordnet werden können, bereits eingesetzt. Beispiele hierfür sind das Gesundheitswesen, die Wettervorhersage, das Finanzwesen oder die Landwirtschaft. Hier soll die sogenannte „Generative Künstliche Intelligenz“ behandelt werden.
Die sogenannten Sprachmodelle (am bekanntesten dürfte ChatGPT sein) bieten mittlerweile für jeden nutzbare Möglichkeiten der Texterzeugung, vom einfachen Bericht, über ein Gedicht, eine Hausarbeit bis zum Quelltext eines Programms. Ähnlich verhält es sich bei der automatisierten Erstellung von Grafiken und Bildern. Neben dem teils eindeutig vorhandenen Nutzen solcher Anwendungen wurden jedoch bereits viele Missbrauchsmöglichkeiten offenbar, die selbst die Anbieter der erfolgreichsten KI-Systeme veranlassten, staatliche Regulierungen zu fordern.
Erklärungen, Beispiele und Übersichten
In diesem Beitrag geht es um grundsätzliche Aussagen, Erläuterungen und Empfehlungen, rund um das Thema „Generative Künstliche Intelligenz“. Alle Darstellungen und Aussagen richten sich an private Nutzer, vor allem solche, die sich erstmals mit diesem Thema befassen.
Prüfen Sie bei der Nutzung von Informationen die Sie aus Quellen im Internet gewonnen haben, die Aktualität und Glaubwürdigkeit der Aussagen und der Quellen. Insbesondere bei Gesundheitsthemen und rechtlichen Fragen, aber auch z. B. bei Bau- und Reparaturanleitungen ist besondere Vorsicht geboten, um mögliche Risiken für die Gesundheit oder Rechte von Ihnen und anderen zu vermeiden.
Systeme generativer KI können zweifellos sehr nützlich sein. Sie treffen ihre Aussagen jedoch nur mit einem bestimmten Maß an Wahrscheinlichkeit von Vollständigkeit, Aktualität und Richtigkeit. Systeme generativer KI halluzinieren zuweilen.
Geben Sie am besten keinerlei personenbezogene Daten in Systeme generativer KI ein und laden Sie bei Systemen, die eine Analyse oder Bearbeitung von Multimediainhalten erlauben, keine Bilder, Videos oder Stimmen von realen Personen hoch. Vor allem bei kostenloser Nutzung von KI-Systemen müssen Sie damit rechnen, dass diese Personendaten auch zum Training der KI verwendet werden können. Einige Betreiber versprechen, bei Nutzung der kostenpflichtigen Angebote keine derartige Weiterverarbeitung durchzuführen. Beachten Sie jedoch die Rechtslage in den jeweiligen Herkunftsländern und Ihre evtl. eingeschränkten Möglichkeiten zur rechtlichen Gegenwehr.
Unter dem Menüpunkt „Nachschlagen“ in der oberen Hauptmenüleiste finden Sie unter „Linksliste …“ eine Auswahl von Beispielen für seriöse Quellenangaben (Links), aber auch Hinweise zu Systemen Künstlicher Intelligenz, (KI-)Suchmaschinen sowie viele weitere Hinweise zum Nachlesen.
Außerdem erreichen Sie unter dem Menüpunkt „Nachschlagen“ ein Glossar mit kurzen Erklärungen zu den meisten in diesem Beitrag verwendeten Begriffen.
Nachfolgend finden sie Sie die Gliederung des gesamten Beitrags bzw. ein Inhaltsverzeichnis über das Sie einzelne Textabschnitte gezielt ansteuern können.
Einige Textteile sind zum Zwecke eines besseren Leseflusses erst durch Klicken oder Tippen in den Absatz, an den sich eine Linie und dieses Zeichen ▾ anschließt, sichtbar. Bitte beachten Sie an dieser Stelle den Hinweis zum Verzicht auf Werbung.
Zum Ausblenden klicken oder tippen Sie bitte auf den oben angezeigten Text.
Verzicht auf Werbung
In diesem Beitrag werden auch kostenpflichtige Produkte oder Dienstleistungen erwähnt und beschrieben. Dies dient ausschließlich der neutralen Information und Veranschaulichung des Themas. Der Fokus liegt auf der neutralen Wissensvermittlung zum Thema. Es handelt sich dabei nicht um Werbung oder Kaufempfehlungen für diese Angebote. Die Nennung von Produktnamen und Anbietern erfolgt lediglich beispielhaft und soll keine einseitige Bevorzugung suggerieren. Grundsätzlich werden auch Alternativangebote zur Abrundung erwähnt.
Eine sachliche Darstellung der Vor- und Nachteile der genannten Produkte/Dienstleistungen ist beabsichtigt, um den Lesern eine fundierte Informationsgrundlage zu bieten. Auf detaillierte Produktbeschreibungen oder Preisangaben, die über eine neutrale Beurteilung hinausgehen, wird verzichtet.
Es liegt weder eine geschäftliche Verbindung oder Interessenkonflikt mit den erwähnten Anbietern vor, noch findet eine Vergütung für die Erwähnung der Produkte statt. Die Informationen basieren auf eigener Recherche und Erfahrung.
Alle auf dieser Website genannten Produkt- und Firmennamen sind möglicherweise eingetragene Marken der jeweiligen Inhaber. Die Nennung erfolgt ohne Gewährleistung der freien Verwendbarkeit.
Sofern Sie den Eindruck haben, dass auf diesen Webseiten entgegen der vorstehenden Erklärung Werbung betrieben, diese oder eingetragene Marken oder Warenzeichen nicht korrekt gekennzeichnet werden, teilen Sie dies bitte über das Kontaktformular mit. Eine Prüfung der Hinweise und wird umgehend in die Wege geleitet.
Inhalt / Gliederung
- Was ist Generative Künstliche Intelligenz?
- Die wichtigsten Begriffe
- Unterschiede Suchmaschinen, KI-Suchmaschinen und KI-Chatbots
- Large Language Models – LLMs
- KI-Suchmaschinen
- KI-Bildgeneratoren
- Nutzung und Umgang mit Generativer KI
- Formulierung von Prompts
- Rechtliche Aspekte
- Schummeleien begegnen / Faktenchecks
- Sammlung von Quellen, Hinweisen usw.
Was ist Generative Künstliche Intelligenz?
Auf eine entsprechende Frage liefert ein bekanntes System generativer KI folgende Antwort:
Daten als Fundament
Das Fundament jeder generativen Künstlichen Intelligenz (KI) sind Daten. Ohne Daten kann eine KI nichts lernen oder produzieren. Je nachdem, worauf das System spezialisiert sein soll – ob es Texte schreibt, Bilder malt oder Musik komponiert – benötigt es eine große Menge an Beispieldaten. Diese Daten kommen aus vorhandenen Informationssammlungen (Büchern, Bildern, Audiodateien) und aus dem World Wide Web. Die KI analysiert diese Daten, erkennt Muster und lernt so, wie sie neue, ähnliche Inhalte erschaffen kann. Man kann sich das vorstellen wie einen Menschen, der aus tausenden Büchern oder Fotos lernt, um dann seine eigenen Werke zu erschaffen.
Neuronen und das neuronale Netz
Das Gehirn einer KI besteht aus einem sogenannten neuronalen Netz, das grob gesagt, vom menschlichen Gehirn inspiriert ist. Im Gehirn kommunizieren Nervenzellen (Neuronen) miteinander und verarbeiten Informationen – das neuronale Netz der KI funktioniert ähnlich. Es besteht aus vielen künstlichen „Neuronen“, die in Schichten angeordnet sind. Diese „Neuronen“ sind miteinander verbunden und geben Informationen von einer Schicht zur nächsten weiter. Durch diese Verbindungen lernt die KI, komplexe Zusammenhänge zu verstehen. Man könnte es so sehen: Jede Schicht erkennt etwas Detaillierteres, bis die KI schließlich das Gesamtbild erfasst.
Das Modell oder der Bauplan
Bevor das neuronale Netz arbeiten kann, braucht es eine Struktur, die vorgibt, wie diese künstlichen Neuronen zusammenarbeiten. Diese Struktur nennt man das Modell. Das Modell bestimmt, welche Art von Aufgaben die KI gut bewältigen kann, und welche nicht. In der generativen KI verwendet man oft große Sprachmodelle (LLMs, „Large Language Models“)) die besonders darauf ausgelegt sind, kreative Inhalte zu produzieren. Eines der wichtigsten Modelle, das in LLMs häufig verwendet wird, ist das Transformer-Modell. Dieses Modell ist besonders leistungsfähig, da es große Mengen an Informationen gleichzeitig verarbeiten kann. Es ermöglicht der KI, ganze Sätze oder sogar Absätze im Kontext zu verstehen, anstatt nur Wort für Wort, und stärkt ihre Fähigkeit, neue, zusammenhängende Inhalte zu erzeugen.
Das Training der KI
Die Lernphase der KI ist entscheidend. In dieser Phase wird das neuronale Netz darauf trainiert, aus den bereitgestellten Daten Muster zu erkennen und darauf basierend neue Inhalte zu erstellen. Dieser Prozess erfordert eine Menge Rechenleistung und kann lange dauern. Die KI wird mit vielen Beispielen „gefüttert“ und verbessert sich mit jeder Runde, indem sie ihre Fehler korrigiert. Man kann sich das vorstellen wie einen Schüler, der eine neue Sprache lernt: Anfangs macht er viele Fehler, aber mit jeder Korrektur wird er besser und flüssiger.
Generierung von neuen Inhalten
Nach dem Training ist die KI in der Lage, neue Inhalte zu generieren. Das bedeutet, sie kann auf Basis des Gelernten etwas Neues erschaffen, das es vorher so nicht gab. Sie kann zum Beispiel einen Text schreiben, der völlig neu ist, aber im Stil der Texte, die sie zuvor gesehen hat. Das Gleiche gilt für Bilder oder Musik. Die KI „erfindet“ also nicht einfach etwas, sondern nutzt das, was sie gelernt hat, um kreative, neue Inhalte zu erzeugen. Der entscheidende Unterschied ist, dass sie nicht kopiert, sondern neu interpretiert.
Feinabstimmung durch Rückmeldung
Sobald die KI einmal gelernt hat, hört der Prozess nicht auf. Die KI kann weiterhin durch Rückmeldungen verbessert werden. Das bedeutet, dass Menschen die Ergebnisse der KI überprüfen, korrigieren und das Modell so weiter verfeinern. Durch diesen Feedback-Prozess lernt die KI, noch präzisere und passendere Inhalte zu produzieren. Das kann besonders wichtig sein, wenn die KI für spezifische Aufgaben genutzt wird, wie zum Beispiel das Schreiben von Nachrichtenartikeln oder die Erstellung von Kunstwerken. Dieser Lernprozess bleibt also dynamisch und kann immer wieder optimiert werden.
Zusammenfassung
Zusammengefasst besteht der Aufbau eines generativen KI-Systems aus mehreren Schritten: Erst werden große Mengen an Daten gesammelt, um der KI eine Basis zu geben. Dann wird ein neuronales Netz, ähnlich einem Gehirn, so gestaltet, dass es die Daten verarbeiten kann. Das Modell bestimmt, wie diese Verbindungen arbeiten, und durch ein intensives Training lernt die KI, Muster zu erkennen und neue Inhalte zu erzeugen. Schließlich kann das System durch Rückmeldungen weiter verbessert werden, um seine Ergebnisse noch präziser zu machen.
Generative KI ist somit ein Werkzeug, das kreative Prozesse simulieren kann, indem es auf das Wissen zurückgreift, das es aus der Analyse großer Datenmengen erlangt hat.
Die wichtigsten Begriffe in Zusammenhang mit Systemen Generativer Künstlicher Intelligenz
Blenden Sie die Erläuterungen bei Bedarf durch Klick / Tipp ein.
Generative Künstliche Intelligenz (KI)
Generative Künstliche Intelligenz bezeichnet KI-Systeme, die in der Lage sind, neue Inhalte zu erschaffen. Das können Texte, Bilder, Musik oder sogar Videos sein, die auf der Grundlage von erlernten Mustern erstellt werden. Anders als traditionelle KI, die nur vorhandene Daten analysiert, schafft generative KI völlig neue Inhalte, die so noch nicht existierten. Sie nutzt dazu große Datenmengen, um Muster zu erkennen und daraus neue, kreative Ergebnisse zu erzeugen. Ein Beispiel ist eine KI, die aus vielen gelesenen Texten selbst einen neuen Artikel schreibt.
Algorithmus
Ein Algorithmus ist eine feste Abfolge von Anweisungen oder Regeln, die Schritt für Schritt ausgeführt werden, um eine Aufgabe zu lösen oder ein Problem zu bearbeiten. Im Gegensatz zur generativen KI, die flexibel auf Sprache und Muster reagiert und eigene Texte erzeugen kann, arbeitet ein Algorithmus regelbasiert: Er folgt festgelegten Anweisungen ohne Abweichungen. Das bedeutet, dass ein Algorithmus immer dieselbe Ausgabe liefert, wenn er mit den gleichen Eingaben konfrontiert wird. Während generative KI durch große Datenmengen lernt und kreativ neue Inhalte erstellt, bleibt ein Algorithmus strikt bei den vordefinierten Regeln, die ihm zu Beginn einprogrammiert wurden.
ChatBot
Ein Chatbot im Zusammenhang mit generativer KI ist ein System, das natürliche Sprache versteht und eigenständig Antworten oder Texte generiert, um auf Anfragen zu reagieren. Es ist darauf ausgelegt, menschliche Konversationen zu simulieren und kann auf vielfältige Themen und Fragen eingehen, basierend auf vortrainierten Wissensdaten und Algorithmen. Chatbots wie ChatGPT nutzen dabei große Sprachmodelle, um flexibel auf Kontext und Nuancen in der Sprache zu reagieren, sodass die Interaktion möglichst „menschlich“ wirkt.
KI-Chatbots können komplexe Dialoge führen und kreative Antworten generieren. Dies steht im Gegensatz zu regelbasierten Chatbots, die nur einfache, vordefinierte Antworten liefern. Diese werden häufig im Kundenservice, Bildungs- und Unterhaltungsplattformen sowie als sog. „persönliche Assistenten“ eingesetzt.
GPT
GPT steht für „Generative Pre-trained Transformer“. Es ist ein Sprachmodell, das darauf spezialisiert ist, menschenähnliche Texte zu erzeugen. „Generative“ bedeutet, dass es neue Inhalte auf Basis von Eingaben erzeugen kann, „Pre-trained“ heißt, dass es auf riesigen Datenmengen vortrainiert wurde, bevor es in spezifischen Anwendungen genutzt wird. Der „Transformer“ ist eine spezielle Architektur, die besonders gut darin ist, Zusammenhänge in Texten zu verstehen und längere Inhalte effizient zu verarbeiten. GPT wird verwendet für Aufgaben wie Textgenerierung, Übersetzungen und Dialogsysteme.
Neuronales Netz
Ein neuronales Netz ist das Herzstück vieler KI-Systeme. Es ist inspiriert vom menschlichen Gehirn und besteht aus vielen kleinen „Neuronen“, die Informationen verarbeiten. Diese Neuronen sind in Schichten organisiert und arbeiten zusammen, um Daten zu analysieren und Muster zu erkennen. Ein neuronales Netz lernt durch Wiederholungen und Anpassungen und kann so immer bessere Ergebnisse liefern. Es ist der Mechanismus, der die Intelligenz der KI ausmacht. Die neuronalen Netze entstehen jedoch bereits vor dem eigentlichen Training, also bevor der Deep-Learning-Prozess beginnt. Sie sind ein Kernbestandteil der Modellarchitektur, die festgelegt wird, bevor das Training startet.
Der Entstehungsprozess kann wie folgt beschrieben werden:
Definition des Modells (Bauplan des neuronalen Netzes)
Bevor das neuronale Netz trainiert wird, müssen die Struktur und Architektur des Netzes festgelegt werden. Das bedeutet, man entscheidet, wie viele Neuronen (Knotenpunkte) es gibt, wie viele Schichten das Netz haben soll (zum Beispiel Eingabeschicht, versteckte Schichten, Ausgabeschicht), und wie die Neuronen miteinander verbunden sind. Diese Struktur wird auch als Modellarchitektur bezeichnet. Es gibt verschiedene Arten von neuronalen Netzwerken, wie Feedforward-Netze (Informationen fließen in eine Richtung) oder rekurrente neuronale Netze (Informationen können zurückfließen).
Bei einem Sprachmodell wie GPT werden die Neuronen so angeordnet, dass sie besonders gut in der Verarbeitung und Erzeugung von Texten sind. Bei einem Bildmodell wie DALL·E wird ein konvolutionales neuronales Netz (CNN) verwendet, das speziell dafür entwickelt wurde, visuelle Muster in Bildern zu erkennen.
Erstellung des neuronalen Netzes (vor dem Training)
Sobald das Modell definiert ist, wird das neuronale Netz physisch im Speicher der KI-Systeme aufgebaut. In der Praxis bedeutet das, dass der Computer die Neuronen und ihre Verbindungen im System erstellt und vorbereitet. Diese Netzwerke bestehen aus mathematischen Funktionen, die Informationen durch Gewichte und Verbindungen zwischen den Neuronen leiten. Zu diesem Zeitpunkt sind die Gewichte und Parameter des Netzes noch zufällig oder auf Anfangswerte gesetzt.
In einem neuronalen Netz sind Gewichte die Parameter, die bestimmen, wie stark ein Eingangssignal in einem Neuron weitergegeben wird. Man kann sie sich wie Stellschrauben vorstellen, die entscheiden, wie wichtig eine bestimmte Information für das Ergebnis ist. Jedes Neuron im Netz hat Verbindungen zu anderen Neuronen, und jede dieser Verbindungen hat ein Gewicht. Während des Trainingsprozesses (z. B. im Deep Learning) passt das Netzwerk diese Gewichte an, um aus Fehlern zu lernen und bessere Vorhersagen oder Entscheidungen zu treffen. Je höher das Gewicht, desto stärker beeinflusst das jeweilige Eingangssignal das Ergebnis.
Training des neuronalen Netzes (Deep Learning)
Nachdem das neuronale Netz erstellt wurde, beginnt der Trainingsprozess, in dem die KI mithilfe von Deep Learning lernt. D.h., beim Training durchläuft das Netz wiederholt die Daten, passt die Verbindungen und Gewichte zwischen den Neuronen an und verbessert seine Fähigkeit, Muster zu erkennen und Vorhersagen zu treffen. In dieser Phase werden die Gewichte der Verbindungen zwischen den Neuronen durch einen Optimierungsprozess (zum Beispiel den Backpropagation-Algorithmus) immer wieder angepasst, um die Fehler zu minimieren.
- Bei einem Sprachmodell lernt das neuronale Netz, wie Wörter und Sätze zusammenhängen.
- Bei einem Bildmodell lernt das Netz, wie verschiedene Merkmale eines Bildes (Farben, Kanten, Formen) interpretiert werden können.
Der Backpropagation-Algorithmus (kurz für Backpropagation of Errors) ist ein zentraler Lernmechanismus in neuronalen Netzen. Er wird verwendet, um die Gewichte der Verbindungen zwischen den Neuronen während des Trainings anzupassen. Er funktioniert so:
- Zunächst wird eine Eingabe durch das neuronale Netz geleitet, und das Netz berechnet eine Ausgabe.
- Diese Ausgabe wird mit dem tatsächlichen Ergebnis verglichen, und der Fehler (die Differenz) wird ermittelt.
- Backpropagation bedeutet, dass dieser Fehler rückwärts durch das Netzwerk propagiert wird, um zu bestimmen, wie stark jedes Neuron und seine Verbindungen zum Fehler beigetragen haben.
- Anschließend werden die Gewichte angepasst, um den Fehler beim nächsten Durchlauf zu verringern.
- Dieser Prozess wird wiederholt, bis das Netzwerk lernt, die bestmöglichen Vorhersagen zu treffen.
Backpropagation ist also der Mechanismus, mit dem das Netzwerk lernt, indem es Fehler korrigiert.
Anwendung des trainierten neuronalen Netzes
Nach dem Training kann das neuronale Netz verwendet werden, um neue Inhalte zu generieren oder Aufgaben zu lösen. Es verarbeitet neue Eingabedaten, wendet die gelernten Muster an und erzeugt Ergebnisse basierend auf dem Training. Das neuronale Netz bleibt während der Anwendung bestehen und kann je nach Bedarf weiter verfeinert werden.
Die neuronalen Netze entstehen vor dem eigentlichen Training, während die Modellarchitektur festgelegt wird. Sie werden zu Beginn erstellt, aber ihre Leistungsfähigkeit entsteht erst durch das Training mit Deep Learning, bei dem die Verbindungen und Gewichte zwischen den Neuronen optimiert werden.
Datenmodell
Ein Datenmodell ist eine Struktur, die bestimmt, wie eine KI mit Informationen arbeitet. Es ist sozusagen der „Bauplan“ der KI, der festlegt, wie die Daten verarbeitet werden, um aus Mustern neue Inhalte zu erzeugen. Bei einem Datenmodell geht es darum, wie bestimmte Eingaben in sinnvolle Ausgaben umgewandelt werden. Beispielsweise wird bei einem Textmodell festgelegt, wie die KI aus einem bestimmten Satz neue, passende Wörter oder Sätze generieren kann. Ohne ein gut entwickeltes Datenmodell kann die KI nicht effektiv arbeiten.
Daten- und andere Modelle werden vor dem späteren Training festgelegt. Sie definieren die Architektur der KI, also wie die Eingabedaten verarbeitet werden sollen. Das Modell bestimmt zum Beispiel, welche Art von Eingaben es akzeptiert (Text, Bilder etc.) und wie die verschiedenen Schichten des neuronalen Netzes miteinander interagieren. Bei einem Sprachmodell wie GPT wird beispielsweise festgelegt, wie die KI auf der Grundlage von Wörtern und Sätzen Zusammenhänge erkennt. Das Modell ist der Bauplan, nach dem die KI arbeitet.
Sprachmodell
Ein Sprachmodell ist eine spezielle Form der generativen KI, die darauf trainiert ist, Texte zu verstehen und zu erstellen. Es wird mit riesigen Mengen an Texten trainiert, um die Regeln und Muster der Sprache zu erlernen. So kann es neue Texte schreiben, die sich wie von einem Menschen verfasst lesen. Sprachmodelle werden zum Beispiel für Chatbots, automatische Übersetzungen oder Textvorschläge in E-Mails eingesetzt. Das bekannteste Sprachmodell ist GPT, das auch bei ChatGPT verwendet wird.
Large Language Model – LLM
Ein LLM steht für „Large Language Model“ (großes Sprachmodell) und bezeichnet ein künstliches neuronales Netzwerk, das speziell dafür entwickelt wurde, natürliche Sprache zu verstehen, zu generieren und darauf zu reagieren. Diese Modelle sind oft extrem groß und werden auf riesigen Textmengen trainiert, um Muster, Zusammenhänge und Bedeutungen von Wörtern und Sätzen zu erlernen. Sie basieren in der Regel auf tiefen neuronalen Netzen, insbesondere auf Architekturen wie dem Transformer-Modell.
Ein LLM kann Aufgaben wie Textgenerierung, Übersetzungen, Zusammenfassungen, Beantwortung von Fragen und sogar kreative Schreibaufgaben übernehmen. Beispiele für LLMs sind GPT-3 und GPT-4 von OpenAI, BERT von Google oder LLaMA von Meta Platform, Inc.
Modell für Bilder und Multimedia
Das Pendant zum Sprachmodell für Bilder und Multimedia-Inhalte ist ein Bildmodell oder ein Multimedia-Modell. Diese Modelle sind darauf trainiert, Bilder, Grafiken oder Videos zu erstellen, basierend auf gelernten Mustern. Ein Beispiel ist DALL·E, das Bilder auf Basis von Texteingaben erzeugen kann. Die KI hat viele Bilder analysiert und gelernt, wie sie auf Grundlage von Beschreibungen neue visuelle Inhalte kreieren kann. Solche Modelle kommen in der Kunst, im Design oder auch in der Filmproduktion zum Einsatz.
Maschinenlernen
Maschinenlernen ist der Prozess, bei dem eine KI durch die Analyse von Daten lernt, ohne dass sie explizit programmiert wird. Das bedeutet, die KI erkennt Muster in den Daten und verwendet diese, um zukünftige Entscheidungen oder Vorhersagen zu treffen. Zum Beispiel kann eine KI, die viele Bilder von Hunden gesehen hat, lernen, einen Hund auf einem neuen Bild zu erkennen. Maschinenlernen ist der grundlegende Baustein, auf dem generative KI aufbaut.
Deep Learning
Deep Learning ist eine spezielle Form des Maschinenlernens, bei der besonders komplexe neuronale Netze verwendet werden, um tiefere Muster und Zusammenhänge zu erkennen. Es ermöglicht KI-Systemen, sehr detaillierte und spezifische Aufgaben zu bewältigen, wie etwa das Erkennen von Gesichtern oder das Schreiben komplexer Texte. Durch viele Schichten von Neuronen kann Deep Learning sehr genau arbeiten und auch mit unstrukturierten Daten wie Bildern, Videos oder Texten umgehen. Es ist die Technologie, die hinter vielen modernen KI-Anwendungen steht.
Training
Das Training ist der Prozess, bei dem eine KI anhand von Daten lernt, Aufgaben zu erledigen. Dabei wird das neuronale Netz immer wieder mit neuen Daten „gefüttert“ und angepasst, um die bestmöglichen Ergebnisse zu erzielen. Im Training lernt die KI, Fehler zu erkennen und sich zu verbessern, ähnlich wie ein Schüler, der durch Übung immer besser wird. Dieser Schritt ist entscheidend dafür, wie gut die KI später in der Lage ist, neue Inhalte zu generieren. Das Training kann sehr rechenintensiv sein und dauert oft lange.
Natural Language Processing – NLP
Natural Language Processing (NLP) ist ein Teilgebiet der generativen KI, das darauf abzielt, menschliche Sprache zu verstehen, zu verarbeiten und zu generieren. Es ermöglicht Systemen, Texte und Sprache so zu interpretieren, dass sie natürliche, sinnvolle Antworten oder Inhalte produzieren können. Zu den Aufgaben von NLP gehören das Erkennen von Bedeutungen, das Erstellen von Texten, das Übersetzen von Sprachen sowie das Beantworten komplexer Fragen. Generative KI-Modelle wie ChatGPT nutzen NLP, um auf Basis großer Datenmengen menschlich klingende Texte zu erzeugen. NLP ist entscheidend dafür, dass KI-Systeme flüssige und kontextbezogene Interaktionen mit Nutzern führen können.
Reasoning
In der KI bezeichnet „Reasoning“ die Fähigkeit eines Systems, logische Schlussfolgerungen zu ziehen und eigenständig Probleme zu lösen. Es geht dabei nicht nur um das Abrufen von Informationen, sondern um das Analysieren und Verstehen von Zusammenhängen. Zum Beispiel kann eine KI aus allgemeinen Regeln spezielle Fälle ableiten (deduktives Reasoning) oder aus mehreren Beobachtungen allgemeine Regeln entwickeln (induktives Reasoning). Außerdem kann die KI nach der plausibelsten Erklärung für ein beobachtetes Ereignis suchen (abduktives Reasoning). Reasoning ist wichtig, damit KI-Systeme komplexe Aufgaben meistern und flexibel auf neue Situationen reagieren können.
Inference (Generierung)
Inference ist der Moment, in dem die KI auf Grundlage dessen, was sie gelernt hat, neue Inhalte erstellt. Dies passiert, nachdem die KI trainiert wurde. Zum Beispiel gibt man einer Sprach-KI eine Textzeile und sie antwortet, indem sie eine neue Antwort generiert. Bei einem Bildmodell gibt man eine Beschreibung ein und die KI malt ein neues Bild. Inference ist das Ergebnis des gesamten Lernprozesses und zeigt, was die KI auf Basis ihres Trainings leisten kann.
Prompt
Im allgemeinen Wortsinne bedeutet „Prompt“ eine schnelle oder unverzügliche Aufforderung oder eine Erinnerung, eine bestimmte Handlung oder Reaktion auszuführen. In der Computertechnik wird der Begriff häufig im Zusammenhang mit Eingabeaufforderungen verwendet, z. B. im „Command Prompt“ (Kommandozeile), bei dem Nutzer durch einen blinkenden Cursor dazu aufgefordert werden, Befehle einzugeben, um eine Interaktion mit dem Computersystem zu initiieren.
In der generativen Künstlichen Intelligenz bezeichnet ein „Prompt“ die Eingabe oder Anweisung, die der Nutzer einem KI-Modell gibt, um eine spezifische Ausgabe zu erzeugen. Ein Prompt besteht aus einer kurzen Beschreibung oder Frage, auf die das KI-Modell mit einer Text-, Bild-, Audio- oder Code-Generierung reagiert. Je präziser und klarer ein Prompt formuliert ist, desto genauer und relevanter wird die Antwort des KI-Systems sein. Beispielsweise könnte ein Nutzer einen Text-Prompt eingeben, um eine Geschichte zu generieren, oder einen visuellen Prompt, um ein Bild zu erstellen.
Unterschiede zwischen traditionellen Suchmaschinen, KI-Suchmaschinen und KI-Chatbots
Traditionelle Suchmaschinen wie SearXNG, MetaGer, Startpage, DuckDuckGo, Brave Search oder Qwant (ja, Google und Bing gibt es natürlich auch noch; Erläuterungen dazu gibt es hier) durchsuchen das Internet und geben als Ergebnis eine Liste von Webseiten zurück, die am besten zu einer Anfrage passen. Sie arbeiten auf Basis von Indexen und Algorithmen, die anhand von Schlüsselwörtern, Relevanz und Popularität entscheiden, welche Links angezeigt werden. Der Nutzer klickt dann auf die Links und sucht eigenständig nach der gewünschten Information.
KI-Suchmaschinen wie „Perplexity“ oder „you.com“ kombinieren maschinelles Lernen und Natural Language Processing (Natural Language Processing – NLP ist ein Teilgebiet der generativen KI, das darauf abzielt, menschliche Sprache zu verstehen, zu verarbeiten und zu generieren), um Suchanfragen besser zu verstehen und kurze, prägnante Antworten zu formulieren, oft direkt auf der Seite. Diese Systeme versuchen, nicht nur Webseiten zu verlinken, sondern auch sofort relevante Inhalte zusammenzufassen, basierend auf verifizierten Quellen.
Systeme generativer KI, wie ChatGPT oder Claude (häufig als „KI-Chatbots“ bezeichnet), generieren eigene Texte und Inhalte aus einem umfassenden, meist vortrainierten Wissensmodell. Sie greifen nicht auf das aktuelle Internet zu, sondern nutzen gespeicherte Daten und ihr Verständnis natürlicher Sprache, um detaillierte, personalisierte Antworten zu formulieren, oft in einem dialogorientierten Format. Im Gegensatz zu Suchmaschinen bieten sie keine direkten Links zu Quellen und sind nicht immer auf aktuelle Informationen abgestimmt, können aber sehr spezifische und kontextbezogene Antworten geben, da sie Sprache flexibel verarbeiten.
Chatbots können ähnlich KI-Suchmaschinen genutzt werden, wenn sie in einer Anfrage konkret beauftragt werden, den aktuellen Sachstand zu berücksichtigen („wie ist der aktuelle Stand hinsichtlich xyz“, oder „wie ist der Sachstand hinsichtlich xyz im Oktober 2024“) und die Quellen („nenne die Quellen einschließlich der Links“) anzugeben
Die bekanntesten, für private Nutzer zugänglichen Large Language Models – LLMs
(Stand 6. Oktober 2024 – Bitte beachten Sie, dass es bei den Angeboten immer wieder kurzfristige Änderungen seitens der Anbieter gibt)
GPT-4 von OpenAI
GPT-4 ist die aktuellste Version der GPT-Reihe und ein äußerst fortschrittliches Sprachmodell. Es wurde auf einer großen Menge an Textdaten trainiert und ist in der Lage, menschenähnliche Texte zu generieren, komplexe Fragen zu beantworten und kreative Aufgaben wie das Schreiben von Gedichten oder Artikeln zu übernehmen. Es bietet auch erweiterte Fähigkeiten in Codierung und multimodaler Verarbeitung (Text, Bild, Audio).
GPT-4 ist über die ChatGPT-Anwendung und OpenAIs API für private Nutzer zugänglich. Die kostenpflichtige Version (ChatGPT Plus) ermöglicht den Zugriff auf GPT-4, während die kostenlose Version GPT-4o mini verwendet.
GPT-4 kann zur Textgenerierung, Übersetzungen, Codierung, kreative Schreibaufgaben, Recherche, multimodale Aufgaben.
Es sind weitere GPT-Modelle verfügbar (Stand Oktober 2024).
Im Oktober 2024 bietet OpenAI mehrere Versionen von GPT-Modellen an, die sich in ihrer Leistung, ihrem Kontextfenster und ihren Einsatzmöglichkeiten unterscheiden. Die wichtigsten Unterschiede zwischen den Modellen bestehen in ihrer Größe, Geschwindigkeit und der Multimodalität. Hier sind die derzeit verfügbaren Modelle, einschließlich der neueren Versionen wie GPT-4o und GPT-o1:
GPT-4o („omni“)
GPT-4o ist eine verbesserte, multimodale Version von GPT-4, die in mehreren Modalitäten (Text, Audio, Bild, Video) arbeiten kann. Es bietet ähnliche Leistung wie GPT-4 Turbo, aber mit einer besseren Verarbeitung von nicht-textbasierten Inputs. GPT-4o zeichnet sich durch eine besonders schnelle Reaktionszeit (232–320 Millisekunden) aus, was es für interaktive Aufgaben ideal macht. Es besitzt ebenfalls ein großes Kontextfenster von 128.000 Tokens.
GPT-4o ist über die OpenAI-Plattform für Nutzer zugänglich, sowohl in der ChatGPT-Anwendung als auch über die API, mit einer ähnlichen Preisstruktur wie GPT-4.
GPT-4o kann zur multimodalen Verarbeitung, Echtzeit-Interaktionen, Textgenerierung, Bild- und Videobearbeitung genutzt werden.
GPT-o1
GPT-o1 ist eine neuere Version, die im Oktober 2024 veröffentlicht wurde, jedoch aktuell (Anfang Oktober 2024) nur in einer Vorversion eingeschränkt nutzbar ist. GPT-o1 ist für Allzweck-Anwendungen konzipiert und bietet eine hohe Effizienz in Textverarbeitung, Codierung und multimodalen Aufgaben. Das Modell ist besonders darauf ausgelegt, schneller und kostengünstiger als GPT-4o zu arbeiten, während es ähnliche Aufgaben ausführt. GPT-o1 bietet ein großes Kontextfenster und kann in mehreren Modalitäten (Text, Bild, Audio) arbeiten.
GPT-o1 soll später über die API und als kostenpflichtige Version in ChatGPT verfügbar, ähnlich wie GPT-4 und GPT-4o, jedoch mit einer verbesserten Kosteneffizienz, nutzbar sein.
GPT-o1 kann zur Textverarbeitung, für multimodale Anwendungen, Echtzeit-Interaktionen oder die Codierung genutzt werden.
GPT-4o Mini
GPT-4o Mini ist eine verkleinerte Version des GPT-4o-Modells, das speziell entwickelt wurde, um auf Geräten mit begrenzter Rechenleistung zu laufen. Es bietet eine abgespeckte Version der Fähigkeiten von GPT-4o, behält jedoch die Multimodalität bei. GPT-4o Mini eignet sich für Anwendungen, die schnelle Ergebnisse in Echtzeit erfordern, aber weniger Rechenressourcen beanspruchen.
GPT-4o Mini ist für Entwickler und Unternehmen über die OpenAI API verfügbar, die eine kostengünstigere und schnellere Lösung für multimodale Aufgaben benötigen.
GPT-4o Mini ist für die leichtgewichtige multimodale Verarbeitung und Echtzeit-Interaktionen auf mobilen und eingebetteten Systemen gedacht.
GPT-3.5
GPT-3.5 ist eine ältere, aber immer noch weit verbreitete Version, die für viele Alltagsaufgaben hervorragend geeignet ist. Es bietet schnelle und effiziente Textgenerierung und ist in der kostenlosen Version von ChatGPT verfügbar. Allerdings hat es ein kleineres Kontextfenster und ist in seiner Leistung eingeschränkter im Vergleich zu GPT-4 und GPT-4o.
GPT-3.5 ist kostenlos über die ChatGPT-Anwendung zugänglich und bietet eine solide Basis für viele Standardanwendungen, wie z. B. kreative Aufgaben und einfache Textgenerierung.
GPT-3.5 kann für Textgenerierung, einfache Codierung bzw. alltägliche Aufgaben genutzt werden.
Die Unterschiede zwischen den Modellen bestehen hauptsächlich in der Größe des Kontextfensters, der Verarbeitungsgeschwindigkeit, der Multimodalität und der Kosteneffizienz. GPT-4o und GPT-o1 bieten dabei fortschrittlichere Funktionen für Benutzer, die multimodale Inhalte und schnelle Reaktionen benötigen.
Google Gemini 1.5 Pro
Gemini 1.5 Pro ist Teil der neuen Gemini-Familie von Google und stellt einen Fortschritt in Bezug auf Geschwindigkeit und Genauigkeit dar. Dieses Modell verfügt über ein großes Kontextfenster von bis zu 1 Million Tokens, wodurch es besonders gut für komplexe, mehrstufige Aufgaben geeignet ist, wie etwa in Mathematik oder bei längeren Texten. Es verarbeitet multimodale Eingaben (Text, Bild, Audio) und ist stark in Sprachverarbeitung und Übersetzungen.
Die Basisversion von Gemini erfordert zwar eine Registrierung / Anmeldung ist aber kostenlos zugänglich, während leistungsstärkere Versionen (Gemini Pro) über kostenpflichtige Abonnements verfügbar sind.
Google Gemini kann für Chats, komplexe Problemlösungen, Mathematik, Textgenerierung, Übersetzungen oder Sprachverarbeitung genutzt werden.
Claude 3 von Anthropic
Claude 3 von Anthropic wirbt mit hohen ethischen Standards und seinen Fähigkeiten im Umgang mit komplexen Textaufgaben. Das Modell zeigt in mehreren Test gute Ergebnisse, insbesondere bei der Textgenerierung, hinsichtlich Sicherheitsfunktionen zur Vermeidung von Verzerrungen, der Verarbeitung großer Datenmenge und der Sprachverständnisleistung in mehreren Sprachen.
Claude 3 ist für private Nutzer nach Registrierung / Anmeldung kostenlos verfügbar, jedoch gibt es auch kostenpflichtige Versionen mit erweiterten Fähigkeiten.
Claude 3 kann für Textgenerierung, ethische und sichere KI-Anwendungen, mehrsprachige Aufgaben, komplexe Problemlösungen.
Llama 3.1 von Meta Platform, Inc.
Llama 3.1 ist die neueste Version der Llama-Familie von Meta und bietet verbesserte Leistungen in der Sprachverarbeitung und bei Codierungsaufgaben. Llama gehört zu den größten öffentlich zugänglichen Modellen.
Llama 3.1 ist als Open-Source-Modell verfügbar und richtet sich besonders an Entwickler, die offene und anpassbare Lösungen bevorzugen.
Llama 3.1 kann multimodale Aufgaben (Text, Bild, Audio) bewältigen und verfügt über ein großes Kontextfenster für umfangreiche Texteingaben.
KI-Suchmaschinen
(Stand 6. Oktober 2024 – Bitte beachten Sie, dass es bei den Angeboten immer wieder kurzfristige Änderungen seitens der Anbieter gibt)
KI-Suchmaschinen verändern die Art und Weise, wie Informationen durchsucht und genutzt werden, indem sie nicht nur traditionelle Suchergebnisse, wie Links zu Webseiten, bereitstellen, sondern auch kontextbasierte, detaillierte Antworten generieren. Dabei berücksichtigen sie die spezifischen Bedürfnisse der Nutzer, verstehen die Semantik (Bedeutung von Wörtern und Sätzen im Kontext) hinter den Suchbegriffen und liefern direkt relevante Informationen. Anstatt nur eine Liste von Webseiten zu bieten, führen sie Informationen aus verschiedenen Quellen zusammen, analysieren sie tiefer und präsentieren die Ergebnisse in einem konversationsähnlichen Format. Dies ermöglicht auch interaktive Rückfragen und eine engere Anpassung an die Absichten des Nutzers, wodurch der gesamte Suchprozess deutlich effektiver wird.
Im Oktober 2024 sind mehrere KI-gestützte Suchmaschinen für private Nutzer verfügbar, die traditionelle Suchmaschinen durch den Einsatz von generativer KI erheblich erweitert haben. Hier sind die bekanntesten:
Perplexity AI
Perplexity AI nutzt eine Kombination aus OpenAIs Sprachmodell ChatGPT und Anthropics Claude 3, um präzise und kontextbezogene Antworten auf komplexe Fragen zu liefern. Sie bietet auch Funktionen wie die Analyse von Dokumenten und eine „Copilot“-Funktion, die Nutzern bei der Navigation durch Suchergebnisse hilft.
Google Gemini
Google hat seine Suchmaschine umfassend mit generativer KI durch das Gemini-Modell erweitert. Dies ermöglicht multimodale Suchen, bei denen sowohl Text, Bilder, als auch Videos verarbeitet werden. Durch die tiefe Integration mit anderen Google-Diensten wie Gmail und Google Docs ist es besonders nützlich für Nutzer, die verschiedene Arten von Inhalten durchsuchen und bearbeiten möchten. Die Basisversion von Gemini erfordert zwar eine Registrierung / Anmeldung ist aber kostenlos zugänglich, während leistungsstärkere Versionen (Gemini Pro) über kostenpflichtige Abonnements verfügbar sind.
Microsoft Bing (mit ChatGPT-Integration)
Microsoft hat Bing mit den fortschrittlichen KI-Modellen von OpenAI, wie GPT-4, ausgestattet. Dies ermöglicht Suchanfragen in natürlicher Sprache, die nicht nur Antworten liefern, sondern auch interaktive und personalisierte Ergebnisse bieten. Zudem bietet Bing visuelle Suchmöglichkeiten, die auf Bildern basieren, sowie eine Integration mit Microsoft 365.
You.com
You.com bietet eine besonders personalisierte und kollaborative Suche. Es verwendet verschiedene KI-Modelle und erlaubt es Nutzern, ihre Suche individuell anzupassen. Zudem können Benutzer gemeinsam an Suchanfragen arbeiten. Sie bietet auch Werkzeuge wie einen Bildgenerator und einen Chatbot zur Unterstützung von kreativen Projekten.
Brave Search mit Leo AI
Brave ist für datenschutzbewusste Nutzer besonders interessant, da es keine Suchanfragen trackt. Die Integration von Leo AI bringt eine KI-basierte Assistentenfunktion, die private und personalisierte Suchen ermöglicht. Diese Plattform ist ideal für Nutzer, die Wert auf Datenschutz legen, ohne dabei auf leistungsstarke Suchergebnisse zu verzichten.
KI – Bildgeneratoren
Eine größere Übersicht über KI-Bildgeneratoren finden Sie hier (öffnet sich in einem weiteren Browser-Tab). Nachfolgend werden einige Anwendungen beispielhaft erwähnt.
Datenquellen und Urheberrechtsschutz
Es wird empfohlen, allen rechtlichen Auseinandersetzungen aus dem Weg zu gehen und eher Bilder und Grafiken aus seriösen Quellen zu nutzen. Kostenlose Bilder gibt z. B. bei Wikimedia Commons (beachten Sie aber auch hier die korrekte Angabe von Quellen und Urheberrechtsangaben) oder nutzen Sie kostenpflichtige Dienste.
Microsoft Designer
Microsoft Designer bietet eine benutzerfreundliche Plattform mit Vorlagen und KI-generierter Unterstützung, um den kreativen Prozess zu beschleunigen, und ist daher ideal für Anwender, die schnell professionelle Grafiken erstellen möchten.
Nutzer können Microsoft Designer kostenlos und ohne Registrierung verwenden, um eine bestimmte Anzahl von Bildern zu erstellen. Es ist besonders geeignet für die Erstellung von visuellen Inhalten für soziale Medien und Marketing. Für erweiterte Funktionen und mehr Bildgenerierungen ist jedoch eine Registrierung oder ein Microsoft 365-Abonnement erforderlich. Microsoft Designer ist stark in die Microsoft-365-Suite integriert und bietet eine Vielzahl von Designvorlagen sowie einfache Möglichkeiten, Bilder mit Texten oder anderen Medien zu kombinieren(
DALL·E 3 (OpenAI)
In der kostenlosen Version von ChatGPT können – jedoch nur nach einer Registrierung und Anmeldung – Text-zu-Bild-Generierungen mit begrenzten Funktionen durchgeführt werden. Der volle Zugang zu DALL·E 3 ist über das kostenpflichtige ChatGPT Plus verfügbar.
Bei Nutzung ohne Anmeldung wird lediglich ein Text-Prompt erstellt, der gegebenenfalls in einem anderen KI-Bildgenerator eingesetzt werden kann.
Craiyon (früher DALL·E mini)
Craiyon (früher DALL-E mini) bietet Unbegrenzte kostenlose Bildgenerierungen, auch ohne Anmeldung, allerdings ist die Qualität im Vergleich zu den großen Mitbewerbern geringer. Craiyon ist ideal für einfache und schnelle Experimente mit Text-zu-Bild-Generierung.
Midjourney
Midjourney bietet derzeit eine kostenlose Testversion an, die es neuen Nutzern ermöglicht, eine begrenzte Anzahl von Bildern zu generieren. Diese Testversion umfasst 25 kostenlose Bilder. Nach Verbrauch dieser Bilder müssen Sie auf einen kostenpflichtigen Plan umsteigen, um weiterhin Zugang zu den Funktionen zu erhalten.
Um Midjourney nutzen zu können, benötigen Sie einen Discord-Account, da die Plattform über Discord betrieben wird. Die Registrierung bei Discord ist kostenlos und ermöglicht es Ihnen, sich mit dem Midjourney-Bot zu verbinden.
Es ist wichtig zu beachten, dass die Nutzung der kostenlosen Testversion öffentlich ist. Das bedeutet, dass die Bilder, die Sie generieren, von anderen Nutzern eingesehen werden können. Dies könnte für einige Nutzer ein Datenschutzproblem darstellen.
Adobe Firefly
Adobe Firefly kann nach Erstellen eines kostenlosen Adobe Accounts kostenlos genutzt werden. Mit einem kostenlosen Adobe Account erhalten Sie 25 Generative Credits pro Monat, was der Erstellung von 25 Bildern entspricht. Diese Credits verfallen einen Monat nach der Zuteilung. Beachten Sie, dass Bilder, die mit der kostenlosen Version generiert werden, mit einem Wasserzeichen versehen sind. Firefly ist auch in verschiedenen Adobe-Programmen wie Photoshop und Illustrator integriert. Nutzer mit einem kostenlosen Account können diese Funktionen nutzen, jedoch könnten in Zukunft Einschränkungen hinsichtlich der Anzahl der generativen Aktionen pro Tag eingeführt werden
Nutzung und Umgang mit Systemen generativer KI
Schutz der Privatsphäre und Sicherheit
Geben Sie am besten keinerlei personenbezogene Daten in Systeme generativer KI ein und laden Sie bei Systemen, die eine Analyse oder Bearbeitung von Multimediainhalten erlauben, keine Bilder, Videos oder Stimmen von realen Personen hoch. Vor allem bei kostenloser Nutzung von KI-Systemen müssen Sie damit rechnen, dass diese Personendaten auch zum Training der KI verwendet werden können. Einige Betreiber versprechen, bei Nutzung der kostenpflichtigen Angebote keine derartige Weiterverarbeitung durchzuführen. Beachten Sie jedoch die Rechtslage in den jeweiligen Herkunftsländern und Ihre evtl. eingeschränkten Möglichkeiten zur rechtlichen Gegenwehr.
Benutzeroberfläche
Die folgenden Beschreibungen orientieren sich an ChatGPT. Die Nutzung anderer Systeme ist im Wesentlichen ähnlich.
- Chat-Fenster: Das zentrale Element der Benutzeroberfläche ist das Chat-Fenster. Hier geben Sie Fragen oder Anweisungen in ein Textfeld am unteren Rand ein, und ChatGPT antwortet im oberen Bereich.
- Menü: Je nach Version (z. B. Web-App oder App) gibt es ein Menü, in dem Sie Optionen wie Einstellungen, Anleitungen oder Abmelden finden.
- Einfache Bedienung: Das Design ist minimalistisch gehalten, um es intuitiv zu machen, auch für Nutzer ohne technische Vorkenntnisse.
Arbeitsweise von ChatGPT
- Eingabe von Fragen oder Anweisungen: Sie geben Fragen oder Anweisungen in natürlicher Sprache ein, ähnlich wie in einem normalen Gespräch. Dabei müssen Sie keine spezifische Befehle kennen – ChatGPT versteht auch allgemeine Fragen.
- Threads: ChatGPT arbeitet in Konversationsthreads. Jeder Thread ist wie ein Gesprächsfaden. Das bedeutet, dass das System sich an den Kontext des laufenden Gesprächs erinnert, solange Sie in demselben Thread bleiben. Wenn Sie ein neues Thema beginnen, ist es sinnvoll, einen neuen Thread zu starten, damit keine Missverständnisse durch ältere Konversationen entstehen.
- Antworten und Rückfragen: ChatGPT gibt meist eine Antwort und ermöglicht Rückfragen, um das Thema weiter zu vertiefen. Sie können jederzeit nachhaken oder mehr Details zu einer bestimmten Antwort anfordern.
- Limitierung des Kontexts: Obwohl ChatGPT sich innerhalb eines Threads an frühere Nachrichten erinnern kann, hat es eine begrenzte „Kontextlänge“. Bei sehr langen Gesprächen kann es ältere Teile des Gesprächs „vergessen“.
Tipps zur effektiven Nutzung
- Klare Fragen: Formulieren Sie Ihre Fragen so präzise wie möglich, um klarere und genauere Antworten zu bekommen. Sie kannst auch komplexe oder mehrteilige Fragen stellen.
- Anpassung der Antworten: Wenn die erste Antwort nicht genau passt, können Sie weitere Details angeben oder sagen, was Ihnen an Inhalt fehlt. ChatGPT reagiert darauf und passt seine Antwort an.
- Feedback geben: Wenn eine Antwort nicht korrekt ist, können Sie Rückmeldungen geben. Dies hilft, bessere und genauere Antworten zu erhalten.
Verwaltung der Daten
- Datenschutz: ChatGPT speichert Ihre Threads nur für die aktuelle Sitzung, es sei denn, Sie benutzen einen personalisierten Account, bei dem deine Gespräche für spätere Analysen oder Einsichten gespeichert werden können.
- Verwendung von Threads: Sie können jederzeit neue Threads starten, um klare Trennungen zwischen verschiedenen Themen zu haben, und so sicherstellen, dass das System den Kontext nicht falsch versteht.
Grenzen des Systems
- Kein echtes Gedächtnis: ChatGPT hat kein „echtes Gedächtnis“ und kann nach dem Schließen eines Threads oder einer Sitzung keine früheren Informationen behalten.
- Kreative und logische Aufgaben: ChatGPT ist sehr gut in der Textgenerierung, bei Recherchen und bei kreativen Aufgaben, hat aber klare Grenzen bei extrem komplexen oder hochspezifischen logischen Problemen.
Empfehlungen zu Formulierung Prompts
Von besonderer Bedeutung ist bei Systemen generativer KI die Aufforderung an das jeweilige System, eine möglichst genaue Antwort zu liefern. Nutzer setzen dazu sogenannte „Prompts“ ein. Die Qualität eines Prompts beeinflusst maßgeblich die Relevanz der generierten Antwort. Präzision, Klarheit, und die Angabe von Format oder Kontext helfen dabei, bessere Ergebnisse zu erzielen. Unterschiedlich formulierte Prompts können spezifische Antworten für verschiedene Szenarien liefern:
- Kreative Aufgaben: „Erstelle eine kurze poetische Beschreibung eines Sonnenuntergangs.“
- Wissenschaftliche Erklärung: „Erkläre in einfacher Sprache, wie DNA funktioniert.“
- Technische Hilfe: „Gib eine Schritt-für-Schritt-Anleitung zum Erstellen eines neuen GitHub-Repositories.“
Empfehlungen für Formulierungen von Prompts, die eine möglichst schnell präzise Antworten von generativer KI erzeugen sollen:
Fordern Sie die Verwendung aktueller Informationen oder Sachstände ein
Systeme generativer KI greifen von sich aus nicht immer auf aktuelle Informationen zu, sondern verwenden den Datenbestand der zur letzten Überarbeitung des Datenmodells verwendet wurde. Damit Systeme generativer KI auf aktuelle Informationen zugreifen, sollte bei entsprechendem Bedarf nach „aktuell verfügbaren“, „Live-Informationen“ gefragt oder ein aktuelles Datum (z. B. „im Oktober 2024“) konkret in der Anfrage verwendet werden.
Seien Sie spezifisch und präzise
Je detaillierter der Prompt ist, desto genauer wird die Antwort. Vage Eingaben führen oft zu breiten, ungenauen Ergebnissen.
- Vage: „Erstelle eine Geschichte.“
- Präzise: „Erstelle eine kurze Science-Fiction-Geschichte über eine zukünftige Welt, in der Menschen und Roboter gemeinsam auf einem Mars-Stützpunkt leben.“
Klare und verständliche Anweisungen
Wählen Sie eine einfache und klare Sprache. Fügen Sie zusätzliche Anweisungen bei, wenn Sie eine spezifische Struktur oder Tonalität erwarten.
- Vage: „Erkläre Quantenphysik.“
- Klar: „Erkläre das Konzept der Quantenverschränkung in einfachen Worten für Schüler der 10. Klasse.“
Geben Sie den gewünschten Formattyp an
Sagen Sie der KI, welches Format oder welche Art der Antwort Sie erwarten (z. B. Liste, Definition, Textabsatz, Tabelle), z. B.
- „Erstelle eine Liste der wichtigsten Ereignisse im Zweiten Weltkrieg in chronologischer Reihenfolge.“
- „Gib eine kurze Definition des Begriffs ‚Blockchain‘.“
Stellen Sie Einschränkungen oder Rahmenbedingungen auf
Begrenzen Sie den Umfang oder die Länge der Antwort, wenn Sie kurze und prägnante Informationen erwarten.
- „Erkläre die Relativitätstheorie in zwei Sätzen.“
(Anmerkung: Das funktioniert tatsächlich!) - „Erstelle eine kurze Zusammenfassung von Kapitel 1 aus ‚1984‘ von George Orwell in weniger als 100 Wörtern.“
Verwenden Sie Beispiele oder Kontexte für Klarheit
Fügen Sie ein Beispiel oder einen Kontext (z. B. „professioneller Ton“ oder „Vorstellungsgespräch“) hinzu, um die KI besser zu steuern.
- „Schreibe eine Nachricht an meine Chefin / meinen Chef, in der ich um ein Gespräch bitte, bei dem über eine Gehaltserhöhung gesprochen werden soll. Verwende einen professionellen Ton.“
- „Gib eine Liste von Fragen, die ich in einem Vorstellungsgespräch für die Position als Softwareentwickler stellen könnte.“
Fragen zur Veranschaulichung und Zusammenfassung
Fordern Sie eine Zusammenfassung oder eine vereinfachte Erklärung direkt an.
- „Fasse die Hauptpunkte der EU-DSGVO in weniger als 150 Wörtern zusammen.“
- „Erkläre den Unterschied zwischen neuronalen Netzen und Entscheidungsbäumen auf einfache Weise.“
Stellen Sie bei komplexen Themen Schritt-für-Schritt-Fragen
Brechen Sie die Anfragen in kleinere Schritte auf und stellen Sie aufeinander aufbauende Fragen, wenn das Thema komplex ist.
- Schritt 1: „Was ist eine Blockchain?“
- Schritt 2: „Wie wird die Blockchain-Technologie im Finanzsektor eingesetzt?“
Rechtliche Aspekte
Urheberrecht
Bitte beachten Sie, dass hier nur allgemein über öffentlich zugängliche Informationen zu rechtlichen Fragestellungen berichtet wird. Es findet weder eine Rechtsberatung statt noch wird eine Gewähr dafür die Richtigkeit der getroffenen Aussagen übernommen.
Eine wahrscheinlich interessante Auseinandersetzung zum Thema „Urheberrechte bei KI-generierten Inhalten und (zum) Datenschutz“ finden Sie auf den Webseiten des Magazins „KI-Buzzer“ im Rahmen eines Interviews mit einer Rechtsanwältin.
KI-Bildgeneratoren nutzen große Datensätze, die oft Bilder aus dem Internet enthalten. Diese Datensätze umfassen Milliarden von Bildern und deren Beschreibungen, was jedoch auch private Informationen und urheberrechtlich geschützte Inhalte einschließen kann. Einige KI-Bildgeneratoren verwenden auch explizit nur Bilder von lizenzierten Diensten wie Adobe, Getty Images oder Shutterstock.
Die Verwendung dieser Bilder ohne ausdrückliche Genehmigung der Urheber kann als Verletzung des Urheberrechts angesehen werden. Insbesondere wenn Bilder in einem Trainingsdatensatz gesammelt werden, könnte dies als Vervielfältigung im Sinne des deutschen Urheberrechts (§ 16 UrhG) interpretiert werden. Die von Künstlern und Fotografen in bisherigen Gerichtsverfahren geforderten Schadenersatzsummen sind zuweilen fünf bis sechsstellige Euro-Beträge. Hinzu kommen Anwalts- und Gerichtskosten in beträchtlicher Höhe (bei Interesse wird die Eingabe des folgenden Prompts in einem Chatbot empfohlen: „Wie hoch könnten Anwaltskosten sowie Gerichtskosten bei Landgerichten, Oberlandesgerichten und dem Bundesgerichtshof sein, wenn der Streitwert bei 100.000 EUR liegt?“)
Vor Gericht und auf hoher See ist man allein in Gottes Hand!
Einige Plattformen bieten die Möglichkeit, Bilder für das Training zu sperren. Allerdings ist es fraglich, ob diese Opt-Out-Anweisungen von allen KI-Generatoren beachtet werden, da viele Modelle auf nicht öffentlichen Datensätzen basieren.
Die rechtlichen Rahmenbedingungen für die Nutzung von Trainingsdaten in KI-Bildgeneratoren sind komplex und entwickeln sich ständig weiter. Während einige Generatoren versuchen, sich an Lizenzbestimmungen zu halten, bleibt die Frage offen, inwieweit urheberrechtlich geschützte Inhalte ohne Erlaubnis verwendet werden können. Fotografen und Rechteinhaber sollten wachsam sein und gegebenenfalls rechtliche Schritte in Betracht ziehen, um ihre Werke zu schützen.
Schutz der Privatsphäre
Geben Sie am besten keinerlei personenbezogene Daten in Systeme generativer KI ein und laden Sie bei Systemen, die eine Analyse oder Bearbeitung von Multimediainhalten erlauben, keine Bilder, Videos oder Stimmen von realen Personen hoch. Vor allem bei kostenloser Nutzung von KI-Systemen müssen Sie damit rechnen, dass diese Personendaten auch zum Training der KI verwendet werden können. Einige Betreiber versprechen, bei Nutzung der kostenpflichtigen Angebote keine derartige Weiterverarbeitung durchzuführen. Beachten Sie jedoch die Rechtslage in den jeweiligen Herkunftsländern und Ihre evtl. eingeschränkten Möglichkeiten zur rechtlichen Gegenwehr.
Schummeleien mit Faktenchecks begegnen
Es existieren durchaus verschiedene Möglichkeiten, Texte und Multimedia-Werke auf Herkunft, Relevanz und Verwendung von KI-Werkzeugen zu überprüfen.
Hier sind verschiedene Möglichkeiten, um die Herkunft eines Textes zu überprüfen, Plagiate zu identifizieren und festzustellen, ob Inhalte aus einer KI stammen, einschließlich der Kosten und URLs:
Plagiatsprüfungs-Tools
- Scribbr – Umfassende Plagiatsprüfung mit Zugriff auf eine Vielzahl von Quellen – kostenpflichtig
- Copyleaks – KI-gestütztes Tool zur Plagiatserkennung mit Unterstützung für verschiedene Dateiformate – ab $9,16 pro Monat
- CrossPlag – Erkennt Plagiate und analysiert die Quelle eines Textes – ab $9,99
- Quetext – Bietet eine Oberfläche zur Plagiatsprüfung – ab $8,25 pro Monat
KI-Inhaltserkennungs-Tools
- Originality.ai – Speziell für die Erkennung von KI-Inhalten entwickelt, mit hoher Genauigkeit – ab $14,95 pro Monat
- AI Detector Pro – analysiert KI-generierte Inhalte mit detaillierten Berichten – ab $27,98 pro Monat
- GPTZero – Tool zur Erkennung von KI-generierten Inhalten, besonders für Bildungseinrichtungen geeignet – Kostenlos (Basisversion)
- HIX Bypass – Integriert mehrere KI-Erkennungsplattformen für umfassende Analysen – Kostenpflichtig (Preise variieren je nach Nutzung)
- Turnitin – Weit verbreitet in akademischen Institutionen zur Plagiats- und KI-Erkennung – Kostenpflichtig (Preise variieren je nach Institution)
Tools zur Überprüfung von Grafik und Bildern
- Mimikama.org – Non-Profit-Organisation, die sich auf die Aufklärung über Falschmeldungen, Betrug im Internet und Social-Media-Mythen spezialisiert hat – kostenlos
- TinEye – Eine Reverse-Image-Suchmaschine, die hilft, die Herkunft von Bildern zu überprüfen. – Kostenlos für die Rückwärtssuche; kostenpflichtige Pläne für erweiterte Funktionen
- Hive Moderation – Bietet Tools zur Erkennung von KI-generierten Inhalten, einschließlich Bildern und Texten. – Kostenlos
- Reality Defender – Ein KI-gestütztes Tool zur Erkennung von gefälschten Inhalten, einschließlich Bildern. – Kostenlos (Basisversion); kostenpflichtige Pläne verfügbar
- Sensity AI – Fokussiert auf die Erkennung von Deepfakes und manipulierten Medieninhalten. – Kostenpflichtig (Preise auf Anfrage)
- Deepware Scanner – Speziell für die Analyse von Videos, kann aber auch bei Bildern nützlich sein. – Kostenlos (Basisversion); erweiterte Funktionen kostenpflichtig
- FotoForensics – Analysiert Metadaten und Bildkompression, um Anomalien zu erkennen. – Kostenlos (Basisfunktionen); erweiterte Funktionen gegen Gebühr
Tools zur Überprüfung von Musik oder Sprache
- AI Radar – Erkennt KI-generierte Musik mit hoher Genauigkeit – Kostenpflichtig (Preise auf Anfrage)
- Winston AI – Bietet eine Funktion zur Erkennung von KI-generierter Musik und Stimmen – Kostenlos (Basisversion); erweiterte Funktionen kostenpflichtig
- Pex – Bietet Tools zur Erkennung und Analyse von Musik, einschließlich KI-generierter Inhalte. – Preise auf Anfrage
- TuneCore AI – Neben der Veröffentlichung von Musik bietet TuneCore auch Funktionen zur Überwachung von Inhalten. – ab $14,99 pro Jahr
- Icram Amplify – Erkennt KI-generierte Musik; die Ergebnisse können jedoch in einem weniger benutzerfreundlichen Format vorliegen. – Kostenpflichtig (Preise auf Anfrage)
- Play HT – Ein Tool zur Erkennung von KI-Stimmen; nützlich für Songs mit Gesang. – Kostenpflichtig (Preise variieren)
Sammlung von Quellen, Hinweisen und Downloads
Quellen zum Nachlesen
- KI-Campus – Lernplattform für Künstliche Intelligenz mit kostenlosen Online-Kursen, Videos u.v.a.; das Projekt wird von Bundesministerium für Bildung und Forschung gefördert.
- Video KI-Campus – Was ist generative KI?
- OPENHPI (Hasso-Plattner-Institut Uni Potsdam) – ChatGPT: Was bedeutet generative KI für unsere Gesellschaft?
- TerraX – Lesch – ChatGPT & Co – wie intelligent ist KI? –
Download Lehrunterlagen
- Merkblatt Kurs „Texte und Bilder erstellen oder Informationen sammeln mit Künstlicher Intelligenz“ (PDF)
- Auswahl von Vortragsfolien zum Kurs „Texte und Bilder erstellen oder Informationen sammeln mit Künstlicher Intelligenz“ (PDF)