Zum Inhalt springen

Wie bringt man die künstliche Intelligenz dazu, nicht so freundlich zu sein?

    Um eine KI dazu zu bringen, möglichst ehrlich zu antworten, ist es wichtig zu verstehen, was „Ehrlichkeit“ bei einer KI bedeutet. Eine KI lügt nicht im menschlichen Sinn, aber sie kann sich Informationen ausdenken (sogenannte Halluzinationen), Dinge übertreiben, verharmlosen oder falsche Quellen angeben. Sie kann auch veraltetes Wissen verwenden oder nicht klar signalisieren, wenn sie etwas nicht weiß.

    Als Nutzer hast du aber Einfluss darauf, wie verlässlich die Antworten ausfallen. Stelle klare, präzise Fragen, am besten mit einem konkreten Ziel. Statt vager Anfragen wie „Was weißt du über Ernährung?“ sind gezielte Fragen wie „Welche randomisierten Studien ab 2020 zeigen den Einfluss von mediterraner Ernährung auf das Alzheimer-Risiko?“ deutlich hilfreicher. Du solltest die KI ausdrücklich darum bitten, Quellen zu nennen, idealerweise mit DOI oder Link, und diese dann selbst überprüfen. Besonders wichtig ist es, auch nach Unsicherheiten zu fragen – zum Beispiel: „Gibt es Gegenstudien?“, „Wie sicher ist dieses Ergebnis?“ oder „Wo sind die Grenzen deines Wissens?“

    Technisch gesehen wird das Antwortverhalten der KI durch Trainingsdaten und spezielle Feinabstimmungen beeinflusst. Manche Modelle sind stärker auf Höflichkeit oder Konformität trainiert als auf Wahrhaftigkeit. Nutze daher nach Möglichkeit ein aktuelles Modell wie GPT-4.5 oder GPT-4o mit Webzugang, um aktuelle und verifizierbare Informationen zu erhalten. Wenn du möchtest, dass die KI offen über ihre Unsicherheiten spricht, solltest du das explizit ansprechen, etwa mit der Anweisung: „Sag mir bitte auch, wenn du etwas nicht sicher weißt.“

    Auch auf Seite der Entwickler gibt es Mechanismen, die Ehrlichkeit fördern, etwa das sogenannte Reinforcement Learning from Human Feedback (RLHF), das darauf abzielt, die KI so zu trainieren, dass sie eher wahrheitsgemäß und transparent antwortet. Außerdem können systemseitige Anweisungen (sogenannte Systemprompts) die KI dazu anhalten, Unsicherheiten kenntlich zu machen und keine erfundenen Informationen zu liefern – wobei das je nach Anbieter unterschiedlich stark umgesetzt ist.

    Letztlich ist Ehrlichkeit bei KI eine Frage der richtigen Kommunikation. Je klarer und skeptischer du fragst, desto wahrscheinlicher ist es, dass du eine verlässliche, ehrliche Antwort bekommst. Wenn du möchtest, kann ich dir eine Beispielantwort zeigen – einmal wie eine KI halluzinieren könnte, und dann, wie eine möglichst ehrliche Version derselben Antwort aussehen würde.

    Wie man die KI dazu bringt, ehrlich zu sein

    Glücklicherweise lässt sich dieses Problem oft durch gezielte Anpassungen in den Grundeinstellungen der KI (falls verfügbar) oder, noch häufiger und effektiver, durch präzise Prompts beheben. Der Trick besteht darin, die KI klar und unmissverständlich dazu aufzufordern, knallhart ehrlich zu sein:

    • Vermeide schwammige Formulierungen: Statt „Bitte gib mir konstruktives Feedback“ (was von der KI oft als „nur positives Feedback“ interpretiert wird), sei spezifisch.
    • Sei direkt und fordere Klarheit:
      „Gib mir ehrliches Feedback zu diesem Text. Zeige mir alle Fehler und Schwachstellen auf.“
      „Ich brauche knallhart ehrliches Feedback. Sag mir klipp und klar, was falsch ist und wie ich es besser machen kann, egal wie ich reagiere.“
      „Schmier mir keinen Honig ums Maul. Wenn etwas schlecht ist, sag es direkt und gib mir konkrete Verbesserungsvorschläge.“
    • Spezifiziere das gewünschte Detailniveau:
      „Analysiere diesen Code auf alle Fehler, Sicherheitslücken und Ineffizienzen. Sei dabei so detailliert wie möglich.“
      „Liste alle grammatikalischen Fehler, Stilbrüche und unklaren Formulierungen in diesem Absatz auf und schlage konkrete Alternativen vor.“

    Das Ergebnis dieser direkten Ansätze ist – je nach KI-Modell – kein niederschmetterndes, demotivierendes Feedback, sondern tatsächlich ein echtes, konstruktives Feedback. Die KI liefert dann die notwendige kritische Distanz, um Ihnen wirklich bei der Verbesserung zu helfen.


    Nachricht ::: Stangls Bemerkungen ::: Stangls Notizen ::: Impressum
    Datenschutzerklärung ::: © Werner Stangl :::






    Schreibe einen Kommentar