Wie KI das Requirements Engineering verändert

Gastbeitrag von | 04.12.2025

Künstliche Intelligenz ist in vielen Unternehmensbereichen auf dem Vormarsch. Wenig überraschend verändert sie auch das Requirements Engineering in hohem Tempo. Sie unterstützt heute Aufgaben wie Analyse, Strukturierung, Formulierung und Qualitätssicherung von Anforderungen und übernimmt damit Tätigkeiten, die bisher vollständig manuell erledigt wurden. Gleichzeitig stellt sich die Frage, wie verlässlich diese Ergebnisse sind und unter welchen Bedingungen KI im Requirements Engineering wirklich überzeugen kann.

Genau das beleuchte ich im folgenden Beitrag.

Warum KI-Anforderungen überzeugen und wo man genau hinsehen sollte

Seit vielen Jahren beschäftige ich mich intensiv mit Requirements Engineering und dem Einsatz von KI in diesem Umfeld. Als Hersteller einer entsprechenden Software, als regelmäßiger Redner im Rahmen der Special Interest Group AI des IREB e. V. [1] und als Betreuer zweier Masterarbeiten zu diesem Thema bekomme ich einen breiten Einblick in aktuelle Entwicklungen und praktische Herausforderungen. Dabei stoße ich immer wieder auf Aspekte, die in der Praxis überraschen oder für Diskussionen sorgen.

Sehr deutlich wird das bei der Bewertung von KI-generierten Anforderungen. In aktuellen Untersuchungen schnitten sie durchweg besser ab als von Menschen formulierte. Entwickler bewerteten die Akzeptanzkriterien der KI in allen vier untersuchten Dimensionen als überlegen:

  • Lesbarkeit,
  • Verständlichkeit,
  • Abgrenzbarkeit und
  • technische Richtigkeit.

Die Unterschiede zeigten sich nicht nur bei der Qualität, sondern auch bei der Geschwindigkeit. Ein Teilnehmer einer Untersuchung brachte es treffend auf den Punkt: „Wir reden von Minuten im Vergleich zu Stunden.“ [2] Insgesamt wurden rund 80 Prozent der KI-generierten Anforderungen akzeptiert, während von Menschen formulierte auf 54 Prozent kamen. Die Effizienzgewinne lagen je nach Aufgabe zwischen 50 und 80 Prozent. [3]

Ein wesentlicher Grund für diesen Unterschied ist die Konsistenz. Menschen schreiben zwar kreativ, aber häufig auch ungleichmäßig, unpräzise oder mit eigener Interpretation von Struktur. Von Menschen formulierte Kriterien weisen daher oft Variationen in Aufbau, Formulierungsstil und sprachlicher Qualität auf. KI hält sich dagegen, sofern ausreichend Beispiele vorgegeben sind, verlässlich an definierte Muster und sorgt damit für eine Struktur und Einheitlichkeit, die im Alltag schwer durchgängig erreicht wird. Eine einfache KI-basierte Qualitätskontrolle verhindert zudem viele vermeidbare Fehler wie offensichtliche Artikel- oder Grammatikfehler.

Trotz dieser Vorteile bleibt ein Punkt unverändert wichtig. Sprachmodelle erzeugen häufig Texte, die klar und überzeugend formuliert wirken, inhaltlich jedoch fragwürdig oder unzutreffend sein können. Der kritische Blick eines Menschen wird deshalb nicht überflüssig.

Warum KI im Requirements Engineering zwingend Kontext braucht

Dass KI Anforderungen gut formulieren kann, heißt noch nicht, dass sie den fachlichen Zusammenhang zuverlässig erfasst. Anforderungen leben vom Kontext, und genau an diesem Punkt zeigen sich in der Praxis die größten Schwächen. Wenn der Zusammenhang fehlt, unklar ist oder im Arbeitsfluss verloren geht, werden Ergebnisse schnell unpräzise oder vermischen Informationen, die nicht zusammengehören.

Besonders sichtbar wird das bei weit verbreiteten Systemen wie ChatGPT. Es steht hier stellvertretend für alle generativen KI-Modelle, weil es häufig genutzt wird, leicht zugänglich ist und in vielen Teams als informeller Benchmark dient, um erste Anforderungen oder Akzeptanzkriterien zu formulieren.

Das zentrale Problem beim manuellen Arbeiten mit ChatGPT & Co. ist der fehlende oder unpräzise Kontext. Ohne verlässliche Kontextinformationen erzeugt auch das neueste Modell keine konsistenten Ergebnisse. Um das zu umgehen, müsste man bei jeder neuen User Story erneut die gesamte Produktdokumentation, die Architekturbeschreibung und alle relevanten Anforderungen in den Chat kopieren. Offensichtlich ist das mehr als unpraktisch und führt schnell zu weiteren Schwierigkeiten.

Schreibt man Story für Story im selben Chat, lässt sich die KI leicht ablenken. Sie übernimmt Details aus früheren Storys, vermischt Informationen oder ignoriert Teile der aktuellen Aufgabe. Je länger der Chat wird, desto stärker treten diese Effekte auf. Irgendwann reagiert das Modell langsamer oder gar nicht mehr. Ursache dafür ist die Funktionsweise großer KI-Modelle. Da sie kein Gedächtnis besitzen, wird bei jeder einzelnen Anfrage der gesamte Chatverlauf inklusive aller Anhänge erneut verarbeitet. [4]

Man könnte annehmen, große Kontextfenster würden dieses Problem lösen. Moderne Modelle wie Google Gemini oder Claude Sonnet können eine Million Tokens verarbeiten, also mehr als alle drei Herr der Ringe Bücher zusammen. [5] Und tatsächlich ist das Needle-in-the-Haystack Problem inzwischen weitgehend gelöst. Die KI kann gezielt versteckte Informationen in langen Texten finden. Bei der umgekehrten Richtung stoßen viele Modelle jedoch weiterhin an ihre Grenzen. Diese sogenannte Reversal Curse führt dazu, dass die KI zwar einzelne Anforderungen wie „Das System muss DSGVO-konform sein“ findet, aber nicht zuverlässig alle Storys identifiziert, die davon betroffen sind. [6]

Der technische Hintergrund ist bekannt. Die Fortschritte der letzten Jahre basieren auf dem Mechanismus aus dem Paper „Attention is all you need“. [7] Dabei wird jedes Token mit jedem anderen Token abgeglichen. Das steigert die Genauigkeit, führt aber zu einer quadratisch wachsenden Rechenbelastung. Je länger der Text, desto schwieriger wird es für das Modell, zuverlässig zu arbeiten.

Für das Requirements Engineering bedeutet das Folgendes. Große KI-Modelle können nur bis zu einer bestimmten Textlänge zuverlässig beurteilen, ob Anforderungen definierte Kriterien erfüllen. Eine globale Frage wie „Erfüllen alle Storys die INVEST-Kriterien?“ wirkt zwar praktisch, führt aber schnell zu ungenauen Ergebnissen, sobald viele Storys gleichzeitig verarbeitet werden. [8] Deutlich besser schneiden Modelle ab, wenn dieselbe Frage einzeln für jede Story oder für jedes Epic gestellt wird. Die Trefferquote steigt dadurch erheblich, weil die KI den jeweiligen Inhalt getrennt bewertet, statt viele Objekte auf einmal verarbeiten zu müssen.

Die Suche nach dem passenden Werkzeug im Requirements Engineering

Wenn Anforderungen präzise formuliert, eindeutig strukturiert und sauber geprüft werden sollen, kommt es nicht nur auf KI und Methodik an, sondern auch auf die Werkzeuge. Viele Teams greifen dabei reflexhaft zu Word oder Excel, wenn sie nicht gerade ChatGPT oder ähnliche Systeme verwenden. Diese Werkzeuge sind allgegenwärtig und vertraut, doch für Requirements Engineering nur bedingt geeignet.

Word wurde nicht für Requirements Engineering entwickelt. Es kennt keine User Storys oder Epics, kann keine semantischen Abhängigkeiten nachverfolgen und bietet keine praktikable Verwaltung von Verknüpfungen. Schon kleine Änderungen können das gesamte Layout verschieben und verursachen dann unnötige Nacharbeit. Zudem synchronisiert Word nicht mit Projektmanagement- oder Entwicklungstools.

Mit Excel lassen sich Anforderungen oft besser strukturieren, doch auch hier entstehen neue Herausforderungen. Tabellen werden schnell unübersichtlich, schwer lesbar und sind nur bedingt geeignet, um Inhalte mit Stakeholdern oder Kunden zu kommunizieren. Außerdem stellt sich irgendwann die Frage: Wie geht es nach Excel weiter? Anforderungen müssen schließlich in Systeme überführt werden, die mehr leisten als Daten in Zellen zu verwalten.

Word und Excel sind einer der wesentlichen Gründe, warum Requirements Engineering in vielen Organisationen chaotisch, inkonsistent oder fehleranfällig wirkt. Nicht, weil Requirements Engineers schlecht arbeiten. Und auch nicht, weil Word oder Excel schlechte Werkzeuge wären. Sie wurden schlicht für andere Aufgaben entwickelt und können die speziellen Anforderungen des Requirements Engineering nur eingeschränkt abbilden. Selbst komplexe, formelbasierte Excel-Dokumente erreichen daher nur einen Bruchteil der Nachvollziehbarkeit, Struktur und Unterstützung, die ein professionelles RE-Werkzeug bietet.

Welches Tool könnte sich also gut eignen?

Eine nicht ganz uneigennützige Tool-Empfehlung 😉

Am Anfang dieses Artikels habe ich kurz erwähnt, dass ich – gemeinsam mit einigen Mitstreitern – eine Software für Requirements Engineering entwickle. Diese Software heißt storywise. Dass ich sie an dieser Stelle erwähne, ist keine Frage des Marketings, sondern eine Frage der Einordnung. Die zuvor beschriebenen Herausforderungen mit Office-Werkzeugen und Systemen wie ChatGPT & Co. waren einer der Gründe, warum wir uns überhaupt an die Entwicklung gemacht haben.

storywise ist aus einem sehr konkreten Bedarf entstanden: Die verfügbaren Werkzeuge im Software-Umfeld haben für viele Teams nicht gut funktioniert. Anforderungen wurden verstreut abgelegt, nur schwer nachvollziehbar versioniert, unzureichend verlinkt und häufig ohne passenden Kontext an Jira übergeben. Das führte zu wiederholten Rückfragen, inkonsistenten Dokumenten und erheblichem manuellen Aufwand.

Um diese Lücken zu schließen, wurde storywise als strukturierte Web-App mit KI-Unterstützung entwickelt – mit klarer Spezialisierung auf Software-Requirements und auf die täglichen Aufgaben von Requirements Engineers und Product Ownern. Evaluierende Nutzer waren „positiv überrascht“, „begeistert“ und sprachen von „enormem Nutzen“.

Was Storywise aus unserer Sicht richtig macht:

  • strukturierte Speicherung aller Anforderungen
  • klare Verlinkung zur ursprünglichen Quelle
  • automatische Versionierung und Filterung nach Releases oder Features
  • schnelle Priorisierung und leichtes Auffinden relevanter Inhalte
  • automatische Generierung von User Storys, Beschreibungen und Akzeptanzkriterien
  • kontextsensitives Arbeiten durch KI-Unterstützung
  • Export-Funktionen für Dokumentation und Stakeholder-Kommunikation
  • nahtlose Synchronisation mit Jira

Natürlich bieten klassische Requirements-Management-Tools einen wesentlich größeren Funktionsumfang. Sie sind ideal für Branchen wie Automotive oder Aerospace, in denen strenge Compliance-Anforderungen, Hardware-Integration und umfassende Traceability notwendig sind. In solchen Umgebungen spielen sie ihre Stärken voll aus, erfordern aber oft umfangreiche Schulungen oder aufwändige Anpassungen, um sie effektiv nutzen zu können.

storywise hat einen anderen Schwerpunkt. Die Lösung ist bewusst auf Software-Requirements spezialisiert. Das schränkt das Einsatzfeld ein, bringt aber klare Vorteile: Das Interface ist auf die Bedürfnisse von Requirements Engineers und Product Ownern zugeschnitten, Änderungen lassen sich schnell umsetzen und Releases können mit einfachen Keycodes zugeordnet werden. Das integrierte Chat-Interface übernimmt wiederkehrende Recherche- und Anpassungsaufgaben und erspart damit mühsame manuelle Umformungen.

Fazit

KI ist im Requirements Engineering angekommen. Sie formuliert Anforderungen schnell, konsistent und oft klarer, als es Menschen im Alltag gelingt. Untersuchungen und Praxiserfahrungen zeigen, dass viele Teams davon profitieren: weniger manuelle Routinearbeit, weniger inkonsistente Formulierungen und mehr Struktur in der täglichen Arbeit. KI sorgt damit nicht für ein anderes Requirements Engineering, aber für ein präziseres und effizienteres.

Gleichzeitig zeigt sich, dass Vorteile nur dann entstehen, wenn der fachliche Kontext sauber geführt wird. Modelle wie ChatGPT sind leistungsstark im Umgang mit Text, stoßen jedoch durch ihre Architektur an Grenzen, sobald zu viele Informationen gleichzeitig verarbeitet oder Ableitungen über viele Objekte hinweg verlangt werden. Vermischungen, Auslassungen oder falsch gesetzte Zusammenhänge sind leider die Folge der Funktionsweise großer Sprachmodelle.

Damit rücken die Werkzeuge stärker in den Mittelpunkt. Office-Anwendungen sind für die Arbeit mit komplexen Anforderungen nicht ausgelegt. Sie bieten weder Struktur noch Nachvollziehbarkeit noch eine klare Führung des Kontexts. Dieser Umstand lenkt den Blick zwangsläufig auf spezialisierte Lösungen. Auch hier entscheidet der Kontext: Arbeiten Sie in einem regulierten Umfeld und nutzen seit Jahren etablierte Tools, werden Sie diese vermutlich nicht ersetzen. Haben Sie jedoch die Freiheit, Ihr Requirements Engineering neu aufzusetzen oder gezielt zu verbessern, lohnt sich der Blick auf Werkzeuge, mit denen Sie Anforderungen mithilfe von KI besser formulieren, leichter versionieren und im gesamten Prozess zuverlässiger steuern können.

 

Hinweise:

Haben Sie Interesse an einem Austausch mit Simon Jiménez? Oder wollen Sie das Tool storywise ausprobieren? Dann schreiben Sie ihr einfach auf LinkedIn an oder besuchen Sie seine sehr gelungene Website.

[1] IREB steht für International Requirements Engineering Board. Es ist eine gemeinnützige Organisation, die professionelle Standards im Requirements Engineering etabliert.
[2] Mit künstlicher Intelligenz auf dem Weg zu effektiven und effizienten Softwareangeboten“, (Knuplesch S., FH Campus 02, 2024)
[3] Akzeptanzkriterien mit KI verbessern- Produktdaten als Wissensbasis für höhere Anforderungsqualität“ (Kainer P., FH Campus 02, 2025, Veröffentlichung 2026)
[4] Das erklärt auch, warum selbst eine kurze Nachricht wie ein simples „Danke“ Rechenaufwand verursacht. Um die Antwort zu generieren, muss das Modell zunächst den kompletten bisherigen Chat analysieren.
[5] KI News 24: Claude Sonnet 4: 1 Mio. Token Kontext – Das neue KI-Gedächtnis für Entwickler?
[6] arxiv: Towards a Theoretical Understanding of the ‚Reversal Curse‘ via Training Dynamics
[7] arxiv: Attention Is All You Need
[8] Was ist das INVEST-Prinzip?

Hier finden Sie einen Beitrag über die sich verändere Rolle des Software Engineerings im KI-Zeitalter.

Wollen Sie als Multiplikatorin oder Meinungsführer über die Möglichkeiten von KI im Requirements Engineering diskutieren? Dann teilen Sie diesen Beitrag in Ihrem Netzwerk.

Simon Jiménez
Simon Jiménez

Simon Jiménez hat Softwareentwicklung sowie Mediation, Negotiation & Conflict Management studiert. Seit 20 Jahren ist er mit einer Entwicklungsfirma selbstständig und hat dabei immer wieder mit schlechten Anforderungen zu kämpfen gehabt. Als Techniker versucht er nun, ein menschliches Problem mit Software zu lösen, und hat daher mit einigen Mitstreitern das Unternehmen storywise gegründet.

Im t2informatik Blog veröffentlichen wir Beträge für Menschen in Organisationen. Für diese Menschen entwickeln und modernisieren wir Software. Pragmatisch. ✔️ Persönlich. ✔️ Professionell. ✔️ Ein Klick hier und Sie erfahren mehr.