Agile war nie dazu da, Arbeit einfach schneller durch ein System zu pressen. Agile sollte die Distanz verkleinern: zwischen denen, die Software brauchen, und denen, die sie bauen.
Kurze Zyklen. Häufige Abstimmungen. Gemeinsamer Kontext. Frühes Feedback. Im Agilen Manifest ging es nicht darum, möglichst viele Meetings zu etablieren. Es ging darum, Verständnis herzustellen, bevor zu viel in die falsche Richtung gebaut wird.
KI hat diese Erkenntnis nicht überholt. Aber sie hat verändert, wer am Tisch sitzt.
Agile wird dadurch nicht weniger wichtig. Es wird anspruchsvoller. Denn die zentrale Frage lautet nicht mehr nur, was gebaut werden kann. Sie lautet: Was kann ein Team noch verstehen, prüfen und verantworten?
Ein neuer Akteur schreibt mit
Im klassischen agilen Modell beschrieben Stakeholder ihre Anforderungen, und Entwicklerinnen und Entwickler setzten diese um. Die zentrale Rückkopplungsschleife verlief zwischen diesen beiden Gruppen. Daily Stand-ups, Sprint Reviews, Retrospektiven, Refinements und Code Reviews dienten dazu, ein gemeinsames Verständnis herzustellen.
Heute ist oft eine KI am Schreiben des Codes beteiligt. Entwicklerinnen und Entwickler werden dadurch nicht überflüssig. Aber ihre Rolle verändert sich. Sie schreiben nicht mehr nur Code. Sie formulieren Absichten, kuratieren Ergebnisse, treffen Entscheidungen und übernehmen Verantwortung.
Der Mensch beschreibt die Absicht. Der KI-Agent erzeugt einen Vorschlag. Der Mensch prüft, korrigiert, verwirft, kombiniert oder akzeptiert. Die klassische Schleife zwischen Stakeholdern und Entwicklungsteam bleibt bestehen. Aber darin entsteht eine zweite Schleife: die Zusammenarbeit zwischen Mensch und KI.
Das ist immer noch Agile. Es geht weiterhin um Kommunikation, Kontext und kurze Zyklen. Nur die Beteiligten haben sich verändert.
Die Arbeit muss wieder besprechbar werden
Agile hat schon immer grossen Wert auf Synchronisationspunkte gelegt: Momente, in denen ein Team innehält, den aktuellen Stand anschaut und entscheidet, was als Nächstes sinnvoll ist.
Diese Punkte waren nie Selbstzweck. Sie existieren, weil Menschen schnell den Überblick verlieren, wenn zu viel gleichzeitig passiert. Genau das wird durch KI verschärft.
Ein KI-Agent kann in wenigen Minuten einen Pull Request mit 1’000 Zeilen erzeugen. Technisch ist das beeindruckend. Für ein Review ist es oft ein Problem.
Wenn ein Mensch einen solchen Diff als Ganzes prüfen soll, entsteht Scheinsicherheit. Man überfliegt den Code, schaut sich die offensichtlichen Stellen an, konzentriert sich auf vielleicht fünf Prozent der Änderungen und gibt den Rest im Vertrauen frei. Das ist kein individuelles Versagen. Es ist eine Grenze menschlicher Aufmerksamkeit.
Ein Agent ändert zum Beispiel eine Validierungslogik, ergänzt Tests, passt eine Schnittstelle an, räumt nebenbei noch Naming, Imports und Fehlermeldungen auf. Jede einzelne Änderung kann plausibel sein. Zusammen ist es zu viel für ein sauberes Review. Genau dann wird aus Kontrolle ein Ritual.
Daraus folgt eine einfache Regel:
In Zeiten von KI sollte eine Arbeitseinheit nicht danach definiert werden, was ein Agent erzeugen kann, sondern danach, was ein Team sinnvoll verstehen, diskutieren und verantworten kann.
Eine gute Arbeitseinheit ist das, was ein Team in einer Sitzung sinnvoll besprechen kann: Ziel, Designentscheidungen, Risiken, Kompromisse und offene Fragen. Nicht alles, was ein Tool in einem Lauf produziert, ist automatisch reviewfähig.
Wenn hundert zusammenhanglose Änderungen in einem Review landen, wird niemand alles im Blick behalten. Das Team konzentriert sich auf die Teile, die es versteht. Der Rest wird zur impliziten Annahme. Genau dort entstehen Risiken.
Das Review darf nicht zur Farce werden
KI kann dem Entwicklungsprozess etwas antun, das gefährlicher ist als schlechter Code: Sie kann den Eindruck erzeugen, dass Kontrolle stattfindet, obwohl sie nur noch formal existiert.
Pull Requests tauchen schneller auf, als Menschen sie wirklich prüfen können. Die KI generiert, der Mensch gibt frei, der nächste Agent läuft weiter. Der Review-Schritt bleibt im Prozess erhalten, verliert aber seinen eigentlichen Zweck.
Ich bin überzeugt, dass menschliche Reviews weiterhin notwendig sind. Nicht nur, um Fehler zu finden. Das ist wichtig, aber nicht der Kern.
Reviews schaffen gemeinsames Verständnis. Sie machen sichtbar, welche Entscheidungen getroffen wurden, warum sie getroffen wurden und welche Auswirkungen sie haben.
Softwareentwicklung war nie eine reine Soloaktivität, selbst wenn eine einzelne Person den ganzen Code schreibt. Software existiert in einem System. Sie wird von Teams betrieben, verändert und gewartet. Sie dient Menschen, die meistens nicht im Raum waren, als sie gebaut wurde.
Deshalb ist ein Review kein bürokratisches Hindernis. Es ist ein Synchronisationspunkt. Gerade dann, wenn KI beteiligt ist.
Verantwortung lässt sich nicht delegieren
KI kann Code erzeugen, aber sie übernimmt keine Verantwortung für ihn. Sie trägt keine Verantwortung für Wartbarkeit. Nicht für Sicherheit. Nicht für Architekturentscheidungen. Nicht für regulatorische Folgen. Nicht dafür, ob die Lösung tatsächlich zum fachlichen Problem passt.
Diese Verantwortung bleibt beim Menschen und beim Team. Das bedeutet nicht, dass jeder jede Zeile selbst geschrieben haben muss. Aber wer eine Änderung akzeptiert, muss verstehen, welche Entscheidung damit getroffen wurde. Ein Team muss nachvollziehen können, warum etwas gebaut wurde, was es verändert und welche Risiken damit verbunden sind.
Der gefährlichste Zustand entsteht, wenn niemand mehr genau weiss, warum der Code so aussieht, aber alle davon ausgehen, dass schon jemand oder etwas geprüft hat.
KI verschiebt Verantwortung nicht weg vom Menschen. Sie macht es nur leichter, diese Verantwortung zu übersehen.
Die eigene Belastungsgrenze kennen
Ich kann problemlos drei parallel arbeitende KI-Agenten steuern. Bei mehr verliere ich den Überblick.
Dann weiss ich nicht mehr präzise, welcher Agent was macht, in welchem Zustand welche Aufgabe ist und ob sich Ergebnisse gegenseitig widersprechen. Ich beginne, schlechtere Entscheidungen zu treffen. Nicht weil die Tools überfordert wären. Sondern weil ich es bin.
Ich höre immer wieder Menschen davon sprechen, zehn, fünfzehn oder fünfundzwanzig Agenten gleichzeitig zu verwalten, als wäre das ein erstrebenswertes Ziel. Für mich klingt das nicht nach Produktivität. Es klingt nach kognitiver Überlastung.
Es gibt eine reale Grenze dafür, wie viel parallele Arbeit ein Mensch sinnvoll steuern kann. KI hebt diese Grenze nicht einfach auf. Sie verschiebt sie vielleicht. Aber sie beseitigt sie nicht.
Mehr parallele Agenten bedeuten nicht automatisch mehr Kontrolle. Oft bedeuten sie nur mehr offene Schleifen im Kopf.
Maschinen schlafen nicht. Menschen schon.
Es gibt eine wachsende Erwartung, dass Menschen ebenfalls rund um die Uhr verfügbar sein müssten, weil KI rund um die Uhr arbeiten kann. Jede eingesparte Stunde soll mit neuer Arbeit gefüllt werden. Jeder Effizienzgewinn wird sofort in zusätzlichen Output übersetzt.
Dagegen sollten wir uns wehren.
Bessere Werkzeuge sollten bessere Ergebnisse ermöglichen. Nicht einfach mehr Erschöpfung.
Agile hat diesen Punkt ursprünglich sehr klar formuliert:
Agile Prozesse fördern nachhaltige Entwicklung. Die Sponsoren, Entwickler und Nutzer sollten in der Lage sein, ein konstantes Tempo auf unbestimmte Zeit aufrechtzuerhalten.
Auf unbestimmte Zeit. Nicht bis zum nächsten Sprint. Nicht bis zum nächsten Release. Nicht bis zur nächsten Eskalation.
Nach mehr als 35 Jahren in diesem Bereich weiss ich über mich selbst: Wenn ich meinen Einsatz bei etwa 70 bis 80 Prozent halte, kann ich sehr lange gute Arbeit leisten. Ich bin produktiv, präsent und klar im Kopf.
Wenn ich auf 100 Prozent hochschalten muss — wegen einer Deadline, einer Krise oder eines Launches — läuft die Uhr. Das geht vielleicht zwei Wochen. Dann kommt der Bruchpunkt.
Es gibt ein Tempo, das man halten kann. Und es gibt ein Tempo, das man nur kurzfristig überlebt. Die Lücke dazwischen lässt sich nicht mit Willenskraft schliessen.
KI-Tools machen es gefährlich einfach, dauerhaft im roten Bereich zu arbeiten, ohne es sofort zu merken. Die Arbeit läuft schnell. Die Ergebnisse kommen laufend zurück. Es fühlt sich produktiv an. Bis es das nicht mehr ist.
Die Tools sind schneller geworden. Die Menschen nicht.
Die Kultur, die sagt: «Die Maschinen schlafen nie, also solltest du es auch nicht», ist nichts anderes als alte Überarbeitungskultur in neuem Gewand.
Was wir daraus ableiten
Für uns bedeutet Agile in Zeiten von KI nicht mehr Output um jeden Preis. Es bedeutet kleinere Arbeitseinheiten, klarere Ziele, bewusstere Reviews und ein Tempo, das Menschen dauerhaft halten können.
Als kleines Unternehmen können wir viele dieser Punkte so regeln, wie sie für uns funktionieren. Vier Prinzipien sind uns dabei besonders wichtig.
Erstens: Vor dem Start definieren, was fertig bedeutet.
Auch wenn es nur ein Satz ist: Wir halten fest, was eine Änderung bewirken soll. Ohne diese gemeinsame Definition arbeiten wir mit einem scharfen Bild eines unscharfen Ziels. Eine gute Definition of Done verankert die Arbeit. Sie gibt Orientierung beim Start und einen Grund aufzuhören, wenn das Ziel erreicht ist.
Zweitens: Arbeit so schneiden, dass sie besprechbar bleibt.
Ein Review sollte in einer Sitzung sinnvoll verstanden werden können. Nicht alles, was ein Agent erzeugen kann, ist automatisch eine gute Arbeitseinheit. Der richtige Umfang ist erreicht, wenn das Team die Änderung nachvollziehen, diskutieren und verantworten kann.
Drittens: Reviews müssen stattfinden.
Jede relevante Änderung wird von Menschen geprüft. Nicht als Misstrauensvotum gegenüber KI. Nicht als formale Hürde. Sondern als Moment der Zusammenarbeit. Ein Review ist der Punkt, an dem aus erzeugtem Code verstandene Software wird.
Viertens: Tempo vor Output.
Wir fragen nicht nur: Wie viel können wir heute erzeugen? Wir fragen auch: Welches Tempo können wir einen Monat lang halten? Wenn die sinnvolle Arbeit des Tages bis Mittag erledigt ist, dann ist der Tag erledigt. Mehr Output ist nicht automatisch mehr Fortschritt.
Agile in Zeiten von KI heisst nicht, schneller zu rennen, nur weil die Werkzeuge schneller geworden sind.
Es heisst, die richtigen Haltepunkte zu setzen.
Es heisst, Arbeit wieder besprechbar zu machen.
Es heisst, Verantwortung sichtbar zu halten.
Die zentrale Frage lautet nicht:
Wie viel kann KI für uns produzieren?
Sondern:
Wie viel davon können wir noch verstehen, prüfen und verantworten?