Aktuelles

im AK Methoden in der Evaluation

Im Mittelpunkt der diesjährigen Tagung des AK Methoden in der Evaluation am 10. und 11. Juli 2025 in München stand das Verhältnis von methodischer Qualität von Evaluationen einerseits und ihrer Nützlichkeit und Nutzung andererseits.

Gastgebende Institution war die Stabsstelle Evaluierung der Hanns-Seidel-Stiftung e.V. in München, die selbst Evaluationen durchführt und beauftragt, sowie an der Schnittstelle zu Auftraggeber:innen und Adressat:innen von Evaluation insbesondere in der Politik tätig ist.

Rund 40 Teilnehmer*innen aus Deutschland, Österreich, der Schweiz, den Niederlanden und Luxemburg diskutierten sowohl grundsätzliche Aspekte zu diesem Thema, also auch Einsichten und Lernerfahrungen aus konkreten Projekten und deren methodischer Umsetzung bis hin zu Fragen, wie sich zukünftige Entwicklungen im Rahmen von Evaluationen integrieren lassen.

Zentrales Fazit der Tagung ist, dass die hohe methodische Qualität von Evaluationen eine notwendige, aber nicht hinreichende Bedingung dafür darstellt, ob Evaluationen und ihre Ergebnisse als nützlich wahrgenommen oder genutzt werden. Hiervon ausgehend wurde auf der Tagung diskutiert, inwiefern Evaluierende die Kommunikation mit relevanten Stakeholder:innen und deren methodisches Verständnis verbessern können. Wege, dies zu leisten, können beispielsweise sein, dass Evaluierende die zentralen Stakeholder:innen einbeziehen und sich mit ihnen zu den Evaluationsfragen verständigen, gemeinsame Priorisierungen vornehmen, über die in Ansatz zu bringenden Methoden und den damit verbundenen Ressourcenaufwand sprechen. Dies könnte sich nicht zuletzt unter Effizienzgesichtspunkten positiv auf die wahrgenommene Nützlichkeit und Nutzung von Evaluationen auswirken. Zugleich wäre dabei zu klären, wie mit unterschiedlichen und sich möglicherweise wiedersprechenden Interessen von Stakeholder:innen in einem solchen Prozess umgegangen werden kann. Vor dem Hintergrund der Vorträge und präsentierten Beispiele bestand Konsens darüber, dass eine hohe methodische Güte einer Evaluation gerade auch in politisierten Feldern unabdingbar sei. Zwar verhindere dies nicht, dass Evaluation und ihre Ergebnisse (politisch) instrumentalisiert würden, dient der Evaluation aber als Professionalitätsausweis und Schutz, um sich nicht angreifbar zu machen. Damit zusammenhängend wurde auch diskutiert, wie widersprüchliche Evaluationsbefunde (und Zielkonflikte) mit verschiedenen Stakeholder:innen und Adressat:innen kommuniziert werden können. Die Auseinandersetzung mit prospektiven Methoden der Zukunftsforschung wurde zudem als wichtiger Impuls angesehen, um Erkenntnisse und Empfehlungen besser vor dem Hintergrnd zukünftiger Entwicklungen zu denken und zu erarbeiten.

Dokumentation der Vorträge:

Susanne von Jan: »Nützlichkeit von Evaluation – Erkenntnisse aus Theorie und Praxis«
Frank König: »Cui bono? Weshalb die methodische Qualität von Evaluation bei der Nutzung ihrer Ergebnisse nicht alles, aber ohne sie alles nichts ist. Ein Fallbeispiel...«
Dr. Jan-Tobias Polak: »Der Blick nach vorn: Stärkung der Nützlichkeit von Evaluationen durch Futures-informed Evaluation«
Anna Gieschen & Prof. Dr. Thomas Eckert: »Evaluation im Spannungsfeld zwischen methodischen Ansprüchen, legitimatorischen Notwendigkeiten und pädagogischem Selbstverständnis«
Dr. Gerald Leppert & Folake Kareem: »From Rigour to Usefulness: User-Responsive Evaluation Design in Rapidly Changing Environments - Insights from the Global Center on Adaptation«

Weitere Dokumenation:

Das Tagungsprogramm enthält den Ankündigungstext, eine Übersicht über alle Vorträge sowie Infos zur Anmeldung und Anreise.
Tagungsbericht in der Zeitschrift für Evaluation (in Vorbereitung).

Konferenzraum mit Bühne und Leinwand — Konferenzzentrum, Franz-Josef-Strauss-Saal

Teilnehmende einer Tagung — Pausengespräche

In der Regel finden die Treffen der Mitglieder des Arbeitskreises im Rahmen der Frühjahrstagung des AK und der DeGEval-Jahrestagung statt.

Zurückliegende Treffen:

10. Juli 2025 in München
19. September 2024 in Potsdam
06. Juni 2024 in Saarbrücken
14. September 2023 in Magdeburg
19. Juni 2023 in Wiesbaden
15. September 2022

Die Entwicklung von Künstlicher Intelligenz (KI) hat das Potential, den Berufsstand der Evaluation stark zu verändern. In der Evaluationspraxis und -forschung ist das Thema gerade erst im Begriff, größere und regelmäßigere Aufmerksamkeit zu erlangen – unter anderem ausgelöst durch den Hype um Large Language Models wie den Text Roboter Chat GPT. Die beiden DeGEval-Arbeitskreise „Methoden in der Evaluation“ und „Professionalisierung“ haben dieses dynamische und hoch aktuelle Thema aufgegriffen und verschiedene Veranstaltungsformate dazu organisiert. Weitere Informationen finden sich hier.

Die Entwicklung von Künstlicher Intelligenz (KI) hat das Potenzial, den Berufsstand der Evaluation stark zu verändern. In der Evaluationsforschung ist das Thema aber gerade erst im Begriff, größere und regelmäßigere Aufmerksamkeit zu erlangen – unter anderem ausgelöst durch den Hype um Large Language Models wie den Text Roboter Chat GPT. In einer gemeinsamen Session „Alles ChatGPT oder was? – Chancen und Herausforderungen Künstlicher Intelligenz (KI) in der Evaluation“ setzten sich die beiden DeGEval-Arbeitskreise „Methoden in der Evaluation“ und „Professionalisierung“ mit den Chancen und Herausforderungen des Einsatzes von KI in der Evaluierungsarbeit und für Evaluierende auseinander.

Ausgehend von dem großen Interesse und positiven Feedback zur Session haben die Veranstalter:innen Alexander Kocks und Franziska Heinze vom AK Methoden sowie Jessica Prigge vom AK Professionalisierung entschieden, zu einem digitalen Follow-Up-Austausch am Dienstag, 28.11.2023 um 17:00 bis 18:30 Uhr einzuladen. Alle Interessierten – auch diejenigen, die nicht an der Session teilnehmen konnten – sind herzlich willkommen, weiter über das Thema zu diskutieren! Beim ersten Treffen soll ausgelotet werden, wie weitere Formen des Austausches (z. B. Diskussionsforen), der Information (z. B. über Einblicke in die Arbeit mit KI; Erfahrungsberichte) und Zusammenarbeit (z. B. zur Frage von Leitlinien im Umgang mit KI in der Evaluation) aussehen und organisiert werden können. Interessierte melden sich gern bis zum 24.11.2023 unter der E-Mail-Adresse ak-methoden@degeval.org, um einen Zugangslink zu erhalten.

Für diejenigen, die nicht bei der Session dabei sein konnten, findet sich untenstehend eine Zusammenfassung über Inhalte und Diskussionen sowie die offizielle Sessiondokumentation:

Session: „Alles ChatGPT oder was? – Chancen und Herausforderungen Künstlicher Intelligenz (KI) in der Evaluation“ auf der DeGEval-Jahrestagung 2023

Mit einem Kurzinput wurde in der sehr gut besuchten Session (90 Teilnehmende) zunächst ein gemeinsames Verständnis darüber hergestellt, was unter KI zu verstehen ist und reflektiert, wie und unter welchen Bedingungen KI in der Evaluation zur Anwendung kommen kann. In seinem Impulsvortrag „Künstliche Intelligenz (KI) in der Evaluierungspraxis – von der technologischen Revolution in den Arbeitsalltag“ beleuchtete Kai Rompczyk, Deutsches Evaluierungsinstitut für Entwicklungszusammenarbeit (DEval), die jüngsten Fortschritte in dem Bereich KI, insbesondere die Entwicklungen von Sprachmodellen wie ChatGPT. Mit der Erfindung des Prinzips autonom lernender und handelnder KIs, gesteigerter Rechenleistung und Datenverfügbarkeit (Big Data) sowie sinkender technischer Kosten ist die Implementierung von KIs in unterschiedlichsten Anwendungsbereichen möglich geworden und verbreitet sich rasant. In immer mehr Teilbereichen übersteigen die KIs dabei die Kompetenzen von Menschen. Rompczyk demonstrierte die Nutzungsmöglichkeiten von KIs anhand von Beispielen wie automatisierte Aufbereitung von Evidenz, Qualitätssicherung oder Durchführung von statistischen Analysen (z. B. Regressionsanalysen). Dabei machte er deutlich, dass der Einsatz von KIs in allen Evaluierungsphasen nützlich sein kann. Ein großer Mehrwert bestehe darin, dass KIs unzählige Iterationen von analytischen Aufgaben aus unterschiedlichsten Perspektiven durchführen können. Abschließend wies er auf die Risiken der KI in der Evaluierungspraxis hin. Er betonte die wachsende Spannung zwischen Big Data und Datenschutz und fragte, ob die aktuellen Methoden zum Schutz sensibler Daten noch ausreichend sind. Er warnte vor Verzerrungen und Vorurteilen, die durch die Trainingsdaten entstehen können, und der Gefahr der Intransparenz durch die Blackbox-Natur vieler KI-Modelle. Rompczyk sprach auch die Herausforderungen an, die sich aus scheinbar menschlichen Kompetenzen mit nichtmenschlichen Fehlern ergeben, und die potenzielle Erosion des Vertrauens in etablierte Wissensnetzwerke durch den Einsatz von KI-Technologien wie Deepfakes. Er betonte schließlich die Notwendigkeit, bei der Verwendung von KIs in der Evaluierungspraxis die Einhaltung von Evaluierungsstandards zu überprüfen.

Davon ausgehend ermöglichte die Session einen strukturierten Austausch in Kleingruppen zu Chancen und Risiken des Einsatzes der Technologien mit Blick auf zentrale Evaluationsstandards (Nützlichkeit, Durchführbarkeit, Fairness und Genauigkeit) sowie zur Frage, was der Einsatz von KI für unsere Professionalität und weitere Professionalisierung als Evaluierende bedeutet. Die Ergebnisse wurden anschließend im Plenum zusammengetragen:

Zahlreiche Chancen und Potenziale von KI wurden genannt. Angesichts voranschreitender technischer Entwicklungen und sich zunehmend verbessernden Leistungen von KI-Lösungen wurden viele Vorteile mit Bezug zu Nützlichkeitsstandards gesehen (z. B. Berichterstattung, umfangreichere Datenanalysen, Rechtzeitigkeit). Weitere Potenziale wurden hinsichtlich der systematischen (Fehler-)Überprüfung und Genauigkeit von Datenauswertungen, bezogen auf Automatisierungs- und damit einhergehende Kostenvorteile oder in Bezug auf Möglichkeiten der systematischen Anonymisierung oder Zugänglichkeit von Evaluationsergebnissen (Fairnessstandards) betont.

Herausforderungen von KI wurden z.T. sehr grundsätzlich diskutiert, ohne dass bereits Lösungen gefunden worden wären. Dies betrifft beispielsweise das Verhältnis von menschlicher und Algorithmen-basierter Erkenntnis oder im Anschluss an den Kurzinput die mit der Anwendung von KI einhergehende Intransparenz, die zur Einschränkung des Datenschutzes und der Nachvollziehbarkeit von Ergebnissen führen kann.

Für den Umgang mit den benannten Herausforderungen wurden erste Lösungen vorgeschlagen, die sich vor allem auf Weiterbildungs- und Schulungsbedarfe, Erfahrungsaustausch, technische Lösungen (z. B. lokales Hosting) oder die Verständigung auf die Gültigkeit von Evaluationsstandards (Transparenz, Datenschutz, Möglichkeiten und Limitationen der Technologien kennen) bezogen.

Im Hinblick auf die Evaluation als Profession wurden Folgen für das Berufsfeld antizipiert, beispielsweise Risiken in der „Wegrationalisierung“ menschlicher Arbeit, sinkende Kompetenzen und Glaubwürdigkeit von Evaluierenden oder eine Stärkung größerer Evaluierungsinstitutionen. Außerdem wurden Bedarfe der Fort- und Weiterbildung in Evaluation formuliert, einerseits zur konkreten Anwendung (wie Prompts schreiben), andererseits wird ein reflexiver Umgang mit KI eingefordert (z. B. „Fehlerquellen antizipieren“) und sie dabei auch selbst zum Evaluationsgegenstand gemacht.

Gemeinsam wurde ausblickend der Frage nachgegangen, was es braucht, um Evaluation bzw. Evaluierende im Umgang mit Chancen und Herausforderungen von KI zu stärken. Vorschläge gingen einerseits in die Richtung, Erfahrungsaustausch zu stärken und zu fördern, eine Ad-hoc-Gruppe einzurichten sowie vor allem die (Selbst-)Vergewisserung im Umgang mit Ansprüchen der Evaluationsstandards im Hinblick auf Chancen, Herausforderungen und Professionalisierungsanforderungen zu stärken.

Aktuelles

im AK Methoden in der Evaluation

Tagung 2025 des AK Methoden: "Best credible und nützlich" - Methodische Qualität, Nützlichkeit und Nutzung von Evaluationen

Treffen des Arbeitskreises

Aktivitäten rund um das Thema Künstliche Intelligenz in der Evaluation

Einladung zu einem Follow-up-Austausch zum Thema Künstliche Intelligenz in der Evaluation