Von Büchern über Zeitungsartikel, Webseiten bis zu sozialen Medien: Texte sind auch heute noch eine der wichtigsten Formen, um zu kommunizieren und Wissen zu vermitteln. Doch wie findet man in der schier unendlichen Masse an Text und Daten klare wissenschaftliche Aussagen? Ohne den Einsatz von Computerprogrammen wäre diese Aufgabe undenkbar. Eine bewährte Methode ist dabei die Qualitative Analyse, bei der Inhalte codiert werden. Was kompliziert klingt, ist im Grunde eine Sortierung von Daten und Informationen nach Themen oder Ideen. So lassen sich Zusammenhänge einfacher erkennen.
Die Entwicklung generativer KI-Systeme könnte in diesem Bereich zu einem Paradigmenwechsel führen, ist Susanne Friese überzeugt. Seit über 30 Jahren betreibt die Forscherin qualitative Forschung mit vielfältiger Software u.a. am Max-Planck-Institut zur Erforschung Multireligiöser und Multiethnischer Gesellschaften in Göttingen.
KI in der qualitativen Forschung
Anlässlich der Zehnjahres-Feier des Grazer Methodenkompetenzzentrums berichtet Friese von ihren Erfahrungen mit KI-gestützter Forschung – was möglich ist und was nicht. „Als die ersten Versionen von ChatGPT aufkamen, habe ich wie viele andere versucht, das System zum Kodieren zu verwenden“, sagt Friese. „Das hat überhaupt nicht so funktioniert, wie es versprochen war.“ Ein Codieren von Inhalten durch eine generative KI sei ohne menschliches Eingreifen nicht möglich. „Die Systeme können eigenständig keinen Kontext erkennen.“
Das war für die Forscherin allerdings kein Grund, aufzugeben. „Wir müssen die Analyse neu denken, die Methode erweitern.“ Dafür hat sich Friese mit einem Team aus AI-Spezialisten zusammengetan und entwickelt ein interaktives KI-System für die Analyse von qualitativen Daten. „Statt Informationen stundenlang zu codieren, könnten wir bald eine KI fragen: Was verraten diese Daten?“ Erste Tests des Modells finden bereits statt.
Datenschutz und einheitliche Standards
Doch welches KI-System man in der Forschung verwenden kann, ist nur eine von vielen Fragen, denen man sich in diesem Kontext stellen muss. „Es existieren bisher keine Standards zur transparenten Offenlegung des Einsatzes von KI und deren Anwendungsbereiche.“
Abseits dessen gäbe es große Probleme mit dem Datenschutz. Die derzeit führenden Modelle, sämtlich aus den USA, sind nicht quellenoffen. Doch Friese ist optimistisch: „Open-Source-Systeme und Entwicklungen aus Europa mögen momentan zurückliegen, doch ihre Zeit wird kommen.“ Dann könne man auch diese kritischen Fragen lösen.
Ob die Wissenschaft bereits heute dafür bereit ist, erfahren Sie am 16. April 2024 um 17 Uhr im Conference Deck im Unicorn.
https://grazer-methodenkompetenzzentrum.uni-graz.at/de/10-jahre-gmz/