Neue digitale Technologien werden immer wieder auf ihre Anwendbarkeit bzw. Einsetzbarkeit im Rahmen sozialwissenschaftlicher Untersuchungen hin untersucht. Hierbei sind unseres Erachtens zwei Strömungen zu unterscheiden, die nicht immer ganz trennscharf sind: (1) Wie können mittels neuer digitaler Technologien neue Messverfahren entwickelt oder bestehende Messverfahren optimiert werden, um mit ihnen Primärdatenerhebungen durchzuführen? (2) Lassen sich Daten, die aufgrund neuer digitaler Technologien ohnehin vorhanden sind (z. B. Prozessdaten), für sozialwissenschaftliche Analysen nutzen (Stichwort: Big Data) oder lassen sich Daten mittels neuer, auf Künstliche Intelligenz (KI) gestützter Verfahren synthetisch generieren (Stichwort: synthetische Daten und digitale Zwillinge)? Durch den enormen Erfolg und die rasante Verbreitung von KI – insbesondere im Hinblick auf die Verarbeitung natürlicher Sprache – wird auch diese zunehmend zum Gegenstand der oben skizzierten Untersuchungen. Hinsichtlich der zweiten Strömung werden vor allem Fragen aufgeworfen, ob überhaupt noch Menschen befragt werden müssen oder ob synthetische Daten ausreichen. Aktuell findet diese Diskussion vor allem in der Marktforschung statt. Im Rahmen sozialwissenschaftlicher Studien finden sich eher Ansätze der Datenanalyse und des Datenmatchings, wobei auch hier mitunter Sekundärdaten berücksichtigt werden. Wir gehen jedoch davon aus, dass für sozialwissenschaftlich fundierte Analysen noch immer Menschen befragt werden müssen. Denn gerade bei schnellen gesellschaftlichen Veränderungen stoßen synthetisch generierte Daten an Grenzen, da entsprechende Trainingsdaten fehlen, um derartige Veränderungen modellieren zu können.
Einsatzmöglichkeiten von KI in Befragungen
Im Rahmen der ersten oben skizzierten Strömung – auf die sich dieser Artikel auch fokussiert – finden sich vor allem Fragestellungen dazu, wie klassische Interviews künftig durch KI geführt bzw. assistiert werden können. Die Relevanz dieser Thematik zeigt sich auch im jüngst von der Deutschen Forschungsgemeinschaft gegründeten Schwerpunktprogramm „New Data Spaces for the Social Sciences“. Doch können Interviews von KI geführt werden? Das haben bereits erste Studien aus den USA und Peru in telefonischen Befragungen bewiesen. Einfache und kurze Befragungen können durchaus von KI realisiert werden. Dabei wird auf sogenannte große Sprachmodelle (Large Language Models), Spracherkennungssysteme (Speech-to-Text) und Systeme der Sprachsynthese (Text-to-Speech) gesetzt, die im Zusammenspiel telefonische Befragungen durchführen können.
Doch warum eigentlich?
Wieso aber soll an dieser Stelle der menschliche Interviewer durch KI ersetzt werden? Dahinter liegen vor allem Argumente zur Effizienz und Effektivität von Datenerhebungsprozessen. Beide Aspekte lassen sich dabei häufig nur schwer voneinander trennen. So können Interviewende von spezifischen und zeitaufwendigen Aufgaben entlastet werden, wodurch auch Geld gespart werden kann. Gleichzeitig können sich Interviewende auf den Kern ihrer Aufgabe konzentrieren, wodurch die Qualität gesteigert werden kann. Wenn beispielsweise die zum Teil äußerst aufwendige Kontaktierung in telefonischen Studien in entsprechender Qualität durch KI realisiert wird, könnten sich die Interviewenden auf die tatsächliche Interviewführung konzentrieren. Darüber hinaus kann KI in spezifischen Studien, beispielsweise bei Verhaltensbeobachtungen, Dinge identifizieren, die durch Menschen nur schwer oder gar nicht wahrgenommen werden. Ebenso gibt es verschiedene Hypothesen zur Offenheit und Ehrlichkeit bei KI-gestützten Befragungen. So wird davon ausgegangen, dass die Tendenz der sozialen Erwünschtheit von Antworten bei KI geringer ist als bei einem menschlichen Interviewenden. Darüber hinaus ist auch der Einsatz von KI in selbstadministrierten Befragungen als Assistenzsystem oder Chatbot denkbar, um die Datenqualität zu erhöhen und die Befragung für die Teilnehmenden angenehmer und einfacher zu gestalten. Dadurch können gegebenenfalls Populationen für Onlinebefragungen gewonnen werden, die bislang andere Modes präferieren. Diese Anrisse zeigen das Spektrum der damit einhergehenden methodologischen Forschungsfragen.
Akzeptanz seitens der Befragten
Neben diesen Fragen der Implementierung und Durchführung stellen sich auf der anderen Seite auch Fragen der Akzeptanz von KI-gestützten Interviews in der jeweiligen Grundgesamtheit: Können KI-gestützte Interviews in einem laufenden Panel neu eingeführt werden und wenn ja, bei welchen Zielgruppen? Können auch Erstbefragungen direkt unter Einsatz dieser Technologie realisiert werden? Auch hier stellt sich die Frage der geeigneten Zielgruppen. Und sollte dabei jeweils die Kontaktierung durch einen Menschen oder eine KI erfolgen? Ist die Kontaktierung durch KI überhaupt zielführend? Kann KI – sofern diese einen Kontakt herstellen kann – auch die Einwandbehandlung übernehmen? Genau dieser Aspekt ist im Rahmen der Kontaktierung ein Schlüsselthema. Oder muss die Kontaktierung weiterhin durch Menschen erfolgen, aber das Interview, also die standardisierte Befragung, kann dann durch eine KI geführt werden? Ist die KI im Sinne der Standardisierung menschlichen Interviewenden gegenüber überlegen? Wie sieht das aber bei komplexeren Befragungen aus? So müssen Interviewende beispielsweise bei der Erfassung komplexer Lebensverläufe mitdenken, sich Dinge merken und stellenweise von der Standardisierung abweichen, um die Befragung für die Teilnehmenden so angenehm wie möglich zu gestalten. Die Kunst liegt hierbei in der richtigen Balance von Standardisierung und Flexibilisierung, die je Interview neu auszuloten ist. Bei solchen komplexen Anforderungen an die Datenerhebung sind viel Erfahrung und Fingerspitzengefühl gefordert. Und genau hier stellt sich die Frage, ob KI diese Aufgabe auch bewältigen kann und wenn ja, mit welcher Qualität.

Ausblick
Einige dieser Fragen wollen wir in künftigen Studien und Experimenten genauer unter die Lupe nehmen. Dabei spielen auch noch einige technische Fragen eine Rolle, da KI-Anwendungen so in den Erhebungsprozess integriert werden müssen, dass alle bisherigen Prozesse auch weiterhin funktionieren. Denn auch KI-gestützte Interviews werden sicherlich im Rahmen verschiedener Mixed-Mode-Designs zum Einsatz kommen. Erste Erfahrungen müssen bei Erfolg anschließend in systematische Prozessketten überführt werden, wobei selbstverständlich auch ein Blick auf die Kosten erfolgen soll. Auch ethische und datenschutzrechtliche Fragen bezüglich der Transparenz der Algorithmen sollen berücksichtigt werden. Letztendlich hängt der Erfolg von KI-gestützten Befragungen aber auch von der Akzeptanz der Befragungspersonen ab. Diese kann durch die fortschreitende Entwicklung der für die Kontaktierung und Befragung verwendeten KI gesteigert werden, ist aber auch von den persönlichen Merkmalen und Präferenzen der Zielpersonen abhängig, die es ebenso zu untersuchen gilt. Eine aktuelle Umfrage des Digitalverbands Bitkom zeigt, dass im Jahr 2025 bereits zwei Drittel der deutschen Bevölkerung KI-Anwendungen benutzen. Diejenigen Befragten, die KI nicht nutzen, führen vor allem fehlendes Vertrauen, kein Interesse und fehlende Kenntnisse als Gründe für die Nicht-Nutzung an. Während diese Statistiken sowohl eine grundsätzliche Akzeptanz als auch nicht zu vernachlässigende Skepsis gegenüber KI aufzeigen, ist besonders zu beachten, dass sich die Einsatzmöglichkeiten von KI im Kontext sozialwissenschaftlicher Datenerhebung grundlegend von der KI-Nutzung im privaten oder beruflichen Alltag unterscheiden. Vor diesem Hintergrund planen wir gerade ein eigenes Methodenexperiment für telefonische Interviews, bei dem wir in einem ersten Schritt vor allem unsere Hypothese prüfen wollen, dass die Interviewqualität dadurch gesteigert wird, dass KI das Interview und nicht das Kontaktgespräch übernimmt. Dafür soll eine Telefonstichprobe nach dem ADM-Dual-Frame-Verfahren von Interviewenden kontaktiert werden. Die Durchführung des Interviews wird anschließend im Experimental-Split für eine Hälfte der Stichprobe von der KI übernommen, während die andere Hälfte von den Interviewenden befragt wird. Wir nutzen also die Interviewenden als eine Art „Broker“ ins KI-gestützte Interview und vergleichen diese Treatmentgruppe mit der von Telefoninterviewenden befragten Kontrollgruppe. So kann einerseits die Akzeptanz von KI-gestützten Interviews im Rahmen einer telefonischen Erstbefragung untersucht werden. Andererseits kann durch den für beide Gruppen identischen Fragebogen die Datenqualität verglichen werden. Dafür werden verschiedene Fragetypen verwendet, um auch die Möglichkeiten und Grenzen der KI-gestützten Befragung auszuloten. Darüber hinaus soll der Fragebogen inhaltlich Auskunft darüber geben, ob bestimmte Personengruppen häufiger oder seltener in das KI-gestützte Interview einwilligen als in das klassische Telefoninterview mit menschlichen Interviewenden. Dabei achten wir insbesondere auf die Online-Affinität, die Erfahrung im Umgang mit KI sowie auf soziodemografische Merkmale der Befragten. Aufbauend auf den Ergebnissen sollen dann weitere Experimente durchgeführt werden, wobei auch angedacht ist, andere Stichproben einzubeziehen.
Zum Weiterlesen:
Bitkom e.V. (2025): KI-Nutzung boomt – aber die Angst vor Abhängigkeit im Ausland ist groß.
Lang, M., Eskenazi, S. (in Vorbereitung): Telephone Surveys Meet Conversational AI: Evaluating a LLM-Based Telephone Survey System at Scale.
Leybzon, D., Tirumula, S., et al. (in Vorbereitung): AI Telephone Surveying: Automating Quantitative Data Collection with an AI Interviewer.
Wolbring, T., Leitgöb, H., Faulbaum, F. (Hg.) (2021): Sozialwissenschaftliche Datenerhebung im digitalen Zeitalter. Springer Fachmedien, Wiesbaden.
Dieser Beitrag wurde zuerst in Lagemaß 15 „Wandel“ veröffentlicht.