Check your Government: Auf der Suche nach Mustern und Ausreißern

Mehr als 2300 Verbände sind im Register des Bundestages verzeichnet. Doch wie deren Interessenvertreter Einfluss auf die Politik nehmen, ist nicht ersichtlich. Wissenschaftler und Journalisten könnten Licht ins Dunkel bringen - und dabei nicht nur etwas über Lobbyismus, sondern auch über ihre unterschiedlichen Arbeitskulturen lernen.

Welchen Weg ein Gesetz von der Idee bis zum Inkrafttreten nimmt, wissen vermutlich nur die wenigsten Bürger. Noch unklarer ist, an welcher Stelle im Gesetzgebungsprozess Lobbyisten Einfluss nehmen. 

Genau hier wollte das Projekt "Check your Government" mehr Transparenz schaffen und herausfinden, welche Lobbyisten angehört werden, während über ein Gesetz diskutiert wird.

Ein Team von Informatikern um Lutz Maicher vom Fraunhofer-Zentrum für Internationales Management und Wissensökonomie (IMW) konzentrierte sich auf die Beschaffung und Verarbeitung von Daten, während ein Team von Tagesspiegel-Redakteuren aus Politik, Wirtschaft und Wissenschaft — koordiniert von Datenjournalist Hendrik Lehmann — Datenquellen recherchierte, bewertete und die gefundenen Informationen inhaltlich einordnete.

"Als Grundlage haben wir Daten herangezogen, die bereits öffentlich verfügbar sind und die wir automatisiert sammeln können", sagt Maicher, Projektleiter am Fraunhofer IMW. "Das sind Dokumente aus dem Dokumentations- und Informationssystem des Bundestages, Ausschussprotokolle, Tagesordnungen, aber auch Social-Media-Aktivitäten von Abgeordneten. Weiterhin haben wir das Verbandsregister des Bundestages einbezogen. Das wird permanent aktualisiert und legt offen, wer als Interessenvertreter in Berlin präsent ist."&nb

Verbindungen und Grenzen ziehen

Diese Liste mit Lobbyisten-Namen wurde als Referenz herangezogen —  jedes neue Ausschussprotokoll und jede Tagesordnung wurde mit der Lobby-Liste abgeglichen und ein Zusammenhang hergestellt: In welchen Dokumenten tauchten die Namen von Lobbyisten im Kontext mit welchen Politikern auf?

"Wir konnten so beispielsweise sehen, dass Personen, die im Verbandsregister als Vertreter eines bestimmten Verbandes auftauchen, auch in Tagesordnungen von Expertenanhörungen erscheinen. Allerdings als vortragende Hochschullehrer einer bestimmten Hochschule - ohne Kennzeichnung, dass sie gleichzeitig für einen Verband arbeiten", sagt Maicher.

Aber nicht alle Personen, die zu einer Ausschusssitzung geladen sind oder in einer Tagesordnung auftauchen, werden auch namentlich im Verbandsregister erfasst. Neben der automatisierten Sortierung blieb auch viel Rechercheaufwand übrig, um mutmaßliche Lobbyisten ihren Verbänden zuzuordnen – oder ganz auszusortieren. Maicher: "Da sitzt dann eine wissenschaftliche Hilfskraft, die in der Benutzeroberfläche unseres Tools für jede noch nicht kategorisierte Person 'ja' oder 'nein' anklicken muss, um sie gegebenenfalls als Interessensvertreter zu kennzeichnen. Alle erfassten Dokumente so einzuordnen ist etwas, das man aufgrund des hohen Zeitaufwandes nur im Rahmen dieses Forschungsprojektes machen konnte. Inzwischen ist es so, dass pro Woche durchschnittlich rund 40 neue Dokumente hinzukommen, die man in weniger als einer halben Stunde einsortieren kann", sagt Maicher. 

Auf einer weiteren Analyse-Ebene wurden die Interessensvertreter mit inhaltlichen Schlagworten assoziiert: Womit befassen sich die Dokumente, in denen Interessensvertreter genannt sind, und welche Politiker sind mit denselben Dokumenten verbunden? "Wir können anhand unserer Daten sagen: In diesem Feld war ein Politiker besonders aktiv, wenn man ihn mit der Gesamtheit aller Politiker vergleicht", so Maicher. "In den Daten, die wir derzeit haben, können wir natürlich keine echten Treffen zwischen Politikern und Interessensvertretern nachweisen — wir können lediglich belegen, dass sie in demselben Ausschuss saßen."

Öffentliche Daten, die aber nicht offen sind

Die Daten überhaupt in ein maschinell lesbares Format zu bringen, ist ein Kernelement des Projektes. "Es ist sehr spannend, wie vermeintlich öffentliche Daten in Deutschland öffentlich verfügbar gemacht werden. Das Verbänderegister soll ja Transparenz schaffen. Aber es ist als zweispaltiges pdf-Dokument veröffentlicht, das offensichtlich automatisch generiert wird. Also basiert es sehr wahrscheinlich auf einer Datenbank dahinter. Aber anstatt direkt Zugang dazu zu gewähren, werden die Daten in ein umständlich verarbeitbares pdf-Dokument umgewandelt und das wird dann veröffentlicht", kritisiert Maicher. Denn in einer Excel-Tabelle könnte ein Computer schnell erkennen, welche Elemente in den Zeilen und Spalten vorhanden sind. Aber ein pdf ist für einen Computer eher wie ein Bild, in dem er zunächst keine Muster erkennen kann. Damit der Computer die pdf-Informationen trotzdem lesen kann, muss das Bild eines Buchstabens erst in einen tatsächlichen Buchstaben gewandelt werden.

Um dennoch mit den Daten arbeiten zu können, hat sein Team einen bestehenden Scraper erweitert, der die pdfs sammelt, sobald sie veröffentlicht sind und die Informationen daraus wieder in ein maschinenlesbares Format zurückverarbeitet. "Das passiert wöchentlich, sodass wir langfristig auch sehen können, wer neu im Geschäft ist. Das hat eine ganz schöne Dynamik, welche Leute und Verbände hinzukommen — das hatten wir am Anfang so gar nicht gedacht."

Doch nicht alle Daten, die für die Fragestellung nach Lobbyismus im Gesetzgebungsprozess interessant wären, sind überhaupt verfügbar. Die für "Check your Government" herangezogenen Dokumente beziehen sich auf ein eher spätes Stadium in diesem Prozess — wenn sie bereits in Ausschüssen diskutiert werden. Doch auch schon vor diesem Stadium können Lobbyisten Einfluss nehmen. Zu untersuchen, wie sich die Entwürfe von Gesetzesvorlagen ändern, bevor sie überhaupt in einem Ausschuss vorgelegt werden, könnte noch aussagekräftiger sein. Der Tagesspiegel arbeitet daran, Auskunftsrechte geltend zu machen, um so an diese Vorläufer-Versionen einer Gesetzesvorlage zu gelangen.

"Sollte das gelingen, könnte man die Techniken, die wir im Projekt angewandt haben, auf diese neuen Dokumente ausweiten", so Maicher.

"Check your Government" zur Stärkung von Journalisten und Bürgern

Die gesammelten Daten sind für die Tagesspiegel-Journalisten über ein Dashboard zugänglich: Es zeigt, welche Informationen zu einem Thema, einem Politiker oder einem Interessensvertreter vorliegen und worüber sie zusammenhängen. "Das Tool selbst bearbeitet die Daten wenig, sondern zeigt, welche Daten vorhanden sind und macht diese einfach zugänglich", sagt Maicher. Journalisten können sich die Daten dann zum Beispiel als csv-Datei herunterladen, mit eigenen Tools weiterverarbeiten, sie visualisieren oder auf deren Basis weiter recherchieren.

Ein erstes Resultat aus den "Check your Government"-Daten ist die Geschichte "Lobbylandschaft", deren Kernstück eine Deutschlandkarte der Verbände ist. Dafür hat das Team die Adressen der Interessensvertreter aus dem Verbänderegister des Deutschen Bundestags geografisch aufbereitet: So kann jeder Nutzer nachschauen, welcher Verband bei ihm um die Ecke ist. 

"Das Ziel von Datenjournalismus ist für mich eine Stärkung von Journalismus auf zwei Arten. Zum einen werden mit datengetriebenen Methoden neue Recherche-Ansätze möglich, die eine neue Nachrichtenqualität schaffen. Zum anderen können wir Leser noch stärker in die Lage versetzen, mitzumachen", sagt Lehmann. "Viele lesen Tageszeitungen, damit sie mitreden können, nicht nur am Stammtisch, sondern auch bei der nächsten Wahl. Und ich glaube, dass Themen heute zwar komplexer sind, die Menschen aber immer noch genauso mitsprechen wollen. Wir können sie dabei unterstützen, wenn wir ihnen einen Zugang zu neuen Fakten geben und sie sich zusätzlich in den Visualisierungen selber bewegen können. Wir bieten Ihnen zwar einen Weg durch die Daten an, aber sie können auch ihren eigenen wählen.&qu

Wissenschaftler suchen Muster, Journalisten die Ausreißer

Auf einer Meta-Ebene zeigt das Projekt "Check your Government" wie sich mit den Techniken der Big-Data-Forscher neue Recherche-Ansätze für Journalisten finden lassen. Die Wissenschaft als Sparringspartner für den Journalismus sozusagen. Zu diesem Punkt zu gelangen, war für beide Seiten aber ein langer Weg, denn sie kommen aus unterschiedlichen Richtungen. "Die Wissenschaftler möchten Evidenz finden für einen bestimmten Zusammenhang, der allgemeingültig ist. Für den Journalisten ist aber mindestens genauso interessant, Ausnahmen zu finden, wo es sich also lohnt weiter zu recherchieren. Es hat eine Weile gedauert, bis uns dieser kulturelle Unterschied klar war", sagt Maicher.

Lehmann erklärt die Arbeitsweise so: "Uns beim Tagesspiegel ist der Datenjournalismus sehr wichtig. Deswegen ist das Projekt direkt an der Chefredaktion angebunden, Ingrid Müller ist unser Supervisor. Wir haben versucht, verschiedene Kollegen mit in das Projekt einzubinden. Unseren Rechtsexperten Jost Müller-Neuhof genauso wie Politikjournalisten, Rechercheabteilung und Newsroom. So konnten wir mehr Expertise einbringen. Und alle können zusammen lernen, was möglich ist und was nicht. Das hat gut geklappt. Die Wissenschaftler vom Fraunhofer Institut sind uns da weit entgegengekommen und haben versucht unsere Logik anzunehmen", weiß Lehmann. "Trotzdem haben sie andere Abläufe. Wir denken in Geschichten, die sich veröffentlichen lassen. Deswegen hoffen wir natürlich möglichst schnell auf Ergebnisse. Wissenschaftler denken oft in Forschungsprojekten, die sich über Jahre hinziehen können. Da geht man Sachen grundsätzlicher und präziser an, was gut ist. Aber trotzdem muss man den richtigen Mittelweg finden, der wissenschaftlich korrekt ist, aber auch zeitnah genug Ergebnisse liefert, sodass sie journalistisch relevant bleiben." 

Gianna Grün

Projektinformationen zu "Check Your Government"

Hauptantragsteller:

Lutz Maicher, Fraunhofer-Zentrum für Internationales Management und Wissensökonomie, Leipzig
Hendrik Lehmann, Datenjournalist, Der Tagesspiegel

Publikationen

Der Tagesspiegel vom 2. Juli 2016, Autor: Hendrik Lehmann
Berlin, öffne dich. Trotz des neuen eGovernment-Gesetzes hakt es in der Hauptstadt mit der Bereitstellung von Open Data

Der Tagesspiegel vom 4. August 2017, Autor: Hendrik Lehmann
Wie es euch gefällt – Ab dem Wochenende werden die Straßen Berlins voller Plakate hängen. Der Wahlkampf wird offiziell eingeläutet. Im Netz läuft er schon längst. Wie sind die Parteien online aufgestellt?