An dieser Stelle entsteht die öffentliche Dokumentation für Epigraf 5. Diese Seite ist noch in Bearbeitung.

Was ist eine Inhaltsanalyse?

Quantitative und qualitative Inhaltsanalysen

In vielen Disziplinen geht es darum, von Kommunikationsinhalten auf gesellschaftliche Phänomene zu schließen. Beispielsweise werden in der Kommunikationswissenschaft die Inhalte auf Social-Media-Plattformen untersucht, um etwas über die Organisationsweise von Sozialen Bewegungen wie Fridays for Future zu lernen. Oder es wird die Berichterstattung untersucht, um journalistische Auswahlkriterien zu erschließen. Dazu werden nicht direkt messbare theoretische Konstrukte definiert, die dann über textliche Indikatoren operationalisiert werden: „Die Inhaltsanalyse ist eine Methode zur Erhebung sozialer Wirklichkeit, bei der von Merkmalen eines manifesten Textes auf Merkmale eines nicht-manifesten Kontextes geschlossen wird“ (Merten 1995: 59). 

Praktisch werden dazu konkrete Textstellen wie "Danke Anke!" in einem Social-Media-Post zu theoretischen Kategorien wie "Sprechakt Bedanken" zugeordnet, dieser Vorgang wird als Kodieren bezeichnet. Bei einer qualitativen Inhaltsanalyse entstehen die Kategorien meistens erst während der Analyse des Materials (Glaser & Strauß 1980; Kuckartz 2012; Mayring 1995). Nachdem alle relevanten Textstellen einer Kategorie zugeordnet wurden, kann das Material zum Beispiel entlang der Kategorien zusammengefasst werden. Bei der quantitativen Inhaltsanalyse geht es darum, die Häufigkeit der Kategorien auszuzählen (Früh 2017; Krippendorff  2013). Nicht immer werden konkrete Textstellen kodiert, sondern mitunter komplette Social-Media-Posts oder ganze Zeitungsartikel einer Kategorie zugeordnet. Wenn etwa kodiert wird, ob wissenschaftliche Akteure in einem Zeitungsartikel erwähnt werden, lässt sich anschließend auszählen, inwiefern sich die Präsenz von Wissenschaft in der Berichterstattung im Zeitverlauf entwickelt.  

Die beiden Verfahren der quantitativen und der qualitativen Inhaltsanalyse unterscheiden sich unter anderem im Grad der Standardisierung: Erstere versuchen das Material auf wenige möglichst zuverlässig kodierbare (objektive, reliable) Kategorien zu reduzieren, letztere gehen interpretativ vor. Die Grenzen zwischen interpretativen und standardisierten Verfahren sind in der Praxis allerdings fließend. Mit Epigraf kann Material sowohl für quantitative als auch qualitative Inhaltsanalysen kodiert werden. 

Inhaltsanalysen mit Epigraf

Fester Bestandtteil einer Inhaltsanalyse ist das Kodieren von Untersuchungseinheiten, also konkreten Textstellen oder Bildern, mit theoretische Kategorien. Epigraf hilft Ihnen dabei, erhobene Daten hochzuladen, Kategorien festzulegen und sie zu kodieren. Im Anschluss können Sie die Ergebnisse wieder in verschiedene Dateiformate exportieren. 

Für jedes Forschungsvorhaben wird eine Datenbank angelegt, welche wiederum eines oder mehrere Projekte beinhaltet. Jedes Projekt enthält Artikel - darin werden die Fälle erfasst. Für jede Untersuchungseinheit wird ein eigener Artikel angelegt. 

Was wird benötigt?

Zunächst lassen Sie sich von den Epigraf-Betreibern eine Datenbank anlegen und konfigurieren diese gemeinsam. Hinweise zu den administrativen Aufgaben finden unten im letzten Abschnitt sowie in der entsprechenden Hilfeseite. Von den Betreibern erhalten Sie auch die benötigten Zugangsdaten für Epigraf - zum Einloggen auf der Weboberfläche sowie zum Zugriff über die Programmierschnittstelle.

Der einfachste Weg, um Daten in Epigraf einzuspielen, ist die Importfunktion. Dazu bereiten Sie die erhobenen Daten am besten tabellarisch als CSV-Datei vor (Texte, Metadaten und Kategorien). Dazugehörige Bilddateien oder weitere Dokumente legen Sie in einem Ordner ab und beachten dabei die Konventionen für Dateinamen. Wichtig ist, dass diese Dateinamen bereits in den Tabellen aufgeführt werden. Alternativ können auch XML-Dokumente importiert werden. 

Die Konvertierung von den Originaldaten in das Epigraf-Importformat und den automatischen Import können Sie  mit dem epigraf-Package in R bzw. RStudio vornehmen. Das Package ist noch in Entwicklung, lassen Sie sich von den Epigraf-Betreibern dabei helfen.

Schritt für Schritt zur Inhaltsanalyse mit Epigraf 

1. Schritt: Import der Daten

Zunächst wird ein Projekt benötigt, in welchem Sie die Untersuchungseinheiten in einer Artikelliste abspeichern können. In Epigraf finden Sie unter dem Menüpunkt Projekte die Schaltfläche Create project. Darüber legen Sie ein Projekt mit einem Titel, Kurztitel und optional einer Projektbeschreibung an.

Vorbereiten der Artikel

Ihre erhobenen Textdaten und Bilder können Sie im Menüpunkt Artikel anlegen und bearbeiten. Um manuell einen neuen Artikel anzulegen, können sie über die Schaltfläche Create Article das Artikelfenster öffnen, wo Sie zunächst das entsprechende Projekt wählen und dann die Metadaten sowie Bild- und Textinhalte eingeben. Über die Schaltfläche Bearbeiten lassen sich die Artikel jederzeit verändern. Die Projektdaten können Sie jederzeit über die Schaltfläche Show articles einsehen. Um die Artikelliste übersichtlich zu halten bzw. zu ordnen, ist anzuraten, dass jeder Artikel eine Signatur erhält.

Mithilfe ihrer vorbereiteten Datentabellen können Sie auch sämtliche Artikel zusammen erstellen. Ihre Daten laden Sie zunächst als csv-Datei im Dateibereich der Datenbank hoch. Danach wählen Sie die Datei über die Schaltfläche Import aus und erzeugen damit eine Artikelliste. Der Import birgt auf diesem Wege den Vorteil, dass sich in einem Schritt sowohl die Artikel als auch ihre Abschnitte und deren Inhalt erstellen lassen. Auch die Kodierung, sollte sie bereits vorhanden sein, kann auf diesem Wege mit angegeben werden. 

Der Artikelimport erfolgt in drei Schritten, die im Folgenden genauer veranschaulicht werden. Theoretisch kann für jeden Schritt eine eigene csv-Dateien erstellt werden. Jedoch lassen sich die Schritte auch zusammen in einer Datei fassen, indem die auf jeder Ebene nicht verwendeten Spalten freigelassen werden. Weitere Hinweise zu den Tabellenfeldern finden Sie unter Datenmodell

Schritt 1: Artikel importieren

Diese Tabelle erzeugt einen leeren Artikel, welcher eine Signatur sowie einen Namen erhält und einem Projekt zugeordnet wird.

idsignaturenameprojects_id
articles/post/post-0001post-0001Testbildprojects/posts/ps1

 

Schritt 2: Abschnitte festlegen

Mit dieser Tabelle werden die zwei Abschnitte erstellt, die für die Inhaltsanalyse essentiell sind: Inhalt und Kodierung. Die Abschnitte erhalten jeweils eine eigene ID und werden mit dem jeweiligen Artikel verknüpft.

idnamesortnoarticles_id
sections/content/post-0001Inhalt1articles/post/post-0001
sections/codings/post-0001Kodierungen2articles/post/post-0001

 

Schritt 3: Inhalte einfügen

Auch die Inhalte erhalten ihre jeweils eigene ID. Die rechten Spalten verknüpfen sie mit dem Projekt, dem Artikel und dem Abschnitt. Jeder Inhalt hat einen Wert (content), Kategorien eine Zuordnung (properties_id); bei Bildern ist zusätzlich ein Verweis vonnöten (file_path und file_name).

idvaluecontentfile_pathfile_nameproperties_idsortnoprojects_idarticles_idsections_id
items/content/post-0001~content~1Eine ÜberschriftDer Textinhaltps1/post.0001testbild.png 1projects/posts/ps1articles/post/post-0001sections/content/post-0001
items/coding/post-0001~coding~1    properties/codes/emotion-nostalgia1projects/posts/ps1articles/post/post-0001sections/codings/post-0001

 

All-in-One-Tabelle

Alle drei Tabellen lassen sich in einer zusammenfügen und ergeben folgendes Ergebnis.

idsignaturenamevaluecontentfile_pathfile_nameproperties_idsortnoprojects_idarticles_idsections_id
articles/post/post-0001post-0001Testbild      projects/posts/ps1  
sections/content/post-0001 Inhalt     1projects/posts/ps1articles/post/post-0001 
sections/codings/post-0001 Kodierungen     2projects/posts/ps1articles/post/post-0001 
items/content/post-0001~content~1  Eine ÜberschriftDer Textinhaltps1/post.0001testbild.png 1projects/posts/ps1articles/post/post-0001sections/content/post-0001
items/coding/post-0001~coding~1      properties/codes/emotion-nostalgia1projects/posts/ps1articles/post/post-0001sections/codings/post-0001

In den Artikeln selbst werden zunächst nur die Dateinamen der Bilder verzeichnet, zum Beispiel ps1/post.0001/testbild.png. Um die Bilder auch anzeigen zu können, laden Sie diese im Dateibereich der Datenbank hoch. Alle artikelrelevanten Dateien sollten im Ordner articles landen. Es empfiehlt sich, dort Unterordner anzulegen, im Beispiel den Unterordner articles/ps1/post.0001. Einzelne Dateien hochzuladen ist einfach: sie können direkt per Drag&Drop in den Ordner gezogen werden. Um viele Dateien auf einmal hochzuladen, packen Sie diese vorher in eine zip-Datei, die dann nach dem Upload im Dateibereich entpackt werden kann.

 

Vorbereiten des Kategoriensystems

Die Kategorien, mithilfe derer Sie die Untersuchungsmerkmale kodieren, können Sie im Menüpunkt Kategorien nach Bedarf anlegen und bearbeiten. Sie sind stets in sogenannten "Kategoriesystemen" gegliedert, welche im Vorhinein von administrativer Seite aus in der Konfiguration angelegt werden. Achten Sie daher beim Erstellen der Kategorien auf die korrekte Zuordnung zum jeweiligen Kategoriesystem, welches oben links im grau hinterlegten Feld angezeigt wird. 

Bei einer quantitativen Inhaltsanalyse stehen die Kategorien in der Regel schon im Vorhinein fest. Sie werden daher vor den eigentlichen Daten angelegt bzw. importiert. Bei einer qualitativen Inhaltsanalyse fallen dagegen durchaus auch zwischendurch neue Beobachtungsmerkmale auf, die Sie nachträglich als Kategorie hinzufügen können. Die Kategorien müssen also nicht zwingend vor der Kodierung feststehen. 

Um einzelne Kategorien manuell hinzuzufügen, klicken Sie die Schaltfläche Create property. Neben der Bezeichnung geben Sie zusätzlich ein IRI-Fragment an, um die Kategorie auf der Datenebene identifizierbar zu machen. Kategorien können auch gestaffelt werden. Um eine Unterkategorien zu erstellen, wählen Sie zusätzlich unter "Quelle" die Elternkategorie aus. Das Löschen von Kategorien ist im Bearbeitungsmodus möglich. Ferner können über die Schaltfläche Merge zwei Kategorien miteinander verschmolzen werden. Die zuerst angeklickte "Source-Kategorie" wird dabei in die "Target-Kategorie" eingebunden und danach gelöscht.

 

Sie können die Kategorien auch zusammen in einer einzigen Tabelle hochladen. Klicken Sie dafür die Schaltfläche Import und wählen Sie die entsprechende csv-Datei aus, die Sie vorher im Dateibereich der Datenbank hochgeladen haben. Die Tabelle muss bestimmte Felder beinhalten, damit Epigraf die Daten erfolgreich abrufen kann. Das folgende Beispiel zeigt den Import der "Emotionen"-Kategorie und ihrer Unterkategorien "Nostalgie". Weitere Informationen finden Sie unter Datenmodell.

idparent_idlemma
properties/codes/emotions Emotionen
properties/codes/emotion-nostalgiaproperties/codes/emotionsNostalgie

 

2. Schritt: Kodierung des Materials

Für die Kodierung der Artikel gibt es generell zwei Wege. Allgemein können Sie bereits bei der Erstellung eines Artikels im Feld "Kodierung" eine oder mehrere Kategorien auswählen und mit Anmerkungen versehen. Gleichermaßen kann die Kodierung auch beim Import der Artikelliste schon in der csv-Datei enthalten sein.

Im Regelfall startet die Kodierung sämtlicher Artikel aber erst nach dem Upload. Datenimport und Kodierung sind also separiert. Dies bietet sich vor allem an, wenn mehrere Personen für die Kodierung zuständig sind. Nachdem Sie im Menüpunkt Artikel Ihre Artikelliste über das Ausklappmenü Projekte ausgewählt haben, können Sie die jeweiligen Einträge einzeln bearbeiten. Im Default-Modus müssen Sie die Schaltfläche Bearbeiten anwählen, um Ihre Kodierung vornehmen zu können und die Änderungen abzuspeichern. Um diesen Schritt zu erleichtern, aktivieren Sie den "Kodierungs-Modus" über die Schaltfläche Code. Dies öffnet automatisch sämtliche Artikel zur Bearbeitung, sodass nur noch das Speichern vonnöten ist. Möchten Sie mehrere Kategorien kodieren, können Sie über die graue Plus-Schaltfläche ein neues Feld einfügen.

 

3. Schritt: Export und Auswertung der Ergebnisse

Ihre Artikel können Sie bereits in Epigraf durch Sortierungsfunktionen ordnen und durchsuchen. Klicken Sie dazu die Zahnrad-Schaltfläche in der linken oberen Ecke der Artikelliste, um die gewünschten Spalten anzeigen zu lassen. Diese können dann auf- oder absteigend sortiert werden. Zur Analyse und Weiterverarbeitung mit externen Programmen erlaubt Epigraf den Export ihrer Daten in den Formaten CSV, XML und JSON. Wählen Sie dafür die zu exportierende Artikelliste aus und Klicken Sie unten rechts auf die Schaltfläche mit dem gewünschten Datenformat.

Beispiele für die Arbeit mit R

Sowohl für das Einspielen von Daten (Kategorien, Projekte, Artikel etc.) als auch deren Abfrage ist ein externer Zugriff über Skripte möglich. Per API lassen sich somit die Daten für statistische Auswertungen oder die Weiterverarbeitung mit anderen Programmen exportieren. Vorbereitend kann auch die Dateneingabe mithilfe von Skripten beschleunigt und in Teilen automatisiert werden. Die Programmiersprache R eignet sich dafür besonders, da sie auf effiziente Weise die Weiterverarbeitung und Auswertung der Daten mit komplexeren Visualisierungsmöglichkeiten verbindet. Das folgende R-Skript zeigt exemplarisch, wie Sie ihre Daten für den Import vorbereiten und schließlich nach Epigraf pushen können. Hinweise und Erklärungen finden Sie in den Kommentaren direkt im Skript. Für einige Aktionen benötigen Sie zusätzlich administrativen Zugriff auf die Epigraf-Konfiguration.

Bei der erstmaligen Anwendung ist die Installation des epigraf-packages per devtools::install_github("strohne/datavana/epigraf") vonnöten. Für die Verbindung zwischen Skript und Epigraf wird ferner ein Access-Token benötigt. Dieser wird im Regelfall wie ein persönliches Passwort gehandhabt und daher separat vom Skript in einer settings-Datei mit der Codezeile epigraf::api_setup("YOURDATABASE", "YOURACCESSTOKEN") gespeichert. 

1. Datenimport

#
# Preamble ----
#

# Packages laden
library(tidyverse)
library(readxl)
library(epigraf)

# Access-Token aktivieren
source("settings.R")

#
# Kategorien erzeugen ----
#

properties <- tribble(
  ~parent_id, ~id, ~lemma,
  NA, "properties/codes/emotions", "Emotionen",
  "properties/codes/emotions", "properties/codes/emotion-nostalgia","Nostalgie",
)

# Kategorien per API nach Epigraf pushen
api_patch(properties, "example")

#
# Leeres Projekt erzeugen ----
#

example_project <- data.frame(
  projects.id = "projects/posts/ex1",
  projects.name = "Example Project 1",
  projects.shortname = "ex_1"
)

# Projekt per API nach Epigraf pushen
api_patch_wide(example_empty_project,"example")


#
# Komplettes Projekt erzeugen ----
#

# Um ein komplettes Projekt, mit vollständiger Artikelliste, Abschnitten und Artikelinhalt zu erzeugen, 
# ist eine Tabelle mit folgenden Spalten erforderlich:

example_complete_project <- data.frame(
  projects.id = character(),       # ID des Projekts (z.B. "projects(posts/ps1")
  projects.name = character(),     # Bezeichnung des Projekts (z.B. "Probesample 1")
  projects.shortname = character(),# Kurztitel des Projekts (z.B. "ps1")
  
  iri = character(),               # IDs bzw. IRIs der Posts (z.B. "post-0001")
  
  sections.id = character(),       # ID des Abschnitts (z.B. "items/content/post-0001")
  sections.name = character(),     # Bezeichnung des Abschnitts (z.B. "Inhalt")
  
  articles.id = character(),       # ID der Artikel (z.B. "articles/post/post-0001")
  articles.name = character(),     # Bezeichnung der Artikel (z.B. "Testbild")
  articles.signature = numeric(),  # Nummer/Signatur der Artikel (z.B. "post-0001")
      
  file_path = character(),         # Speicherort der Bilder (z.B. "ps1/post.0001")
  file_name = character(),         # Dateiname der Bilder (z.B. "testbild.png")
  )

# Projekt per API nach Epigraf pushen
api_patch_wide(example_complete_project,"example")
  

2. Datenexport und Analyse

[...]

Administration

Die Konfiguration einer Epigraf-Datenbank ist Aufgabe von Administrator:innen. Sie steht vor dem Datenimport und der Kodierung an und muss den Kodierer:innen nicht zwingend bekannt sein.

Konfiguration des Domänenmodells

Epigraf lässt sich flexibel an den Untersuchungsgegenstand anpassen, indem die möglichen Projekte, Artikel, Abschnitte, Inhalte und Kategorien konfiguriert werden. Für den Einstieg empfiehlt es sich, mit einer vorbereiteten Konfiguration zu starten und diese dann schrittweise anzupassen:

  • Laden Sie sich eine vorbereitete Konfiguration herunter. Aktuell steht eine Konfiguration zur Auswahl:       
    Preset Bildkodierung.
  • Gehen Sie in Ihrer Datenbank in den Menüpunkt Types und laden Sie das Preset über den Import-Button hoch.

Die Konfiguration kann dann schrittweise ergänzt und ausgebaut werden. Unter dem Menüpunkt Types bearbeiten Sie die Typen oder legen über die Schaltfläche Add type neue Elemente an. Für jeden Typ sollten zunächst die folgenden Felder ausgefüllt werden:

  • Scope: Wählen Sie aus, was Sie konfigurieren wollen: ein Projekt (project), einen Artikel (article), einen Abschnitt (section), die Inhalte (items) oder die Kategoriensysteme (properties).
  • Name: Benennen Sie den Typ mit einem kurzen Begriff, in Kleinschreibung und ohne Leer- und Sonderzeichen. Dieser Name sollte später möglichst nicht mehr geändert werden.
  • Caption: Legen Sie fest, wie der Typ in Epigraf bezeichnet werden soll. Hier können Sie beliebige Zeichen verwenden und die Beschriftung auch später noch verändern.
  • Config: In den Einstellungen legen Sie zum einen fest, wie die Elemente angezeigt werden sollen. Zum anderen wird hier festgelegt, wie die verschiedenen Komponenten zusammenhängen. Sie legen etwa fest, dass ein Artikel einen Abschnitt mit Bildern und einen Abschnitt mit Text enthält und welche Kategorien zur Kodierung verwendet werden sollen. 

Es empfiehlt sich, jeden Artikel in mindestens zwei Abschnitte (sections) zu unterteilen: 

  • Einen Inhalts-Abschnitt mit den zu analysierenden Inhalten. Hier können zum Beispiel Bilder oder Texte aufgenommen werden. 
  • Einen Abschnitt für die Kodierung der Inhalte. In diesem Abschnitt werden die Kategorien ausgewählt, die auf den Fall zutreffen. Sollen etwa die Emotionen in Bildern analysiert werden, wählt man hier aus, ob eine glückliche oder eine traurige Person auf dem Bild zu sehen ist.

In der Dokumentation finden Sie alle Informationen dazu, welche Einstellungen vorgenommen werden können. Sie können die Konfiguration direkt in der Oberfläche bearbeiten oder als CSV-Datei herunterladen, anpassen und wieder importieren.

Die Kategorien, nach denen Artikel kodiert werden, werden in sogenannten Kategoriensystemen geordnet. Ein exemplarisches Kategoriensystem, welches Textinhalte nach ihren Konnotationen kodiert, wäre "Codes". Mögliche darin enthaltene Kategorien könnten "Emotionen" oder "Thema" sein. Für die Konfiguration eines Kategoriensystems können Sie als Default folgende Werte eingeben. Sie enthalten die Angaben zu den Bezeichnungen und den IRIs der jeweiligen Kategorien und ermöglichen über die "ancestor"-Elemente eine Hierarchisierung:

{
    "displayfield": "path",
    "fields": {
        "parent_id": {
            "caption": "Quelle"
        },
        "ancestors": "Quelle",
        "lemma": "Bezeichnung",
        "norm_iri": "IRI-Fragment"
    },
    "default": true,
    "columns": {
        "lemma": "Bezeichnung",
        "norm_iri": "IRI-Fragment",
        "articles_count": "Artikel"
    }
}

Achten Sie darauf, für jedes gewünschte Kategoriensystem auch einen zusätzlichen items-type hinzuzufügen, damit Kategorien aus dem neuen System in den Artikeln kodiert werden können. Es ist nämlich durchaus möglich, mehrere Kategoriensysteme für verschiedene Kodierungsziele zu erstellen. Beispielsweise, wenn sie auch formale Aspekte, wie die Textlänge der Artikelinhalte erfassen möchten. 

Dateien

Beachten Sie, dass die maximale Uploadgröße für einzelne Dateien beschränkt ist. Für umfangreiche Datenmengen können Administrator:innen deshalb die Funktion Fetch file (im Footer) verwenden, um eine zip-Datei von einem anderen Server statt vom eigenen Computer zu Epigraf zu übertragen. Hierzu wird ein Download-Link des externen Servers benötigt (z.B. ein Nextcloud- oder Owncloud-Link) und es muss angegeben werden, unter welchem Dateinamen die angefragte Datei innerhalb von Epigraf abgelegt werden soll. Aus Sicherheitsgründen kann es sein, dass diese Funktion nur für festgelegte Domains funktioniert, sich also Dateien nicht von beliebigen Servern herunterladen lassen. Die Freigaben müssen dann von den Epigraf-Betreibern eingerichtet werden.

Literatur

Früh, W. (2017). Inhaltsanalyse: Theorie und Praxis (9. überarbeitete Auflage). UVK. 

Glaser, B. G. & Strauss, A. L. (1980). The discovery of grounded theory: Strategies for qualitative research (11. Aufl.). Aldine. 

Krippendorff, K. (2013). Content analysis: An introduction to its methodology (3. Aufl.). Sage. 

Kuckartz, U. (2012). Qualitative Inhaltsanalyse: Methoden, Praxis, Computerunterstützung. Beltz-Juventa. 

Mayring, P. (2008). Qualitative Inhaltsanalyse: Grundlagen und Techniken (10. Aufl.). Beltz.

Merten, K. (1995). Inhaltsanalyse: Einführung in Theorie, Methode und Praxis (2., verbesserte Aufl.). Springer.