Ausgangspunkt der Datenerfassung mit Epigraf sind Artikel. Was genau unter einem Artikel verstanden wird, hängt vom Anwendungsfall ab. Geht es um die Erschließung von historischen Inschriften, dann enthält ein Artikel die Beschreibung des Objekts und der darauf angebrachten Inschrift. Bei einer Briefedition würde jeder Brief als Artikel erfasst werden. Für die Social-Media-Analyse bietet es sich an, einzelne Posts oder auch gesamte Threads (bestehend aus einem Post und dazugehörigen Kommentaren) als jeweils einen Artikel zu erfassen. Ein Artikel enthält somit die Beschreibung des Analyseobjekts.

 

Jeder Artikel setzt sich aus flexibel kombinierbaren Abschnitten zusammen, in denen der Text und alle relevanten Metadaten sowie zugehörige Dateien enthalten sind. Die Inhalte umfassen Text, Abbildungen und Zuordnungen zu Kategorien. Annotationen treten in Textfeldern auf - sie sind Auszeichnungen und Formatierungen, bei denen Textstellen mit standardisierten Vokabularen bzw. Kategorien verknüpft werden. Eine spezielle Form der Annotation sind Fußnoten, welche Anmerkungen zu einer Textstellen enthalten. 

Artikel

Artikel und alle dazu gehörigen Daten können entweder aus anderen Datenbeständen importiert oder direkt in der Oberfläche angelegt und bearbeitet werden. Zu einem Artikel gehören:

  • Projekte: Mehrere Artikel werden zu Projekten zusammengefasst. Ein Projekt umfasst beispielsweise die Inschriften einer Region oder ein Sample von Threads auf Social-Media-Plattformen.
  • Kategorien: In den Artikeln werden standardisierte Vokabulare zur Annotation oder zur Kategorisierung der Inhalte verwendet.
  • Dateien: Um Bilder oder Dokumente in die Artikel oder Notizen einzubinden, werden sie zunächst hochgeladen und dann in den Artikel eingebunden.

Inhalte

Ein Inhalt kann unterschiedliche Datentypen enthalten:

  • Geodaten: Sofern sich die Artikel auf bestimmte Orte beziehen, können sie in einer Karte dargestellt werden. Dazu werden im Artikel die Geokoordinaten erfasst.
  • Datierungen: Wenn Datierungen als Text erfasst werden, wird der Text geparsed, um automatisch ein Start- und ein Endjahr sowie einen Sortierschlüssel des Zeitraums zu erfassen.
  • Bilder und andere Dateien
  • Texte: Mit oder ohne Annotationen.
  • Werte:  Zahlen oder kurze Schlagworte.
  • Kategorien: Verknüpfungen zu Kategoriensystemen, etwa um Inhalte zu taggen.
  • Beziehungen: Verknüpfungen zu anderen Datensätzen.
  • Auswahloptionen
  • Kommentare

Notizen

In den datenbankspezifischen Notizen und im datenbankübergreifenden Wiki werden projektorganisatorische Dinge festgehalten, beispielsweise ein gemeinsamer Leitfaden zur Edition oder Kodierung der Inhalte.