Datensatzserie fortführen per API

Dieser Guide beschreibt, wie eine bestehende Datensatzserie (z. B. monatliche Berichte) um einen neuen Zeitraum-Eintrag erweitert wird.

Eine Datensatzserie fasst mehrere zeitlich aufeinander folgende Datensätze unter einer gemeinsamen Datensatzserien-Entität zusammen. Die bestehenden Metadaten (Katalog, Lizenz, Herausgeber, Kategorien) werden von der Serie übernommen – nur die neue CSV-Datei, der neue Zeitraum und die Referenz auf den vorherigen Datensatz müssen angegeben werden.

Das Fortführen setzt einen bereits vorhandenen Datensatz voraus, der über die API hochgeladen wurde. Ist dieser Datensatz bereits Teil einer Datensatzserie, wird die Serie um den neuen Eintrag erweitert. Ist er noch nicht Teil einer Serie, legt das Backend automatisch eine neue Datensatzserie an und fügt beide Datensätze ein.

Die vollständige API-Referenz ist in der Swagger-Dokumentation verfügbar: staging-backend.odi.schleswig-holstein.de/docs

Test-System verfügbar

Für die Entwicklung und Tests steht ein Staging-System bereit. Die Zugangsdaten (Keycloak-URL, Realm, Client-Credentials) sind auf Anfrage erhältlich. Bitte wende dich dazu an das ODI-Team.

Voraussetzungen

  • Client-ID und Client-Secret des Service Accounts liegen vor
  • datasetId des zuletzt veröffentlichten Datensatzes der Serie (previousDatasetId) ist bekannt
  • CSV-Datei ist lokal vorhanden, Encoding und Delimiter sind bekannt
  • Optional: Schema-Version des Schemas ist bekannt (siehe Schema-Repository)

Was ist eine Datensatzserie?

Eine Datensatzserie ist eine logische Gruppierung von Datensätzen, die regelmäßig oder kontinuierlich aktualisiert werden – z. B. monatliche Verkehrszählungen oder jährliche Schulstatistiken. In den Metadatenstandards DCAT-AP (Europa) und DCAT-AP.de (Deutschland) wird dieses Konzept als dcat:DatasetSeries beschrieben.

Alle Einträge der Serie teilen dieselben Metadaten (Katalog, Lizenz, Herausgeber, Kategorien). Jeder neue Eintrag referenziert über previousDatasetId den unmittelbar vorherigen Datensatz in der Serie – dadurch entsteht eine nachvollziehbare chronologische Kette.

Token abrufen (Keycloak Service Account)

Alle schreibenden API-Requests erfordern ein gültiges JWT-Token, für das ein Service Account notwendig ist.

Tip

Der Service-Account wird vom Administrator angelegt. Eine ausführliche Anleitung zur Einrichtung findet sich unter Programmatischen API-Zugriff einrichten.

Die Zugangsdaten bestehen aus einer Client-ID und einem Client-Secret.

Request:

curl -X POST \
  "https://keycloak.odi.schleswig-holstein.de/realms/open-data-infrastruktur/protocol/openid-connect/token" \
  -H "Content-Type: application/x-www-form-urlencoded" \
  -d "grant_type=client_credentials" \
  -d "client_id=<client-id>" \
  -d "client_secret=<client-secret>"

Beispiel-Response:

{
  "access_token": "eyJ...",
  "expires_in": 300,
  "token_type": "Bearer"
}

Den Wert von access_token im nächsten Schritt als Bearer-Token verwenden.

Warning

Client-Secrets niemals in Versionsverwaltungssystemen oder Logs speichern. Tokens sind zeitlich begrenzt gültig (expires_in Sekunden); nach Ablauf muss ein neuer Token angefordert werden.

Datensatzserie fortführen

Endpunkt

POST https://staging-backend.odi.schleswig-holstein.de/upload/csv/append

Felder (Request Body)

Feld Pflicht Typ Beschreibung
previousDatasetId Pflicht string ID des zuletzt veröffentlichten Datensatzes der Serie
datasetId Pflicht string Frei wählbare ID des neuen Datensatzes
startDate Pflicht string Startdatum des neuen Zeitraums (ISO 8601, z. B. 2024-02-01)
endDate Optional string Enddatum des neuen Zeitraums (ISO 8601)
schemaVersion Optional string Version des Schemas (z. B. 1.1.1) – wird von der bestehenden Serie übernommen
delimiter Pflicht string Trennzeichen der CSV-Datei (z. B. ; oder ,)
encoding Pflicht string Zeichenkodierung (z. B. UTF-8)
quote Pflicht string Anführungszeichen-Zeichen (z. B. ")
file Pflicht binary Die neue CSV-Datei
datasetTitle Optional string Titel des neuen Datensatzes (wird von der Serie übernommen, falls leer)
dataSeriesId Pflicht* string ID der Datensatzserie – nur erforderlich beim Erstellen einer neuen Serie
datasetDescription Optional string Beschreibung des neuen Datensatzes – nur beim Erstellen einer neuen Serie
dataSeriesTitle Optional string Titel der Serie – nur beim Erstellen einer neuen Serie
dataSeriesDescription Optional string Beschreibung der Serie – nur beim Erstellen einer neuen Serie

* dataSeriesId ist nur erforderlich, wenn das Backend eine neue Datensatzserie anlegen soll.

Info

Metadaten wie Katalog, Lizenz, Herausgeber, Kategorien und Raumbezug werden automatisch von der bestehenden Datensatzserie übernommen und müssen nicht erneut angegeben werden.

Beispiel-Request

curl -X POST \
  "https://staging-backend.odi.schleswig-holstein.de/upload/csv/append" \
  -H "Authorization: Bearer <access_token>" \
  -F "previousDatasetId=<vorheriger-datensatz-id>" \
  -F "datasetId=mein-datensatz-2024-02" \
  -F "startDate=2024-02-01T00:00:00" \
  -F "schemaVersion=1.1.1" \
  -F "delimiter=;" \
  -F "encoding=UTF-8" \
  -F 'quote="' \
  -F "file=@/pfad/zur/neuen-datei.csv"

Beispiel-Response (Erfolg)

{
  "datasetId": "mein-datensatz-2024-02"
}

Beispiel-Response (Fehlerfall – Validierung fehlgeschlagen)

{
  "status": "error",
  "type": "invalid file",
  "message": "Validation of Csv-File was not valid!",
  "context": "CsvUploadService",
  "errors": [
    {
      "description": "The cell \"Harburg\" in row at position \"2\" and field \"KREIS\" at position \"1\" does not conform to a constraint: constraint \"enum\" is \"['Dithmarschen', 'Kiel', 'Lübeck', ...]\"",
      "index": 2,
      "field": "KREIS"
    }
  ]
}

Im Fehlerfall wird ein Validierungsbericht im frictionless-Report-Format zurückgeliefert.

Fehlercodes

HTTP-Status Bedeutung Mögliche Ursache / Lösung
400 Ungültige Anfrage Pflichtfeld fehlt, falsches Format oder CSV entspricht nicht dem Schema
401 Nicht authentifiziert Token fehlt oder abgelaufen → neuen Token abrufen
403 Keine Berechtigung Service Account hat nicht die erforderliche Rolle
413 Datei zu groß Datei übersteigt das serverseitige Größenlimit
500 Interner Serverfehler Kontakt zum ODI-Support aufnehmen

Nächste Schritte