1. Zweck der Verarbeitung
ISOCALCX setzt das KI-Modell Claude Haiku 4.5 (via AWS Bedrock, EU Frankfurt) ein, um hochgeladene PDF-Dokumente (Leistungsverzeichnisse / Bauausschreibungen) automatisch zu analysieren. Ziel ist die Extraktion technischer Isolationspositionen (Rohrisolierungen, Formstücke, Armaturenkappen, Kanal-Dämmungen, Brandschutz-Positionen).
Verarbeitungsschritte
- Schritt 1 – Upload: Benutzer lädt ein PDF (Leistungsverzeichnis) hoch. Speicherung auf Servern in der Schweiz (Infomaniak).
- Schritt 2 – Pre-Filter (lokal): Serverseitige Vorfilterung: Es werden nur jene Seiten und Textabschnitte identifiziert, die isolations- oder dämmrelevante Inhalte aufweisen. Irrelevante Seiten (z. B. reine Architekturpläne, Verwaltungstexte, Personenlisten) werden NICHT an die KI übermittelt.
- Schritt 3 – Textextraktion: Aus den vorgefilterten Seiten wird Text extrahiert (PyMuPDF / pdf-parse). Es werden ausschliesslich technische Textinhalte verarbeitet.
- Schritt 4 – KI-Analyse: Der vorgefilterte Text wird über AWS Bedrock (EU Frankfurt) an Claude Haiku 4.5 zur Positionsextraktion übermittelt. Bei Nichtverfügbarkeit von Bedrock wird Anthropic Direct API als Fallback verwendet.
- Schritt 5 – Post-Processing: KI-Ergebnisse werden serverseitig gefiltert (False-Positive-Filter, 17 Schritte), normalisiert, validiert. Nur plausible Positionen werden gespeichert.
- Schritt 6 – Preiskalkulation & Prüfung: Validierte Positionen werden mit dem Unternehmenskatalog abgeglichen. Der Benutzer prüft und korrigiert ALLE Ergebnisse manuell.
Es werden keine automatisierten Einzelentscheidungen im Sinne von Art. 21 revDSG / Art. 22 DSGVO getroffen – die KI dient ausschliesslich als Vorschlagssystem.
2. Datenminimierung (Pre-Filter)
Datenminimierung ist die zentrale technische Massnahme von ISOCALCX. Wir übermitteln nicht das ganze PDF an die KI, sondern nur den dämmrelevanten Teil.
- Pre-Filter (intern): Vor jedem KI-Aufruf läuft ein deterministischer Vorfilter (Keyword + Regex + BKP-Kontext). Er identifiziert isolations- und dämmrelevante Seiten und erstellt ein verkleinertes PDF nur mit diesen Seiten. Personenbezogene Anhänge (z. B. Adresslisten, Architekten-Verzeichnisse, Kontaktblätter) werden i. d. R. herausgefiltert, bevor Daten die EU verlassen oder die KI erreichen.
Grundprinzipien
- Nur relevante Seiten werden weitergeleitet (typ. 30–60 % des Original-PDFs)
- Keine Übermittlung von Bildern, Logos, Plänen, sofern nicht für die Analyse erforderlich
- Keine Übermittlung von Benutzerkontodaten, Login-Informationen oder Preis-Stammdaten
- Sensitive Felder (Telefonnummern, E-Mail-Adressen) werden nicht aktiv ausgewertet
An die KI übermittelte Daten
- PDF-Textinhalt der vorgefilterten relevanten Seiten (technische Beschreibungen, BKP-Nummern, Materialangaben, Dimensionen, Mengen)
- Bei grossen Dokumenten (> 35 Seiten): vorgefilterte PDF-Datei (nur relevante Seiten)
- Dateiname (zur internen Zuordnung)
- Technischer Analyse-Prompt (enthält keine Benutzerdaten)
NICHT übermittelte Daten
- Benutzer-Personendaten (Name, E-Mail, Adresse)
- Login- oder Authentifizierungsdaten, Passwörter, JWT-Tokens
- Preis-Stammdaten oder Unternehmenskatalog
- Zahlungs- oder Abonnementdaten
- Metadaten anderer Benutzer oder Mandanten (strikte Multi-Tenant-Isolierung)
- Vom Pre-Filter als irrelevant markierte PDF-Seiten
Caching
Zur Vermeidung redundanter API-Aufrufe werden Analyse-Ergebnisse lokal auf dem ISOCALCX-Server (Schweiz) zwischengespeichert (SHA-256-Hash der PDF als Schlüssel). Bei erneuter Analyse desselben Dokuments wird das Ergebnis aus dem Cache geladen – ohne dass Daten erneut die Schweiz verlassen.
3. Rechtsgrundlage
Die Verarbeitung von Dokumenteninhalten durch ISOCALCX und die Übermittlung an Subprozessoren stützt sich auf folgende Rechtsgrundlagen:
- Art. 31 Abs. 2 lit. a revDSG – Vertragserfüllung: Die KI-gestützte Analyse ist Kernbestandteil des ISOCALCX-Dienstes. Der Nutzungsvertrag umfasst die automatische PDF-Analyse ausdrücklich.
- Art. 6 Abs. 1 lit. b DSGVO – Vertragserfüllung: Für Benutzer aus dem EWR bildet die Vertragserfüllung die Rechtsgrundlage gemäss DSGVO.
- Art. 19 revDSG / Art. 13 DSGVO – Transparenz: Benutzer werden in der Datenschutzerklärung, im PIA und bei der Registrierung über den Einsatz von KI sowie die Datenübermittlung informiert.
- Art. 9 revDSG / Art. 28 DSGVO – Auftragsverarbeitung: Mit allen Subprozessoren bestehen DPA / Auftragsverarbeitungsverträge.
4. Subprozessoren
Für den Betrieb der ISOCALCX Plattform werden folgende Drittanbieter als Auftragsverarbeiter eingesetzt. Mit allen ist ein DPA gemäss Art. 28 DSGVO bzw. Art. 9 revDSG abgeschlossen:
| Anbieter | Zweck | Datenarten | Standort | Transfergrundlage |
|---|---|---|---|---|
| Infomaniak Network SA | Server- und Datenbank-Hosting | Konto-, Projekt-, Positions-, Cache-Daten | Schweiz | CH (kein Drittlandtransfer) |
| AWS Bedrock (Claude Haiku 4.5) | KI-Positionsextraktion (primär) | PDF-Textinhalte (vorgefiltert), Dateinamen | EU – Frankfurt (eu-central-1) | DSGVO-konform innerhalb EU |
| Anthropic PBC | KI-Fallback bei Bedrock-Ausfall | PDF-Textinhalte (vorgefiltert), Dateinamen | USA | EU-Standardvertragsklauseln (SCC) gem. Art. 46 DSGVO |
| Stripe | Zahlungsabwicklung | E-Mail, Zahlungsinformationen | USA / EU | SCC + Swiss-US DPF |
| Brevo (SendInBlue) | System-E-Mail-Versand | E-Mail-Adresse, Name | EU (Frankreich) | DSGVO-konform innerhalb EU |
Eine ausführliche Beschreibung jedes Subprozessors mit Verlinkung zu dessen Datenschutzhinweisen findet sich in der Datenschutzerklärung (Abschnitt 8).
5. Drittlandtransfer
ISOCALCX gestaltet den Datenfluss bewusst so, dass Drittlandtransfers minimiert werden:
- EU (AWS Bedrock Frankfurt): Die KI-Hauptverarbeitung erfolgt ausschliesslich auf AWS-Servern in Frankfurt (eu-central-1). Es findet kein regulärer Transfer in die USA statt. Ein DPA mit AWS gemäss Art. 28 DSGVO ist abgeschlossen; AWS Bedrock nutzt übermittelte Daten nicht für Modell-Training.
- Schweiz (Infomaniak): Sämtliche Konto-, Projekt-, Positions- und Cache-Daten werden ausschliesslich in der Schweiz gespeichert. Die ISOCALCX-Datenbank verlässt die Schweiz nicht.
- USA (Anthropic Fallback, Stripe): Im Fallback-Fall (Bedrock-Ausfall) sowie für die Zahlungsabwicklung kann eine Übermittlung in die USA erfolgen. Grundlage sind die EU-Standardvertragsklauseln (SCC, Art. 46 DSGVO) sowie – wo anwendbar – das Swiss-US Data Privacy Framework. Übermittlungen sind transportverschlüsselt (TLS 1.2+).
Aktueller Konfigurationsstand: Anthropic-Direct-Fallback
DEAKTIVIERT — keine USA-VerarbeitungDer Anthropic-Direct-Fallback (USA) ist im Produktivsystem standardmässig DEAKTIVIERT. Die Backend-Konfiguration lautet ALLOW_ANTHROPIC_DIRECT_FALLBACK=false. Bei einem Bedrock-Ausfall in eu-central-1 (Frankfurt) erfolgt automatisch ein Failover auf die zweite EU-Region eu-west-1 (Irland). Es findet keine reguläre Verarbeitung in den USA statt.
Bei einer künftigen Aktivierung des Anthropic-Direct-Fallbacks würden DSE und AVV entsprechend aktualisiert; betroffene Kunden würden mindestens 30 Tage vorher informiert (gemäss AVV §8 Subprozessoren-Wechsel).
6. Technische und organisatorische Massnahmen (TOMs)
Folgende TOMs werden zur Risikominderung eingesetzt:
- Pre-Filter als zentrale TOM: Der serverseitige Pre-Filter (siehe Abschnitt 2) ist die wichtigste Massnahme zur Datenminimierung. Er reduziert die Datenmenge, die die EU verlässt bzw. die KI erreicht, typischerweise um 40–70 %.
- Verschlüsselung: TLS 1.2+ für sämtliche Übertragungen (Frontend ↔ Backend ↔ AWS Bedrock / Anthropic). Argon2 für Passwort-Hashing. SHA-256 für Cache-Identifikation.
- Zugangskontrolle: JWT in HttpOnly-Cookies, RBAC (Admin / Firmenadmin / Benutzer), strikte Multi-Tenant-Isolierung, API-Key-Rotation via Key-Pool.
- Logging & Monitoring: Strukturiertes Winston-Logging, internes Fehler-Monitoring (anonymisiert), KI-Antworten teilweise (erste 2000 Zeichen) für Debugging geloggt – Logs werden periodisch rotiert und nach max. 12 Monaten gelöscht.
- Löschroutinen: Temporäre PDF-Uploads bei AWS werden nach Verarbeitung entfernt; AWS Bedrock speichert Inhalte nicht persistent. Benutzer können Konto und Daten jederzeit vollständig löschen (sofort, 30-Tage-Karenz oder Anonymisierung via SHA-256-Hash).
Eine vollständige TOM-Dokumentation sowie das Bearbeitungsverzeichnis nach Art. 12 revDSG / Art. 30 DSGVO werden intern geführt und können auf Anfrage durch Behörden oder im Rahmen eines DPA-Reviews eingesehen werden.
7. Risikobewertung
Identifizierte Datenschutzrisiken, Eintrittswahrscheinlichkeit nach Mitigation und ergriffene Massnahmen:
| Risiko | Stufe | Minderungsmassnahmen | Restrisiko |
|---|---|---|---|
| Übermittlung von Geschäftsdaten an KI-Subprozessor Leistungsverzeichnisse können geschäftlich sensible Informationen enthalten (Mengen, Materialspezifikationen, Projektdetails). | Mittel |
| Restrisiko: Geschäftsgeheimnisse (Mengen, Preise) sind im PDF enthalten und werden zur Analyse benötigt – eine vollständige Anonymisierung ist nicht möglich. |
| Drittlandtransfer (USA, Fallback) Bei Bedrock-Ausfall werden Inhalte an Anthropic in den USA übermittelt. | Mittel |
| Restrisiko: US-Behördenzugriffe nach FISA 702 / CLOUD Act sind nach EuGH "Schrems II" rechtlich nicht vollständig auszuschliessen. |
| Fehlerhafte KI-Ergebnisse Falsch extrahierte Positionen könnten zu fehlerhaften Kalkulationen führen. | Mittel |
| Restrisiko: KI-Modelle sind nicht-deterministisch; einzelne Halluzinationen sind möglich. Verantwortung der finalen Prüfung liegt beim Benutzer. |
| Personenbezug in Leistungsverzeichnissen PDFs könnten vereinzelt Personennamen oder Kontaktdaten enthalten (z. B. Projektleiter, Architekten). | Tief |
| Restrisiko: Vereinzelte Personendaten in technischem Fliesstext können theoretisch an die KI gelangen. |
| Datenabfangen während Übertragung Man-in-the-Middle oder Manipulation auf dem Übertragungsweg. | Tief |
| Restrisiko: Bei kompromittierten Endgeräten des Benutzers (vor TLS) nicht durch ISOCALCX adressierbar. |
| Unberechtigter Zugriff auf Analyseergebnisse Dritte könnten Zugang zu gespeicherten Positionen erhalten. | Tief |
| Restrisiko: Bei kompromittierten Benutzer-Credentials greift die Mandanten-Trennung nur eingeschränkt. |
8. Restrisiken und ehrliche Risikokommunikation
ISOCALCX setzt umfangreiche technische und organisatorische Massnahmen ein. Wir kommunizieren jedoch offen, dass kein digitales System eine 100-prozentige Sicherheit garantieren kann. Folgende Restrisiken bleiben bestehen:
- KI-Halluzinationen: Claude Haiku 4.5 ist ein nicht-deterministisches LLM. Einzelne Positionen können falsch extrahiert oder erfunden werden. Die finale Prüfung liegt beim Benutzer – die Plattform unterstützt, ersetzt aber keine fachliche Endkontrolle.
- US-Behördenzugriff (Schrems II): Im Fallback-Pfad (Anthropic, USA) sind Behördenzugriffe nach FISA 702 / CLOUD Act juristisch nicht vollständig auszuschliessen, auch wenn SCC vereinbart sind.
- Modell-Updates beim Anbieter: AWS und Anthropic können ihre Modelle aktualisieren. ISOCALCX prüft Modell-Wechsel, kann aber Verhaltensänderungen nicht verhindern.
- Pre-Filter ist heuristisch: Der Pre-Filter ist regelbasiert. Im Einzelfall können relevante Seiten übersehen oder irrelevante Seiten weitergeleitet werden. Wir minimieren das Risiko, eliminieren es jedoch nicht.
- Endgeräte-Sicherheit: Sicherheitslücken auf dem Gerät des Benutzers (Malware, kompromittierter Browser) liegen ausserhalb des ISOCALCX-Einflussbereichs.
Wir verstehen Datenschutz nicht als Marketing-Versprechen, sondern als kontinuierliche Risikoarbeit. Das Sicherheits- und Datenschutzniveau wird laufend überprüft und verbessert.
9. Ergebnis der Bewertung
Gesamtbewertung: Datenschutzrisiko vertretbar
Unter Berücksichtigung der beschriebenen technischen und organisatorischen Massnahmen – insbesondere des Pre-Filters, der Schweizer Datenhaltung und der primären KI-Verarbeitung in der EU – ist das Datenschutzrisiko der KI-gestützten Dokumentenanalyse als vertretbar einzustufen. Eine vollständige DSFA gemäss Art. 22 revDSG ist nicht erforderlich, das vorliegende PIA dokumentiert die Verarbeitung jedoch transparent.
Diese Einschätzung beruht auf folgenden Faktoren:
- Datenart: Verarbeitet werden überwiegend technische Baubeschreibungen. Personendaten sind nur am Rande enthalten.
- Datenminimierung: Pre-Filter reduziert die übermittelte Datenmenge typischerweise um 40–70 %.
- Keine automatisierten Entscheidungen: KI-Ergebnisse sind Vorschläge; finale Freigabe durch Benutzer.
- Vertragliche Absicherung: DPA mit allen Subprozessoren; Modell-Training kontraktuell ausgeschlossen.
- Datenhaltung Schweiz: Konto- und Projektdaten verlassen die Schweiz nicht.
- Betroffenenrechte: Vollständige Löschung, Anonymisierung und Datenexport jederzeit möglich.
10. Überprüfung und Aktualisierung
Dieses Privacy Impact Assessment wird mindestens einmal jährlich sowie bei wesentlichen Änderungen an der KI-Pipeline, den eingesetzten Modellen oder den Subprozessoren überprüft und bei Bedarf aktualisiert.
Änderungen werden auf dieser Seite veröffentlicht. Bei wesentlichen Änderungen der Risikobewertung werden registrierte Benutzer per E-Mail informiert.
11. Kontakt
Bei Fragen zu diesem Privacy Impact Assessment oder zur Datenverarbeitung im Zusammenhang mit der KI-Analyse wenden Sie sich bitte an:
ISOCALCX
E-Mail: info@isocalcx.ch