Blog

Falschalarme im Sicherheitssystem: die teuerste Krankheit und wie man sie heilt

Ein System, das ständig Alarm schlägt, wird nach sechs Monaten abgeschaltet. Wir zeigen, mit welchen zwei Methoden ehrliche Anbieter die Falschalarmrate halbieren.

Dr. Raphael Nagel

24. Februar 2026

Falschalarme im Sicherheitssystem: die teuerste Krankheit und wie man sie heilt

Ein Sicherheitssystem, das in den ersten sechs Monaten mehr als eine Handvoll Fehlalarme pro Standort und Nacht produziert, ist nach dem zweiten Quartal kein Sicherheitssystem mehr. Es ist ein Geräuschgenerator, dessen Funktion vom Betreiber selbst stillgelegt wird.

Diese Aussage klingt hart, sie ist aber das, was sich in der Praxis in Bau, Industrie und Logistik immer wieder beobachten lässt. Die Reihenfolge ist regelmäßig dieselbe. Im ersten Monat reagiert die Leitstelle auf jeden Alarm. Im zweiten Monat priorisiert sie nach Standorten. Im dritten Monat ignoriert sie Standorte, die zu oft melden. Im sechsten Monat ist die Erkennung in der Konfiguration so weit zurückgedreht, dass die ursprüngliche Schutzwirkung nicht mehr vorhanden ist. Die Anlage ist nominell aktiv. Sie ist faktisch ausgeschaltet.

Diese Entwicklung ist keine technische Frage, sondern eine ökonomische. Jeder Fehlalarm bindet Personalzeit, jede Personalzeit kostet, jede Kostenstelle wird irgendwann verteidigt. Der Betreiber, der ein System abschaltet, das ihn wöchentlich Personalstunden kostet, handelt aus seiner Sicht rational. Die Schuld liegt nicht beim Betreiber. Sie liegt beim Hersteller, der ein System ausgeliefert hat, dessen Falschalarmrate er entweder nicht gemessen oder nicht offen ausgewiesen hat.

Warum Falschalarme die teuerste Krankheit sind

Die Kosten eines Falschalarms sind in den seltensten Fällen ausreichend dokumentiert. In der Branche kursieren Kennzahlen, die auf Schätzungen beruhen, und der Bandbreite nach reichen sie von einstelligen Euro-Beträgen pro Fehlalarm bis in den unteren dreistelligen Bereich, je nachdem, ob nur der Operator in der Leitstelle einbezogen wird oder auch die Interventionskräfte, die Anfahrt, die Versicherung und die Dokumentation. Wer ehrlich rechnet, kommt nicht auf einen einzelnen Wert, sondern auf eine Verteilung, deren Median in den meisten Konfigurationen oberhalb dessen liegt, was ein einzelner Sicherheitsdienstleister im Stundensatz an seinen Auftraggeber weitergibt.

Diese direkten Kosten sind nur die sichtbare Schicht. Darunter liegt eine zweite Schicht, die sich erst nach mehreren Quartalen zeigt. Sie heißt Aufmerksamkeitsabbau. Eine Leitstelle, die im Schichtmittel mehr als ein Dutzend Alarme pro Operator und Stunde bearbeitet, von denen die überwältigende Mehrheit keine reale Bedrohung darstellt, entwickelt eine professionelle Form der Selektivität. Diese Selektivität ist menschlich notwendig, sie ist aber gefährlich, weil sie an einer Stelle einsetzt, an der ein echter Vorfall unterscheidbar sein müsste und es nicht ist. Wenn am dreihundertsten Alarm der dreihundertste reale Vorfall liegt, wird er nicht mit derselben Schärfe bearbeitet wie der erste.

Die dritte Schicht ist vertraglich. Versicherer und Bauherren beobachten die Reaktion der Leitstelle. Wenn sie feststellen, dass Alarme zwar dokumentiert, aber nicht systematisch bearbeitet werden, beeinflusst das die Prämie und in einzelnen Fällen die Deckung. Die GDV-Statistiken zur Schadensentwicklung im Bau und in der Industrie geben hier kein präzises Bild pro Anlage, aber sie zeigen qualitativ, dass technisch unterstützte Sicherheit nur dann prämienwirksam ist, wenn ihre Funktion belegbar ist. Eine hohe Falschalarmrate ist ein indirekter Beleg dafür, dass die Funktion nicht so läuft, wie sie geplant war.

Die vierte Schicht ist die teuerste, weil sie sich nicht in Zahlen einer einzelnen Periode niederschlägt. Sie ist der Vertrauensverlust gegenüber Technologie als solcher. Ein Werkschutzleiter, der einmal ein System mit hoher Falschalarmrate erlebt hat, wird bei der nächsten Ausschreibung skeptischer kalkulieren, höhere Personalansätze rechnen und der ganzen Kategorie misstrauen. Diese Skepsis ist nicht falsch, sie ist aber für ehrliche Anbieter ein Marktschaden, der über Jahre wirkt.

Was eine akzeptable Falschalarmrate ist

Eine Falschalarmrate lässt sich nur in Bezug auf das definieren, was als Alarm gelten soll. Wer nicht definiert, ab welcher Schwelle die KI-gestützte Videoanalyse einen Vorgang als Ereignis ausgibt, kann auch nicht definieren, was ein Fehlalarm ist. Diese Bemerkung ist nicht akademisch. Sie ist die Voraussetzung jeder ernsthaften Diskussion über die Kennzahl.

In der Praxis hat sich für die Plattformlogik, die Boswau und Knauer betreibt, eine Trennung in drei Kategorien bewährt. Erste Kategorie ist der bestätigte Vorfall, der nach Operatorprüfung in die Eingriffslogik geht. Zweite Kategorie ist die Erkennung, die nach Operatorprüfung als irrelevant verworfen wird, ohne dass sie systemisch falsch war. Diese Kategorie ist kein Fehlalarm im engeren Sinn, weil das System korrekt reagiert hat, sondern eine Erkennung, deren Kontext erst der Mensch beurteilen kann. Dritte Kategorie ist der Fehlalarm im engeren Sinn, also eine Erkennung ohne reales Substrat, ausgelöst durch Schatten, Bewegung von Vegetation, Tieren, Lichtwechsel, Niederschlag oder Sensorrauschen.

Für die dritte Kategorie ist eine Bandbreite anzunehmen, die in der Inbetriebnahmephase höher liegt und sich nach Kalibrierung deutlich reduziert. Eine realistische Zielgröße im Dauerbetrieb liegt für viele Außenanwendungen im unteren einstelligen Bereich pro Kamera und 24 Stunden, in besser kontrollierten Umgebungen darunter. Anbieter, die hier Werte nahe Null versprechen, ohne die Kategorie zu definieren, in der sie messen, sollten in dieser Form nicht ernst genommen werden. Eine Falschalarmrate von Null ist nur dadurch erreichbar, dass die Schwelle so hoch gelegt wird, dass das System auch echte Vorgänge nicht mehr meldet.

Die zweite Kategorie ist die eigentliche Stellschraube. Sie wird in der Branche oft mit der dritten verwechselt, was zu Missverständnissen in Vertragsverhandlungen führt. Eine Erkennung, die ein Mitarbeiter zur Schichtzeit am Werktor zeigt und die als irrelevant verworfen wird, ist kein Fehler des Systems. Sie ist das, wofür ein Operator da ist. Wer diese Erkennungen reduzieren will, muss sie kontextualisieren, nicht unterdrücken. Genau hier setzen die beiden Methoden an, die in Kapitel 9 des Buchs "BOSWAU + KNAUER, Vom Bau zur Sicherheitstechnologie" beschrieben sind.

Mehrkanalprüfung als erste Methode

Mehrkanalprüfung bedeutet, dass ein Vorgang nur dann als Alarm gewertet wird, wenn er von mindestens zwei unabhängigen Sensoren oder Erkennungslogiken bestätigt wird. Die Methode ist nicht neu, sie ist aber in vielen Marktangeboten unsauber umgesetzt. Sauber umgesetzt verlangt sie, dass die Sensoren physikalisch unabhängige Eigenschaften erfassen, dass die Erkennungslogiken nicht aus demselben Modell stammen und dass die zeitliche Korrelation der Signale in einem definierten Fenster geprüft wird, das kurz genug ist, um echte Vorgänge zu erfassen, und lang genug, um Latenzen einzelner Kanäle zu tolerieren.

Im Bau- und Industrieumfeld bedeutet das in der Konfiguration meistens eine Kombination aus optischer Erkennung, thermischer Bestätigung und einem dritten Kanal, der je nach Standort akustisch, kinetisch oder durch eine Türsteuerung beigesteuert wird. Eine Person, die nachts über einen Lagerplatz läuft, erzeugt ein optisches Signal in der Klassifikation Person, ein thermisches Signal im erwarteten Wärmebereich und ein akustisches Signal mit Schrittmuster. Drei voneinander unabhängige Quellen, die in einem Fenster von wenigen Sekunden übereinstimmen, ergeben einen verlässlichen Alarm. Ein bewegter Schatten, ein warmer Auspuff in der Nachbarschaft oder ein einzelnes Geräusch erzeugen jeweils nur ein Signal in einem Kanal und werden in der Mehrkanalprüfung herausgefiltert.

Die Wirksamkeit der Methode hängt davon ab, wie ehrlich der Hersteller mit ihrer Voraussetzung umgeht. Die Voraussetzung lautet, dass alle beteiligten Kanäle in dem geprüften Bereich tatsächlich Reichweite haben. Eine thermische Bestätigung in einem Bereich, in dem die Wärmebildkamera nur die ersten 30 Meter abdeckt, ist jenseits dieser Distanz keine Bestätigung. Wer die Mehrkanalprüfung als Vertragszusage gibt, muss die Abdeckungskarten der einzelnen Kanäle dokumentieren. Sonst gilt die Zusage nur dort, wo das System ohnehin schon zuverlässig erkennt, und sie verfehlt den eigentlichen Zweck.

Eine zweite Voraussetzung ist die Trennung der Modelle in der Software. Wenn die optische Klassifikation und die thermische Klassifikation aus demselben Modell stammen, das nur unterschiedliche Eingänge verarbeitet, ist die Unabhängigkeit der Kanäle eine Fiktion. Beide werden bei ähnlichen Eingangsbedingungen ähnliche Fehler machen. Die Reduktion der Falschalarmrate, die sich rechnerisch aus der Mehrkanallogik ergibt, tritt dann nicht ein. Saubere Hersteller verwenden für die Bestätigungskanäle eigenständige Modelle, die in separaten Trainingsläufen entwickelt werden, und sie dokumentieren diese Trennung in der technischen Beschreibung.

Die quantitative Wirkung der Mehrkanalprüfung lässt sich nicht pauschal beziffern, weil sie vom Ausgangsniveau abhängt. Beobachtungen aus Pilotbetrieben im Bau- und Logistikumfeld zeigen Reduktionen der Falschalarmrate, die in vielen Konstellationen die Hälfte erreichen oder überschreiten, bei gleichzeitiger Stabilisierung der Erkennungsrate echter Vorfälle. Wer in der Inbetriebnahmephase mit 30 Fehlalarmen pro Standort und Nacht startet und nach drei Monaten bei 10 bis 12 landet, hat die Methode wirksam eingesetzt. Wer von 30 auf 25 kommt, hat entweder die Konfiguration nicht sauber umgesetzt oder die Methode nicht in der Tiefe verstanden, in der sie wirken soll.

Kontextfilter als zweite Methode

Die zweite Methode ist der Kontextfilter. Sie setzt nicht an der Sensorebene an, sondern an der Bedeutungsebene. Ein Vorgang ist nicht in jeder Stunde und an jedem Ort gleich relevant. Eine Person, die um sieben Uhr morgens das Werktor passiert, ist in den meisten Konfigurationen unauffällig. Dieselbe Person, die um drei Uhr nachts dieselbe Geste vollzieht, ist es nicht. Ein Lkw, der zur Anlieferzeit auf dem Hof rangiert, ist Routine. Derselbe Lkw außerhalb der Anlieferzeit ist eine Auffälligkeit.

Der Kontextfilter formalisiert diese Unterscheidung. Er verbindet die Erkennung mit Informationen über Tageszeit, Wochentag, Schichtmodell, geplante Lieferungen, geplante Wartungen, Wetterlage und gegebenenfalls Zugangsberechtigungen aus einem angebundenen System. Eine Erkennung, die in den erwarteten Kontext passt, wird in der Standardlogik nicht als Alarm gewertet, sondern als dokumentiertes Routineereignis. Eine Erkennung, die nicht in den Kontext passt, wird als Alarm priorisiert. Beide Vorgänge sind dokumentiert, was für die spätere Auswertung und für die Compliance gegenüber BSI, VdS und den Versicherern entscheidend ist.

Der Kontextfilter ist aufwändiger in der Konfiguration als die Mehrkanalprüfung, weil er die Prozesse des Kunden kennen muss. Ein Hersteller, der den Filter ohne Kenntnis der konkreten Abläufe konfiguriert, baut Annahmen ein, die in der Praxis nicht halten. Eine ehrliche Inbetriebnahme verlangt deshalb, dass die ersten zwei bis vier Wochen als Lernphase deklariert werden, in der das System die tatsächlichen Routinen erfasst, der Operator die Klassifikationen prüft und die Schwellwerte gemeinsam mit dem Kunden festgelegt werden. Wer diese Phase abkürzt, liefert ein System aus, das im echten Betrieb entweder zu viel oder zu wenig meldet.

Die Wirkung des Kontextfilters ist in der zweiten Kategorie der eingangs eingeführten Trennung am größten. Er reduziert nicht primär die Fehlalarme im engeren Sinn, sondern die irrelevanten Erkennungen, die ein Operator sonst manuell verwerfen muss. In typischen Konfigurationen verschiebt er das Verhältnis zwischen Erkennung und bestätigtem Vorfall auf der Operatorebene deutlich, was den Personalbedarf in der Leitstelle reduziert oder, was im Sinne wirklicher Sicherheit wichtiger ist, die verfügbare Aufmerksamkeit pro echtem Vorfall erhöht. Ein Operator, der nicht mehr drei Viertel seiner Schichtzeit damit verbringt, Routinevorgänge zu verwerfen, hat die mentale Reserve, einen ungewöhnlichen Vorfall ernsthaft zu prüfen.

In der Kombination der beiden Methoden, Mehrkanalprüfung an der Sensorebene und Kontextfilter an der Bedeutungsebene, ergibt sich die Reduktion, die in seriösen Pilotbetrieben dokumentiert wird. Sie ist nicht das Ergebnis einer einzelnen Technologie, sondern einer Architektur, die diese Technologien aufeinander bezieht.

Wer kalibriert, wer haftet

Die Frage, wer die Schwellwerte einstellt und wer für die Folgen ihrer Einstellung haftet, ist in der Branche oft unsauber geregelt. Hersteller liefern Geräte mit Voreinstellungen, die im Werk gemessen wurden. Betreiber stellen sie im Betrieb nach, oft ohne Dokumentation. Wenn ein Vorfall eintritt, der das System nicht erkannt hat, ist die Frage, ob die Voreinstellung des Herstellers oder die Nachstellung des Betreibers ursächlich war, häufig nicht mehr eindeutig zu beantworten.

Boswau und Knauer hat sich dafür entschieden, jeden Konfigurationsschritt in einer revisionssicheren Logik zu protokollieren. Wer eine Schwelle ändert, hinterlässt eine Spur. Wer eine Spur prüft, kann nachvollziehen, wer wann mit welcher Begründung geändert hat. Diese Disziplin ist nicht für den Normalbetrieb relevant, sie ist für den Krisenfall entscheidend. Sie ist außerdem die Grundlage dafür, dass die Versicherer und gegebenenfalls die Aufsichtsbehörden im KRITIS-Umfeld die Funktion der Anlage prüfen können, ohne dass der Hersteller in einer Rolle steht, in der er die eigene Konfiguration im Nachhinein verteidigen muss.

Die Aufteilung der Kalibrierungsverantwortung folgt einer einfachen Regel. Die initiale Konfiguration legt der Hersteller fest, auf Basis der Standortbeschreibung und der Prozessdaten des Betreibers. Die laufende Anpassung erfolgt in einem Vier-Augen-Prinzip, in dem der Operator des Betreibers vorschlägt und der Hersteller bestätigt oder umgekehrt. Eine einseitige Änderung durch eine der beiden Seiten ist möglich, sie wird dann aber im Protokoll mit dem Vermerk versehen, dass die Gegenseite nicht beteiligt war. Diese Konstruktion klingt aufwändig. Sie ist im Tagesbetrieb schlanker als jede Alternative, weil sie Streitfälle in der Konfigurationshistorie verhindert.

Die Frage der Haftung ist davon zu unterscheiden. Haftung folgt der vertraglichen Konstruktion und den allgemeinen Regeln des deutschen Rechts. Der Hersteller haftet für die Funktion der gelieferten Komponenten im Rahmen der zugesicherten Eigenschaften. Der Betreiber haftet für den ordnungsgemäßen Betrieb, einschließlich der Reaktion auf Alarme. BDSW und TÜV haben in den letzten Jahren mehrfach darauf hingewiesen, dass eine klare vertragliche Trennung dieser beiden Verantwortungssphären die Voraussetzung dafür ist, dass Sicherheitstechnologie im Schadensfall ihre Wirkung entfaltet. Wer beide Sphären vermengt, verliert im Schadensfall regelmäßig die Position, die er im Vertrag eigentlich gewollt hätte.

Was bleibt

Eine Falschalarmrate wird nicht durch ein einzelnes technisches Merkmal beherrscht. Sie wird durch eine Architektur beherrscht, die Mehrkanalprüfung auf Sensorebene und Kontextfilter auf Bedeutungsebene verbindet, die in einer Lernphase auf den konkreten Standort kalibriert wird und die in einer revisionsfähigen Konfigurationshistorie nachvollziehbar bleibt. Hersteller, die diese drei Elemente nicht in dieser Tiefe liefern, liefern keine ehrliche KI-gestützte Videoanalyse, sondern eine Erkennungslogik, deren Schwächen erst der Betreiber im Tagesbetrieb austragen muss.

Wer als Betreiber heute eine bestehende Anlage prüfen lässt oder eine neue plant, hat einen Hebel, der in den meisten Fällen unterschätzt wird. Drei Tage strukturierte Analyse der bestehenden Falschalarmlogik, ihrer Verteilung über Tageszeit, Standort und Auslösekanal, ergeben in der Regel eine Liste konkreter Schritte, die ohne Hardware-Wechsel umgesetzt werden können. Wer diese Analyse intern nicht leisten kann, findet sie in Weg II der Zusammenarbeit, im Audit über drei bis fünf Tage mit definiertem Festpreis und definiertem Lieferumfang. Wer die Wirkung der vorgeschlagenen Maßnahmen vor einer Skalierung an einem Standort prüfen will, geht in Weg III, den Pilotbetrieb über 90 Tage mit vor Beginn definiertem Erfolgsmaßstab. Beide Wege liefern Daten, die der Betreiber behält, unabhängig davon, ob er anschließend mit Boswau und Knauer weiterarbeitet oder nicht.

Häufige Fragen

Was ist eine akzeptable Falschalarmrate für KI-Videoüberwachung?

Eine akzeptable Falschalarmrate lässt sich nur in Bezug auf die Definition des Alarms angeben. Für Außenanwendungen in Bau, Industrie und Logistik liegt eine realistische Zielgröße im Dauerbetrieb im unteren einstelligen Bereich pro Kamera und 24 Stunden, in besser kontrollierten Umgebungen darunter. In der Inbetriebnahmephase liegt sie höher und reduziert sich nach Kalibrierung. Anbieter, die Werte nahe Null versprechen, ohne die gemessene Kategorie offenzulegen, sollten kritisch geprüft werden. Eine Rate von Null ist nur durch so hohe Schwellen erreichbar, dass echte Vorfälle ebenfalls verloren gehen.

Wie reduziert Mehrkanalprüfung Falschalarme?

Mehrkanalprüfung wertet einen Vorgang nur dann als Alarm, wenn mindestens zwei unabhängige Sensoren oder Erkennungslogiken ihn bestätigen. Die Kanäle müssen physikalisch unabhängige Eigenschaften erfassen, etwa optisch, thermisch und akustisch, und sie müssen aus eigenständigen Modellen stammen, nicht aus einem gemeinsamen Modell mit verschiedenen Eingängen. Die Methode reduziert Auslösungen durch Schatten, Vegetationsbewegung, Tiere und Sensorrauschen erheblich, weil diese Phänomene typischerweise nur in einem Kanal ein Signal erzeugen. Voraussetzung ist eine dokumentierte Abdeckung jedes Kanals im geprüften Bereich.

Was ist ein Kontextfilter in der Videoanalyse?

Ein Kontextfilter verbindet die technische Erkennung mit Informationen über den erwarteten Vorgang an diesem Ort zu dieser Zeit. Tageszeit, Wochentag, Schichtmodell, geplante Lieferungen, Zugangsberechtigungen und Wetterdaten fließen in die Bewertung ein. Eine Erkennung, die in den Kontext passt, wird als Routineereignis dokumentiert, eine Erkennung außerhalb des Kontextes wird als Alarm priorisiert. Der Filter reduziert nicht primär Fehlalarme im engeren Sinn, sondern irrelevante Erkennungen, die sonst manuell verworfen werden müssten. Seine Konfiguration verlangt Kenntnis der Kundenprozesse und eine Lernphase im Betrieb.

Wer kalibriert die Schwellwerte, Hersteller oder Betreiber?

Die initiale Konfiguration legt der Hersteller fest, auf Basis der Standortbeschreibung und der Prozessdaten des Betreibers. Die laufende Anpassung erfolgt in einem Vier-Augen-Prinzip, in dem eine Seite vorschlägt und die andere bestätigt. Jeder Konfigurationsschritt wird revisionssicher protokolliert, sodass die Historie im Krisenfall nachvollziehbar bleibt. Diese Trennung schützt beide Seiten und ist Voraussetzung dafür, dass Versicherer und gegebenenfalls Aufsichtsbehörden im KRITIS-Umfeld die Funktion prüfen können. Haftung folgt der vertraglichen Konstruktion und trennt klar zwischen Funktion der Komponenten und ordnungsgemäßem Betrieb.

Über den Autor

Dr. Raphael Nagel (LL.M.) ist Gründungspartner von Tactical Management. Er erwirbt und restrukturiert Industrieunternehmen in anspruchsvollen Marktumfeldern und schreibt über Kapital, Geopolitik und technologische Transformation. raphaelnagel.com

BSI-Grundschutz und physische Sicherheit: die Bausteine, die niemand liest

30. April 2026