Laut dem „Kaseya State of the MSP 2026“ geben 83 % der MSPs an, dass ihre IT-Management-Tools die betriebliche Effizienz erheblich steigern – und diese Effizienz beginnt mit einem NOC, das Probleme erkennt, bevor die Kunden sie bemerken. Laden Sie hier den vollständigen Bericht herunter.
Wenn eine IT-Umgebung komplex genug ist, erfordert ihre effektive Überwachung eine eigene Funktion. Für große Unternehmen und Managed-Service-Provider, die mehrere Kundenumgebungen gleichzeitig verwalten, ist diese Funktion das Network Operations Center (NOC).
Das NOC ist die operative Drehscheibe, in der die IT-Infrastruktur überwacht, Vorfälle erkannt und priorisiert sowie die Maßnahmen koordiniert werden, die den Betrieb und die Verfügbarkeit der Systeme gewährleisten. Zu verstehen, welche Aufgaben ein NOC erfüllt, wie es aufgebaut ist und wann es sinnvoll ist, ein solches Zentrum selbst aufzubauen oder zu erwerben, ist für jede Führungskraft im IT-Bereich, die sich mit der Skalierbarkeit des Betriebs befasst, von entscheidender Bedeutung.
Das Wichtigste in Kürze
- Ein NOC ist die operative Drehscheibe für die Überwachung des Zustands der Infrastruktur, die Erkennung von Vorfällen und die Aufrechterhaltung der Dienstverfügbarkeit, wobei der Schwerpunkt eher auf der Aufrechterhaltung des Betriebs als auf der Reaktion auf Sicherheitsbedrohungen liegt.
- NOC und SOC dienen unterschiedlichen Zwecken (Verfügbarkeit vs. Sicherheit), arbeiten jedoch in ausgereiften IT-Betriebsabläufen eng zusammen, wobei für Vorfälle, die beide Bereiche betreffen, festgelegte Übergabeprozesse bestehen.
- Für MSPs ist das NOC das operative Rückgrat einer skalierbaren Dienstleistungserbringung. Durch ausgelagerte NOC-Dienstleistungen wird eine Überwachung rund um die Uhr ermöglicht, ohne dass die Personalkosten eines vollständig intern betriebenen NOC anfallen.
- Die wichtigsten Kennzahlen zur Messung der NOC-Effizienz – die Zeit vom Alarm bis zur Behebung, die Erstlösungsquote und das Verhältnis von relevanten zu irrelevanten Alarmen – entscheiden darüber, ob die Funktion mit dem Kundenwachstum rentabel mitwachsen kann.
Was ist ein NOC?
Ein NOC ist eine zentralisierte Einrichtung (physisch oder virtuell), von der aus IT-Fachkräfte Probleme überwachen, verwalten und beheben, die die Verfügbarkeit und Leistung einer IT-Umgebung beeinträchtigen. Der Schwerpunkt liegt auf dem Betrieb: Systeme am Laufen zu halten, Störungen zu beheben und die Verfügbarkeit der Dienste sicherzustellen.
NOCs überwachen die Netzwerkinfrastruktur, Server, Anwendungen und Endgeräte und achten dabei auf Leistungseinbußen, Verfügbarkeitsausfälle und Betriebsstörungen, die eine Reaktion erfordern. Wird ein Problem festgestellt, untersucht das NOC den Vorfall, versucht, ihn zu beheben, und leitet ihn an Spezialistenteams oder Bereitschaftstechniker weiter, wenn die Behebung Fähigkeiten erfordert, die über den Zuständigkeitsbereich des NOC hinausgehen.
Für MSPs ist die NOC-Funktion das operative Rückgrat der Dienstleistungserbringung: das Team und die Infrastruktur, die rund um die Uhr die Überwachung und Erstmaßnahmen in allen Kundenumgebungen übernehmen, sodass sich spezialisierte Techniker auf komplexe Aufgaben konzentrieren können, anstatt sich mit der Erstbeurteilung zu befassen. Der 24/7-Betrieb ist entscheidend, da IT-Probleme sich nicht an Geschäftszeiten halten. Ein Server, der an einem Samstag um 2 Uhr morgens ausfällt, erfordert dieselbe Reaktionsdisziplin wie einer, der an einem Dienstag um 11 Uhr ausfällt, und die MSPs, die dies konsequent leisten können, sind diejenigen, die Kunden binden und durch Weiterempfehlungen wachsen.
NOC vs. SOC: Zwei unterschiedliche Funktionen
NOC und SOC werden oft verwechselt, haben jedoch unterschiedliche Funktionen:
- Das NOC konzentriert sich auf Verfügbarkeit und Leistung und sorgt dafür, dass die Systeme laufen. Es befasst sich mit Ausfällen, Leistungseinbußen, Hardwareausfällen, fehlgeschlagenen Sicherungsaufträgen und betrieblichen Vorfällen, die sich auf die Bereitstellung von IT-Diensten auswirken. Das Bedrohungsmodell ist in erster Linie betrieblicher Natur: Ausfallzeiten, Leistungseinbußen, Ausfälle.
- SOC konzentriert sich auf die Sicherheit und den Schutz von Systemen vor Angriffen. Es befasst sich mit der Erkennung von Bedrohungen, der Reaktion auf Vorfälle und den Sicherheitsereignissen, die auf böswillige Aktivitäten hindeuten. Das Bedrohungsmodell ist in erster Linie auf Angreifer ausgerichtet: Angreifer, Malware, Sicherheitsverletzungen.
In der Praxis hängen diese Funktionen miteinander zusammen: Ein Ransomware-Angriff ist gleichzeitig ein Sicherheitsvorfall (SOC) und ein Vorfall im Zusammenhang mit der Dienstverfügbarkeit (NOC). In etablierten Organisationen arbeiten NOC und SOC eng zusammen, wobei für Vorfälle, die sowohl den operativen als auch den Sicherheitsbereich betreffen, festgelegte Übergabepunkte bestehen.
Was ein NOC macht
Kontinuierliche Überwachung.
Das NOC überwacht mithilfe von Überwachungsplattformen und Warnsystemen Indikatoren zum Zustand der Infrastruktur, die Serververfügbarkeit, die Netzwerkleistung, die Reaktionszeiten von Anwendungen, den Status von Sicherungsaufträgen sowie Kennzahlen zum Zustand der Hardware. Ziel ist es, Probleme zu erkennen, bevor sie zu für die Nutzer sichtbaren Ausfällen führen.
Einstufung von Vorfällen und Erstmaßnahmen.
Wenn Warnmeldungen ausgelöst werden, untersuchen die Techniker im NOC den Vorfall, um Schweregrad, Auswirkungen und die geeignete Reaktion zu ermitteln. Viele Vorfälle können auf NOC-Ebene ohne Eskalation behoben werden: Neustart von Diensten, Freigabe von Speicherplatz, Leistungsoptimierung. Diejenigen, die nicht behoben werden können, werden mit allen relevanten Informationen an den zuständigen Techniker weitergeleitet.
Koordination von Patches und Wartungsarbeiten.
NOCs koordinieren häufig planmäßige Wartungsarbeiten, die Installation von Patches, Firmware-Updates und die Überprüfung von Backups, um sicherzustellen, dass diese konsistent durchgeführt werden und etwaige Probleme, die sich aus der Wartung ergeben, schnell erkannt werden.
Eskalationsmanagement.
Klare Eskalationswege stellen sicher, dass Vorfälle, die Fachkenntnisse, die Einbindung von Anbietern oder Entscheidungen der Geschäftsleitung erfordern, mit den entsprechenden Hintergrundinformationen an die richtigen Ansprechpartner weitergeleitet werden. Das NOC fungiert dabei als erste Instanz.
Kommunikation.
Bei Vorfällen koordiniert das NOC in der Regel die interne Kommunikation und die Kommunikation mit den Kunden, hält die Statusaktualisierungen auf dem neuesten Stand, sorgt dafür, dass alle Beteiligten informiert werden, und dokumentiert den zeitlichen Ablauf des Vorfalls.
NOC-Tools und -Technologie
RMM ist das wichtigste operative Werkzeug für NOC-Techniker. RMM die Überwachungsfunktionen, das Alarmmanagement, die Fernzugriffsmöglichkeiten und die Skript-Tools, auf die NOC-Workflows angewiesen sind. Sie übernimmt zudem die automatisierte Bereitstellung von Patches und Software-Updates, sodass routinemäßige Wartungsarbeiten planmäßig ablaufen, ohne dass für jede einzelne Aufgabe ein manueller Eingriff durch das NOC erforderlich ist. Sowohl Kaseya VSA als auch Datto RMM darauf ausgelegt, NOC-weite Abläufe über mehrere Kundenumgebungen hinweg von einer einzigen Konsole aus zu unterstützen.
PSA-/Ticket-System: Vom NOC erkannte Vorfälle müssen als Tickets erfasst werden. Die Integration zwischen den RMM Warnmeldungen und der Erstellung von PSA-Tickets automatisiert den Ticket-Lebenszyklus: Bei Auslösung einer Warnmeldung wird ein Ticket eröffnet, das NOC untersucht den Vorfall und aktualisiert das Ticket, und das Ticket wird geschlossen, sobald der Vorfall behoben ist. Eine reibungslose Integration RMM verhindert, dass das Warnmeldungsvolumen mit steigender Kundenzahl unüberschaubar wird.
Netzwerküberwachung: Die SNMP-basierte Überwachung bietet Einblick in den Betriebszustand von Routern, Switches und Firewalls und erfasst die Bandbreitennutzung, Schnittstellenfehler sowie die Geräteverfügbarkeit. Für MSPs, die die Netzwerkinfrastruktur ihrer Kunden verwalten, ist die SNMP-Überwachung das Mittel der Wahl, um einen ausfallenden Switch zu erkennen, noch bevor der Kunde bemerkt, dass seine Drucker nicht mehr funktionieren.
Neben der Überwachung von Netzwerkgeräten erfasst das NOC-Tool auch die CPU- und Speicherauslastung, Schwellenwerte für die Festplattenkapazität, die Verfügbarkeit von Diensten sowie die Reaktionszeiten von Anwendungen auf Servern und Workstations. Dank der schwellenwertbasierten Alarmierung wird das NOC benachrichtigt, sobald sich bei einem Server ein Ressourcenproblem abzeichnet – und nicht erst, nachdem es bereits zu einem Ausfall geführt hat.
Die Überwachung von Backups und die Überprüfung, ob Backup-Aufträge erfolgreich abgeschlossen wurden, ist eine zentrale Aufgabe des NOC, die häufig unterschätzt wird. Ein Backup, das drei Wochen lang unbemerkt fehlschlägt, ist kein Backup. NOC-Tools sollten fehlgeschlagene, unvollständige oder nicht verifizierte Backup-Aufträge als Warnmeldungen anzeigen, die dieselbe Priorisierungsdisziplin erfordern wie Verfügbarkeitsvorfälle.
Dashboards und Visualisierung: Echtzeit-Dashboards bieten NOC-Technikern einen konsolidierten Überblick über den Systemzustand aller überwachten Clients oder Systeme und dienen als Grundlage für die kundenorientierte Berichterstattung über Verfügbarkeit, SLA-Einhaltung und Trends bei Vorfällen.
Eigenaufbau vs. Auslagerung von NOC Services
Die Entscheidung, ein eigenes NOC aufzubauen oder diese Funktion auszulagern, folgt denselben wirtschaftlichen Überlegungen wie die Entscheidung bezüglich des SOC:
Ein internes NOC bietet maximale Kontrolle und institutionelles Wissen, erfordert jedoch einen vollständigen Investitionsaufwand: Personal zur Deckung des Bedarfs, physische oder virtuelle Infrastruktur, Tool-Lizenzen sowie laufende Verwaltungskosten. Für große MSPs oder Unternehmen mit komplexen Umgebungen ist ein internes NOC sinnvoll.
Ein ausgelagertes NOC (White-Label-NOC-Dienste) bietet Überwachungs- und Erstreaktionskapazitäten ohne den damit verbundenen betrieblichen Aufwand. Für wachsende MSPs, die noch nicht die Größe erreicht haben, um die Investition in ein internes NOC zu rechtfertigen, ermöglicht ein ausgelagertes NOC, ihren Kunden eine Überwachung rund um die Uhr anzubieten, ohne dass Personalkosten anfallen.
Ein hybrides Modell, bei dem ein externes NOC für Überlastungen, den Bereitschaftsdienst außerhalb der Geschäftszeiten oder die Tier-1-Triage genutzt wird, während ein internes Team für komplexe Aufgaben und das Kundenbeziehungsmanagement zuständig bleibt, ist ein gängiges Wachstumsmodell für MSPs, die die Investitionsschwelle für eine vollständige interne Kapazität überschreiten.
Kaseya NOC Services ausgelagerte Überwachungs- und Supportleistungen rund um die Uhr, die MSP ergänzen und das Alarmaufkommen sowie die Triage von Supportanfragen übernehmen, wofür andernfalls zusätzliches Personal erforderlich wäre.
NOC für MSPs
Für MSPs ist das NOC der operative Motor, der darüber entscheidet, ob Wachstum rentabel ist. Ein MSP neue Kunden gewinnt, ohne über die operative Infrastruktur zu verfügen, um diese Kunden effektiv zu überwachen und auf ihre Anforderungen zu reagieren, verzeichnet zwar steigende Umsätze, geht dabei jedoch gleichzeitig ein wachsendes operatives Risiko ein.
Die wichtigsten operativen Kennzahlen, die die Effektivität des NOC bestimmen:
- Zeit von der Meldung bis zur Lösung: Wie lange dauert es von der Erkennung der Meldung bis zum Abschluss des Vorfalls? Eine schnellere Lösung bedeutet geringere Auswirkungen auf die Kunden und eine geringere Eskalationslast für die Fachtechniker.
- Lösungsquote beim ersten Kontakt: Der Prozentsatz der Vorfälle, die das NOC ohne Eskalation löst. Höhere Quoten bedeuten eine effektivere Triage durch das NOC und eine bessere Auslastung der Fachkräfte.
- Alarm-Rausch-Verhältnis: das Verhältnis von echten Vorfällen zu Fehlalarmen. Ein hohes Alarm-Rausch-Verhältnis bindet die Kapazitäten des NOC für nicht relevante Vorfälle und führt zu einer Überlastung, die dazu führt, dass echte Alarme übersehen werden.
- SLA-Einhaltung, d. h. der Prozentsatz der Vorfälle, die innerhalb der vertraglich vereinbarten Reaktions- und Lösungsfristen bearbeitet wurden. Die SLA-Einhaltung ist ein direkter Maßstab für die Qualität des Kundenservices.


