(Dieser Beitrag erschien zuerst als Gast-Beitrag auf der Load-Impact)
Vor-Ort-Test-Tools, APMs, CEMs und Server / Netzwerk-basierte Monitoring-Lösungen können Sie nicht in ein umfassendes Bild von der Leistung Ihres Systems werden zu geben; Cloud-basierte kontinuierliche Prüfung kann.
Wenn es um die Anwendungsleistung kommt gibt es eine breite Palette von möglichen Ursachen zu Performance-Problemen und Endanwender Unzufriedenheit. Es ist hilfreich, die gesamte Umgebung zu betrachten, von Endbenutzer-Browser oder ein mobiles Gerät den ganzen Weg durch den Web & Application Server, wie das komplexe System, das es ist.
Der Stand der Technik in Application Performance Monitoring hat sich weiterentwickelt Vor-Ort-Test-Tools, Application Performance Monitoring (APM) -Lösungen, Customer Experience Monitoring (CEM) Lösungen, Server und Netzwerk-basierte Überwachung einzubeziehen. Alle diese Technologien suchen, um Ursachen von Performance-Problemen, real oder wahrgenommen durch Endbenutzer bestimmen. Jede dieser Technologien hat seine eigenen Vorzüge und Kosten und versuchen, das Problem aus verschiedenen Blickwinkeln zu bewältigen. Oft wird ein mehrdimensionalen Ansatz ist erforderlich, wenn hohe Wert, unternehmenskritische Anwendungen entwickelt und eingesetzt werden.
On-Premise-Lösungen kann der Umwelt sprengen mit 10 GBit / s-Verkehr, um Router, Switches und Server zu betonen. Diese Lösungen können sehr komplex und teuer sein und werden typischerweise verwendet, um neue Technologien zu validieren, bevor es in dem Unternehmen bereitgestellt werden.
APM-Lösungen kann sehr effektiv sein bei der Bestimmung, ob Netzwerkprobleme Performance-Probleme verursachen oder wenn die Ursache anderswo. Sie werden in der Regel Paketdaten von einem Schalter SPAN-Port oder TAP (Test Access Point) nehmen, oder möglicherweise eine abhörAggregationsLösung. APM-Lösungen sind in der Regel "Always-on" und kann ein Frühwarnsystem Erkennung Anwendungen Probleme sein, bevor die Help-Desk über ein Thema kennt. Diese Systeme können auch sehr komplex sein und wird die Ausbildung und professionelle Dienstleistungen benötigen, um den Maximalwert zu bekommen.
Was all diese Lösungen fehlt, ist eine ganzheitliche Betrachtung des Systems, die zu berücksichtigen Edge-Geräte zu übernehmen hat (Firewalls, Anti-Malware, IPS, etc.), Netzwerkverbindungen und sogar Endpunkt Herausforderungen wie Paketverlust und Latenzzeit von mobilen Verbindungen. In-Cloud-Testplattformen wie erlauben sowohl Entwickler und Anwendungseigentümer eine kontinuierliche Testmethode zu implementieren, die Licht auf Probleme werfen können, die Anwendungsleistung auswirken kann, die von anderen Lösungen übersehen werden könnten.
Ein einfacher Weg, dies zu erreichen, ist eine langfristige (1 bis 24+ h) Anwendungsreaktionstest durchzuführen für Anomalien zu suchen, die zu bestimmten Zeiten des Tages auftauchen können. In diesem Beispiel komprimiert ich den Zeitplan und stellte meine eigene Anomalien die Auswirkungen der gemeinsamen Infrastrukturänderungen zu erläutern.
Die Testumgebung ist auf einer esxi Plattform gebaut und verfügt über einen 10-Gbit-Netz, eine 1-Gbit-physischen LAN, NG Firewall und einen 50/5 Mbit / s Internet-Link. Für die Zwecke dieser Prüfung die Produktion Konfiguration der Untangle NG Firewall wurde intakt gelassen - einschließlich Firewall-Regeln, IPS Schutz jedoch QoS wurde deaktiviert. Turnkey Linux wurde für die Ubuntu-basierte Apache Webserver mit 8 CPU-Kernen und 2 GB RAM verwendet.
Es war überraschend für mich, welche Auswirkungen die Antwortzeiten tat und was überhaupt keine Wirkung hatte. Hier sind ein paar Beispiele:
An erster Stelle ist der Einfluss der Bandbreitenverbrauch auf den Link, um die Web-Server Farm dient. Dies wurde durch sättigender den Download-Link mit dem Verkehr erreicht, und wie erwartet hatte dramatische Auswirkungen auf die Reaktionszeit von Anwendungen:
Als nächstes wird die Ausführung eines Vmware Snapshot des Webservers. Ich erwartete voll diese Antwortzeiten erheblich zu beeinflussen, aber die Wirkung ist kurz. Wenn dies eine größere VM war dann könnte die Wirkung von längerer Dauer gewesen:
Schließlich war ein Testnetzüberlastung auf dem LAN-Segment zu simulieren, wo der Webserver läuft. Dieser Test wurde durchgeführt unter Verwendung von Iperf 15+ Gbit / s-Netzwerkverkehr auf den Webserver VM zu erzeugen. Während ich dies voll erwartete Server Antwortzeiten zu beeinflussen, die Tatsache, dass es ein Beweis dafür, wie gut die 10Gig vmxnet3 Netzwerktreiber ist nicht der Fall ist getan:
eine kontinuierliche Überwachung Ansatz für die Anwendungsleistung nehmen hat Vorteile nicht nur Anwendungsentwickler und Eigentümer, sondern diejenigen, die für Netzwerk, Sicherheit und Server-Infrastruktur. Die Fähigkeit, den Moment zu lokalisieren, wenn die Leistung verschlechtert und korrelieren, dass mit Server-Ressourcen (mit dem) und andere externe Ereignisse ist sehr mächtig. Oft Anwendungsbesitzer haben keine Kontrolle oder Transparenz in die gesamte Infrastruktur und mit Beton "wann und wo" Beweise macht produktiver in der Organisation Gespräche anderen Teams haben.