Tak či onak většina současných i plánovaných ICT projektů představují obrovské zásahy a změny v současné infrastruktuře podniků. Tyto rozsáhlé změny přivádí podniky ke snaze implementovat podpůrná řešení, která jim umožní provádět zmíněné infrastrukturní změny bezpečně, rychle a s minimálními náklady. Schopnost mít k disposici veškeré potřebné informace o infrastruktuře, o vlastnostech všech komponent a vzájemných vazbách pak rozhoduje o úspěšnosti většiny současných a plánovaných ICT projektů.
Jeden z nejdůležitějších předpokladů k optimalizaci infrastruktury, k úspěšnému nasazování a provozu nových systémů, k úspěšné realizaci jakýchkoliv zásadnějších infrastrukturních změn je schopnost rozumnět zátěži.
Řada rozsáhlých infrastrukturních projektů, které společnost Trask solutions realizovala u svých zákazníků vedla k hledání vhodného řešení nejen pro prostý performance monitoring, ale pro skutečný Capacity Management. Unikátním řešením pro tuto oblast a nakonec vlajkovou lodí společnosti Trask solutions se tak stal TeamQuest. O tom, co vše dokáže řešení postavené na této technologii poskytnout a kde dokáže pomoci, bude pojednávat další část tohoto článku. Pojďme se tedy podívat na základní vlastnosti TeamQuest řešení.
Performance monitoring se netýká pouze serverů, ale celé infrastruktury. TeamQuest nabízí připravené sety metrik (System Activity, Network, Oracle, ...), které obsahují cca 100-300 unikátních statistik (čítačů). Z nich je pak možno na každý sledovaný objekt vybrat vhodnou množinu na základě charakteru i vlastnostech příslušného objektu a best-practices, které vychází ze zkušenosti společnosti TeamQuest i Trask solutions. Sbíraná data je možno ze sledovaných objektů konsolidovat v centrální databázi a pro rozsáhlejší infrastrukturu lze využít federativní architekturu. Výhodou je rovněž řada možností týkající se nastavení granulity dat a jejich případnou expiraci.
Analýza aktuálních i historických dat je základním předpokladem pro úspěšné řízení kapacit. Na základě aktuálních i historických informacích o zátěži TeamQuest reprezentuje zátěž v infrastruktuře prostřednictvím multidimenzionální matice která reflektuje veškeré vzájemné vztahy a vazby napříč všemi systémy i vrstvami.
Tato zcela unikátní vlastnost umožňuje skutečně porozumnět zátěži, jejím příčinám, závislostem a na základě toho rychle identifikovat příčiny případných problémů v celé infrastruktuře nebo s nevídanou přesností predikovat její chování v budoucnosti. User-friendly prostředí webové konzole umožňuje vytvářet pouhým drag&drop přetahováním výběrových atributů grafy, které reprezentují v mnoharozměrném matematickém modelu příslušný řez.
Pouhé přetažení nového parametru (např. jiná skupina serverů, čítačů, jiné časové období,...) znamená okamžité překreslení grafu. Uživatel může vytvořit zároveň několik různých grafů , které v reprezentují zátěž v daném časovém okamžiku z různých pohledů (např. jednotlivé vrstvy multi-tier aplikace ap.) což umožňuje lépe pochopit závislosti, vazby a příčiny zátěže.
Reporting je pak dalším logickým krokem za analýzami. Grafy, které lze pro účely analýzy snadno a rychle vytvářet systémem drag&drop jsou v tomto případě pevně nastaveny a automaticky odesílány na e-mailové adresy managerů nebo jsou automaticky publikovány na webových stránkách.
Alertování a notifikace poskytuje rychlý přehled na požadovanou částí infrastruktury formou heat-map s možností snadného propadu k detailním informacím. Na základě překročení prahových hodnot pak zafunguje notifikační systém (e-mail, SMS,...) a případně spuštění přednastaveného příslušného scriptu, které automaticky provede operaci vedoucí k vyřešení problému nebo snížené jeho dopadů.
Modelování je pravou třešničkou na dortu, kterou u jiných produktů nenaleznete. TeamQuest vychází ze znalosti zátěže dané infrastruktury a všech zvazeb a závislostí. To umožňuje vytvářet velice přesné matematické what-if scénáře. Co se stane, stoupne-li počet uživatelů o 30% ? Co se stane, když přidám další CPU? Díky aktualizované znalostní databázi obsahující informace o zařízeních všech předních výrobců HW můžeme TeamQuestu klást otázky typu „Jak se bude můj systém chovat na tomto konkrétním modelu serveru od tohoto výrobce?"
Závěrem několik příkladů a scénářů z praxe:
- Obchodní ředitel volá helpdesk. SAP začal pracovat s neobvykle dlouhými odezvami.
Operátor helpdesku v TeamQuestu díky drag&drop možnosti rychle analyzuje celou multi-tier SAP infrastrukturu a zjistí příčiny problému. - Ředitel provozu potřebuje na pravidelné pondělní porady vedení reporty o aktuálním využití provozovaných systémů jednotlivými odděleními a vytížení klíčových zdrojů v minulém týdnu.
TeamQuest automaticky připravuje příslušné reporty a zasílá je na e-mailovou adresu ředitele provozu. - Banka připravuje rozsáhlou marketingovou kampaň, po které se předpokládá několikanásobně větší počet klientů, kteří budou přistupovat na webový portál banky.
Prostřednictvím TeamQuestu proběhne modelování situace a nalezení hranice počtu klientů, při kterém již webový portál ve stávající konfiguraci nebude postačovat. Na základě odhadu počtu uživatelů ve špičce, kterou ICT oddělení obdrželo od marketingového oddělení a výsledků modelování bylo rozhodnuto posílit databázové backendy o další CPU a RAM a do farmy webových front-endů zařadit další virtuální server. - Po udatování objednávkového systému proběhli veškeré příslušné testy a vše funguje v pořádku.
Na základě reportů z TeamQuestu se však ukazuje, že zátěž CPU na Oracle serverů je vyšší v průměru o 30%. Další analýzou byla identifikována chyba, která byla obsažena v nových opravách a která při vyšším počtu uživatelů mohla způsobit pád serveru.