Spica Solutions| Monitoring Apache Spark oraz Hadoop

Monitoring Apache Spark oraz Hadoop

Technologie Apache Spark wraz z Apache Hadoop wykorzystywane są powszechnie to przetwarzań na poziomie Big Data. Jednocześnie, trudno jest właściwie monitorować przetwarzanie, zwłaszcza na środowiskach rozproszonych, gdy pojedyncza aplikacja wykonuje się na wielu worker node’ach.

Jesteśmy autorami rozszerzania, które kolekcjonuje najważniejsze metryki udostępniane przez API Apache Spark, pozwalając na należytą ich korelację z pomiarami wykonanymi przez narzędzia APM pracujące na hoste’ach. Pozwala nam to mieć podgląd na żywo, która aplikacja oraz executor pracowały na danym workerze. Wiemy, ile zasobów zaalokowało, czy stage lub job zakończył się błędem. Mając komplet informacji możemy łatwo stwierdzić, z którymi przetwarzaniami nasze środowisko nie radzi sobie dobrze, a co za tym idzie, gdzie powinniśmy rozpocząć optymalizację.

Nasze rozwiązanie zintegrowane jest z Dynatrace, może być ono jednak częścią każdego innego rozwiązania APM pozwalającego na wprowadzanie doń metryk.

KORZYŚCI DLA KLIENTA

Możliwość wytypowania problematycznych aplikacji (informacja o konkretnym ID, executorze i host)
Możliwość utworzenia alertowania w przypadku problemów z przetwarzaniem w czasie rzeczywistym
Rozszerzenie pracuje zarówno z prostymi instalacjami jak i na środowisku YARN
W połączeniu z narzędziem APM pozwala odpowiadać na pytania co do przyczyn awarii na monitorowanym środowisku

Powrót

Phone number:

Opening times:

E-mail address:

Monitoring Apache Spark oraz Hadoop