Potrzebujesz pomocy?
Zadzwoń, skierujemy cię do odpowiedniego specjalisty w dziale technicznym
 

dyr. Działu Technicznego
tel. +48 601 836 736

Real Time Data – Tomasz Gzik

Real-Time Data (dane czasu rzeczywistego), to zagadnienie warte uwagi, chociażby z uwagi na fakt, że jest elementem kierunków strategicznych wielu organizacji, m.in. Banku Pekao SA i Tesco. Raporty branżowe (Forrester, Boston Retail Partners) wskazują, że dane czasu rzeczywistego są podstawą i jednocześnie warunkiem rozwoju m.in. całego sektora Retail. Poniżej podjęto próbę wyjaśnienia, co kryje się pod tym określeniem w teorii i praktyce.

 

Krótki przegląd definicji

Portal techopedia.com dane czasu rzeczywistego określa jako:

dane, które są dostarczane do użytkownika końcowego najszybciej jak to możliwe po ich zgromadzeniu.

Według HVR (jeden z producentów rozwiązań przetwarzania danych w czasie rzeczywistym):

dane czasu rzeczywistego zaraz po ich wygenerowaniu są natychmiast kopiowane do jednego lub wielu miejsc docelowych, w których będą przechowywane i z których będą udostępniane.

Słownik Cambridge wskazuje, że dane czasu rzeczywistego, to:

dane, które natychmiast po ich otrzymaniu/wygenerowaniu są przekazywane i/lub udostępniane.

Nie dyskutując dalej przytoczonych definicji, warto zaznaczyć, że każda z nich opiera się na założeniu – po wygenerowaniu i/lub zapisaniu danych natychmiast następuje ich dalsze przetwarzanie. Cele i konteksty tego przetwarzania mogą być różne i co bardzo ważne, wzajemnie się nie wykluczają.

 

Implementacja Real-Time Data w organizacji

Real-Time Data, to możliwość dostępu do zawsze aktualnych danych, bez względu na to gdzie i w jaki sposób są przetwarzane. Najczęściej implementacja oparta jest o rozwiązania określane jako Real-Time Data Replication, Real-Time Data Processing, Real-Time Data Integration, np. HVR, Oracle GoldenGate. Narzędzia tej klasy umożliwiają replikację danych w czasie rzeczywistym (opóźnienia na poziomie 1-2s) pomiędzy różnymi biznesowo i technologicznie platformami IT (rysunek poniżej, źródło: hvr-software.com).

Ważną funkcjonalnością jest modyfikacja danych w trakcie replikacji, np. do postaci gotowych raportów oraz badanie spójności danych pomiędzy środowiskami źródłowymi i docelowymi wraz z możliwością automatycznej korekty.

Podsumowując, dzięki zastosowaniu mechanizmów replikacji danych w czasie rzeczywistym, uzyskujemy nieograniczony dostęp do zawsze aktualnych danych produkcyjnych bez względu na to w jakiej lokalizacji geograficznej są generowane i przetwarzane.

Co to oznacza w praktyce biznesowej i IT? Jakie możliwości biznesowe i techniczne zapewniają tej klasy rozwiązania?

 

Biznesowy kontekst wykorzystania Real-Time Data

Załóżmy, że raportowanie danych w organizacjach realizowane jest w dwóch modelach:

  1. użytkownicy pozyskują dane bezpośrednio z systemów źródłowych, w których dane są przetwarzane;
  2. użytkownicy pozyskują dane z systemów raportowych zasilanych danymi z systemów źródłowych, w których dane są przetwarzane.

 

W pierwszym modelu użytkownicy posiadają dostęp do danych zawsze aktualnych (założenie danych czasu rzeczywistego jest spełnione), ale tylko w kontekście pojedynczych systemów, co stanowi istotne ograniczenie w przypadku potrzeby analizowania danych pochodzących z różnych źródeł. Bardzo ważny jest również aspekt wydajność i stabilności działania systemów źródłowych, które w takim modelu często ulegają awarii w wyniku obciążenia procesami raportowymi, przerywając ciągłość realizacji procesów biznesowych i generując straty biznesowe.

Klasyczne scentralizowane systemy raportowe zasilane są danymi w cyklach czasowych, często dobowych (drugi z wymienionych wyżej modeli). Umożliwiają dostęp do wszystkich lub wybranych danych organizacji, co adresuje ograniczenia pierwszego modelu, ale nie zapewniają dostępu do danych rzeczywistych (czasowe cykle zasilania).

Zastosowanie replikacji danych w czasie rzeczywistym zapewnia automatyczne przenoszenie danych po każdej operacji w systemie źródłowym w „inne miejsce”, które będzie stanowiło podstawę do raportowania, z zachowaniem spójności danych z systemem źródłowym. Przykładową – nie jedyną – architekturę przedstawia rysunek poniżej (źródło: hvr-software.com).

Takie podejście skraca czas przetwarzania danych, obniża ryzyko braku dostępności danych w wyniku awarii „ciężkich” i czasochłonnych (najczęściej nocnych) procesów przetwarzania oraz zapewnia dostęp do zawsze aktualnych danych.

Dla organizacji, dla których dostęp do danych odświeżanych online nie jest kluczowy, wartością pozostaje skalowalna i wydajna architektura oraz mechanizmy przetwarzania danych w czasie rzeczywistym, które zapewniają wysoką dostępność i spójność danych oraz wpływają na optymalizację procesów operacyjnych związanych z ich przetwarzaniem. Warto zaznaczyć, że dynamika rynku jest duża i dostęp do danych czasu rzeczywistego może „za chwilę” okazać się nie tyle pomocny dla organizacji, które aktualnie go nie potrzebują, ale konieczny z perspektywy rozwoju biznesu i pozostawania konkurencyjnym.

Przetwarzanie danych w czasie rzeczywistym zapewnia możliwość śledzenia online operacji biznesowych, a za tym podejmowanie decyzji i inicjowanie różnego rodzaju procesów biznesowych w oparciu o aktualny „obraz sytuacji”. To nie tylko duży komfort, ale często źródło przewagi konkurencyjnej. Kilka przykładów:

  • Retail: śledzenie sprzedaży i stanów magazynowych we wszystkich punktach sprzedaży, bez względu na ich lokalizację geograficzną, umożliwia dynamiczne zarządzanie kampaniami marketingowymi – real-time marketing;
  • Bankowość: centralizacja i przetwarzanie online danych o klientach oraz wszystkich operacjach z nimi związanych umożliwia obniżenie kosztów ich obsługi, podniesienie jakości obsługi, personalizację oferty kierowanej do klientów w czasie rzeczywistym – real-time sales;
  • Finanse: transfer danych online do systemów fraud’owych pozwala na ograniczenie poziomu nadużyć finansowych;
  • Medycyna: synchronizacja online kalendarzy wizyt w placówkach medycznych umożliwia efektywne wykorzystanie czasu pracy lekarzy;
  • Logistyka: precyzyjne monitorowanie łańcucha dostaw zapewnia możliwość ich optymalizacji, szybkiego reagowania na incydenty i ograniczanie strat z nimi związanych;
  • Transport: synchronizacja w czasie rzeczywistym systemów planowania lotów/przejazdów.

 

Techniczny kontekst wykorzystania Real-Time Data

Zarządzanie danymi stanowi wyzwanie dla większości organizacji, m.in. z powodu szybkiego przyrostu danych, dużej ilości i różnorodności przetwarzanych danych, rozproszenia geograficznego systemów przetwarzających dane oraz heterogenicznej biznesowo i technologicznie infrastruktury systemowej. Narzędzia do replikacji danych w czasie rzeczywistym stanowią istotny element architektury przetwarzania danych. Poza optymalizacją procesów przetwarzania, umożliwiają m.in.:

  1. realizację bezprzestojowych operacji serwisowych baz danych bez konieczność wyznaczania okien serwisowych i przerywania realizacji procesów biznesowych;
  2. migrację danych pomiędzy różnymi technologicznie bazami danych z minimalnym czasem przestoju;
  3. synchronizację ośrodków przetwarzania w modelu Active-Active, a przez to zwiększenie efektywność utylizacji mocy obliczeniowej poszczególnych ośrodków, wzrost wydajność i poprawa stabilność aplikacji biznesowych oraz zapewnienie bezpiecznej architektury High Availability;
  4. zasilanie online środowisk testowych wraz z anonimizacją danych – zagadnienie bardzo problematyczne dla wielu organizacji, z wykorzystaniem mechanizmów Real-Time Data Replication staje się bardzo proste w implementacji, zarządzaniu i skalowaniu.

 

Różnorodność środowisk z których i do których dane mogą być replikowane przedstawiono poniżej (źródło: hvr-software.com).

Podsumowanie

Na koniec, pozwolę sobie sparafrazować słowa P. F. Druckera z 1999 roku…

…nadeszła wielka rewolucja informacyjna, jej zarzewiem stał się świat biznesu, ale już niebawem, fala rewolucyjnych zmian zaleje wszystkie instytucje współczesnego społeczeństwa. Radykalnie przewartościowane zostało znaczenie informacji, zarówno w odbiorze organizacyjnym, jak i jednostkowym. Informacja stała się kluczowym zasobem pozostającym w dyspozycji przedsiębiorstw.

Serdecznie zapraszam do kontaktu i rozwinięcia tematu.

Tomasz Gzik

Tomasz Gzik
IT & Business Executive