FOTC
  • Oferta
    • Google Workspace
    • Google Cloud Platform
  • Usługi
        • Google Workspace
          • Audyt bezpieczeństwa
          • Wsparcie techniczne
          • Cos tam cos
        • Google Cloud
          • Landing Zone
          • cos 1
  • O nas
  • Wiedza
  • Blog
Kontakt
ro pl hu bg en
  • Polityka Prywatności

Elastyczne tworzenie szablonów dzięki Dataflow Flex Templates w Google Cloud

Ida Ożarowska

5 października 2020
Elastyczne tworzenie szablonów dzięki Dataflow Flex Templates w Google Cloud

Analiza danych stanowi ważny element rozwoju wielu organizacji. To obszar, w którym znalezienie wspólnego języka między technologią a biznesem jest niezwykle ważne do efektywnego działania.

W wielu przypadkach działy analiz biznesowych korzystają z przygotowanych przez developerów pipeline’ów. Pipeline to cykl szeregowego przetwarzania danych, gdzie dane wyjściowe jednego elementu są danymi wejściowymi elementu następnego. 

Do niedawna wykorzystanie przez biznes pracy developerów było dość kłopotliwe – uruchomienie pipeline’u wymagało instalacji i konfiguracji środowiska programistycznego wraz ze wszystkimi zależnościami (np. bibliotekami) po stronie użytkownika oraz wprowadzenia zmian w kodzie źródłowym. A nie każdy analityk biznesowy ma wiedzę programistyczną, by sprawnie poradzić sobie z tym zadaniem.

Grafika prezentuje proces uruchamiania pipeline przed wprowadzeniem przez Google Cloud rozwiązania, jakim są szablony Dataflow:

dataflow flex templates

Proces uruchamiania pipeline znacznie uprościły szablony – classic templates i od niedawna Flex Templates.

Udostępnianie pipeline’ów Dataflow z klasycznymi szablonami

Dotychczas Google dawało możliwość wykorzystania klasycznych szablonów (classic templates). Funkcjonalność pozwala developerowi uruchomić pipeline w środowisku programistycznym, gdzie następnie konwertuje go do szablonu i zamieszcza w Cloud Storage. Użytkownik może uruchomić szablon bez konieczności instalowania i konfigurowania środowiska programistycznego.

dataflow flex templates

Klasyczne szablony posiadają jednak kilka ograniczeń – m.in. nie dają użytkownikowi możliwości wprowadzania zmian czy samodzielnego dopasowania do potrzeb analizy (np. w kwestii wyboru źródła danych wyjściowych), co dalej wymagało od developerów tworzenia różnych wariantów pipeline’ów; klasyczne szablony są też uzależnione od interfejsu ValueProvider Apache Beam, które posiada ograniczoną liczbę źródeł wejścia i wyjścia. Analityka, nawet z ułatwieniem w postaci classic templates, wciąż była ciężkim kawałkiem chleba, angażującym developerów i znacznie ograniczającym analityków.

Dopasowanie pipeline do potrzeb analizy dzięki Dataflow Flex Templates

Z początkiem października 2020 Google rozszerzyło możliwości udostępniania i wykorzystania pipeline’ów dzięki Flex Templates.

Flex Templates zapewnia większą elastyczność w porównaniu z szablonami klasycznymi. Podobnie jak classic templates, Flex Templates również daje możliwość uruchomienia pipeline’u bez konieczności instalowania środowiska programistycznego. Ponadto pozwala analitykom wprowadzać zmiany w szablonach – np. wybierać dowolne źródło danych wejściowych i wyjściowych (source/sink), co zdejmuje z developerów konieczność tworzenia kilku wariantów szablonów. Flex Templates usuwa też zależność od interfejsu ValueProvider, co pozwala korzystać z większej liczby źródeł.

Schemat tworzenia i udostępniania Flex Templates wygląda następująco:

dataflow flex templates

Developer tworzy pipeline. Zamiast zamieszczać go w Cloud Storage, konwertuje kod lub pliki binarne do obrazu dockera i zapisuje go w Google Container Registry. Tworzy też plik ze specyfikacją szablonu, który jest przechowywany w Cloud Storage. Konstrukcja Flex Templates umożliwia dynamiczne tworzenie diagramów na podstawie danych wprowadzonych przez użytkownika. 

Użytkownik może wprowadzić dane i parametry oraz uruchomić szablon z poziomu wiersza poleceń gcloud, używając API lub interfejsu Dataflow w konsoli Google Cloud, wskazując odpowiedni plik w Cloud Storage.

Więcej informacji o Dataflow Flex Templates znajdziesz w filmie niżej:

Źródło: Google – Turn any Dataflow pipeline into a reusable template

Zobacz też:

  • BigQuery – co to jest i jak zacząć? [Tutorial]
  • Kubernetes – co to jest i jak zacząć? [Tutorial na GCP]
  • Kubernetes vs. Docker Swarm – porównanie platform do orkiestracji

Chcesz sprawdzić, czy Twoja firma jest gotowa na migrację do chmury? Weź udział w naszym badaniu i otrzymaj dedykowany raport, oceniający gotowość na cyfrową transformację: Are You Cloud Ready?

Udostępnianie pipeline’ów Dataflow z klasycznymi szablonami
Dopasowanie pipeline do potrzeb analizy dzięki Dataflow Flex Templates

Interesuje Cię Gmail dla firm?

Zostaw kontakt, a przedstawimy Ci szczegóły.

Ida Ożarowska

Gdy była mała, chciała zostać astronautą. Teraz, jako Content Manager, podróżuje z poziomu Google Docs do galaktyk, w których spotykają się potrzeby biznesowe z możliwościami nowych technologii. Prywatnie amatorka sztuki współczesnej oraz architektury modernistycznej.

Podobne:

Nowości w Google Workspace z września 2021
30 września 2021 Zobacz artykuł
Nowości w Google Workspace z sierpnia 2021
31 sierpnia 2021 Zobacz artykuł
Nowości w Google Workspace z lipca 2021
30 lipca 2021 Zobacz artykuł
fotc
Twój Partner
w podróży
do Google Cloud
Produkty
  • Google Workspace
  • Google Cloud Platform
  • Google Workspace for Education
Branża
  • Administracja publiczna
  • Edukacja
  • Gaming
  • Małe i średnie przedsiębiorstwa
  • Ochrona zdrowia
  • Retail
Wiedza
  • Blog
  • Ebooki
  • Case Studies
  • Wydarzenia
Firma
  • O nas
  • Kariera
  • Kontakt
  • Google Workspace Support
  • Polityka Prywatności
Copyright © 2014 – 2021 FOTC
cookie fotc Kontynuując korzystanie z witryny, zgadzasz się na używanie plików cookie.AkceptujęPolityka prywatności