{"id":31936,"date":"2020-06-11T09:24:16","date_gmt":"2020-06-11T07:24:16","guid":{"rendered":"https:\/\/fotc.com\/bigquery-ce-este-tutorial\/"},"modified":"2021-11-03T15:10:03","modified_gmt":"2021-11-03T14:10:03","slug":"bigquery-ce-este-tutorial","status":"publish","type":"post","link":"https:\/\/dev.fotc.com\/ro\/blog\/bigquery-ce-este-tutorial\/","title":{"rendered":"BigQuery \u2013 ce este \u0219i cum s\u0103 \u00eencepe\u021bi? [Tutorial]"},"content":{"rendered":"\n

Datele reprezint\u0103 noul aur – companiile \u0219i organiza\u021biile orientate spre dezvoltare sunt con\u0219tiente de acest lucru. Companiile con\u0219tiente analizeaz\u0103 procesele existente, fac modific\u0103ri \u0219i \u00eembun\u0103t\u0103\u021biri pe baza cifrelor. Unii merg mai departe – cu tool-uri precum BigQuery de la Google \u2013 profit\u00e2nd de oportunit\u0103\u021bile oferite de tehnologie, anticipeaz\u0103 tendin\u021bele, posibilele schimb\u0103ri de pe pia\u021b\u0103, efectele deciziilor de afaceri care \u00eenc\u0103 nu au fost luate.<\/span>
\n<\/p>\n\n\n\n\n\n\n\n

Pe m\u0103sur\u0103 ce afacerea cre\u0219te, seturile de date se extind \u2013 gigaocte\u021bii se transform\u0103 \u00een teraocte\u021bi sau petaocte\u021bi.  Pentru a men\u021bine un nivel adecvat al costurilor de \u00eentre\u021binere a instrumentului de analiz\u0103 \u0219i un timp relativ scurt de generare a rapoartelor, trebuie s\u0103 face\u021bi alegerea corect\u0103 \u00een ceea ce prive\u0219te tehnologia. \u00cen ajutor v\u0103 vine BigQuery \u2013 un serviciu dedicat efectu\u0103rii de analize BigData. Acesta angreneaz\u0103 mai multe instrumente de analiz\u0103, printre altele, popularul Google Analytics<\/strong>.<\/span><\/p>\n\n\n\n

Ce este BigQuery<\/span> de la Google?<\/span><\/h2>\n\n\n\n

Acesta este un depozit de date scalabil \u00een cloud (cloud data warehouse).  El permite deservirea a milioane de interog\u0103ri (query) \u0219i efectuarea de analize avansate de petabytes de date \u00een limbajul SQL<\/strong>, f\u0103r\u0103 a fi nevoie s\u0103 v\u0103 face\u021bi griji cu privire la \u00eentre\u021binerea costisitoare a unei infrastructurii avansate.<\/span><\/p>\n\n\n\n

BigQuery este unul dintre serviciile disponibile \u00een <\/span>Google Cloud Platform (GCP)<\/span><\/a>.<\/span> Stocarea \u0219i procesarea seturilor de date se desf\u0103\u0219oar\u0103 \u00een cloud, pe o infrastructur\u0103 GCP stabil\u0103, sigur\u0103 \u0219i scalabil\u0103<\/strong> (aici ve\u021bi afla mai multe despre <\/span>ce este Google Cloud Platform \u0219i cum sus\u021bine afacerile<\/span><\/a>).<\/span><\/p>\n\n\n\n

Cu ajutorul serviciului, pute\u021bi crea propriul instrument de analiz\u0103 pentru a urm\u0103ri dezvoltarea, procesele sau modific\u0103rile \u00een curs \u2013 de exemplu, \u00een interiorul sau \u00een jurul companiei. \u00cen combina\u021bie cu \u00eenv\u0103\u021barea automatizat\u0103 (ML \u2013 machine learning), permite construirea unui sistem care, de exemplu, va anticipa apari\u021bia diver\u0219ilor factori \u0219i va lua \u00een considerare efectele lor poten\u021biale. BigQuery v\u0103 poate ajuta, de asemenea, s\u0103 optimiza\u021bi performan\u021ba \u0219i costurile de \u00eentre\u021binere ale unui sistem de analiz\u0103 BigData existent.<\/span><\/p>\n\n\n\n

Tehnologie f\u0103r\u0103 servere<\/span><\/h3>\n\n\n\n

BigQuery este un depozit de date \u00een cloud. Utiliz\u00e2nd serviciile Google Cloud Platform, v\u0103 pute\u021bi concentra pe scalarea afacerii \u0219i pe extragerea din analiz\u0103 a ceea ce este mai bun. Nu trebuie s\u0103 petrece\u021bi timp suplimentar \u0219i buget pentru men\u021binerea infrastructurii<\/strong>, efectuarea actualiz\u0103rilor sau asigurarea unui nivel adecvat de securitate a serverelor.<\/span><\/p>\n\n\n\n

Analiz\u0103 instantanee<\/span><\/h3>\n\n\n\n

Pentru prelucrarea a terabytes de date BigQuery are nevoie de c\u00e2teva secunde, iar pentru un petabyte \u2013 de aprox. 3 minute. Depozitele (warehouses) proceseaz\u0103 seturi mari de date de c\u00e2teva zeci de ori mai rapid dec\u00e2t sistemele de baze de date. Acest lucru v\u0103 permite s\u0103 efectua\u021bi analize chiar \u0219i \u00een timp real \u0219i s\u0103 observa\u021bi modific\u0103rile \u00een timp real.<\/strong><\/span><\/p>\n\n\n\n

Costuri flexibile<\/span><\/h3>\n\n\n\n

Costul serviciului BigQuery se ajusteaz\u0103 la cerin\u021bele curente ale afacerii dvs. Ca \u0219i \u00een cazul GCP, se pl\u0103te\u0219te \u00een func\u021bie de consum<\/strong>. Costul de stocare a datelor (data storage) este de 20 USD\/TB. Dac\u0103 datele nu sunt prelucrate timp de 90 de zile sau mai mult, pachetul se modific\u0103 \u00een stocare pe termen lung, iar pre\u021bul serviciului scade cu 50%. Prelucrarea datelor cost\u0103 5 USD\/TB, iar primul terabyte \u00een fiecare lun\u0103 este gratuit.<\/span><\/p>\n\n\n\n

Aceast\u0103 metod\u0103 de tarifare se traduce \u00eentr-un TCO (total cost of ownership) mai mic \u00een medie cu 30% pe parcursul a trei ani<\/strong> dec\u00e2t \u00een cazul altor solu\u021bii de analiz\u0103 BigData.  <\/span><\/p>\n\n\n\n

F\u0103r\u0103 interferen\u021be \u00een codul surs\u0103<\/span><\/h3>\n\n\n\n

Pentru a utiliza BigQuery, nu este nevoie s\u0103 efectua\u021bi modific\u0103ri majore sau s\u0103 rescrie\u021bi codul surs\u0103.<\/strong> Asta pentru c\u0103 BigQuery accept\u0103 ANSI SQL:2011 \u0219i ofer\u0103 interfe\u021be software gratuite ODBC \u0219i JDBC.<\/span><\/p>\n\n\n\n

Copie de rezerv\u0103 automat\u0103<\/span><\/h3>\n\n\n\n

Instrumentul efectueaz\u0103 un backup automat \u0219i stocheaz\u0103 istoricul modific\u0103rilor timp de 7 zile. Acest lucru faciliteaz\u0103 compararea rezultatelor cu perioada anterioar\u0103 sau restabilirea datelor.<\/span><\/p>\n\n\n\n

Analiza datelor din diferite surse<\/span><\/h3>\n\n\n\n

Cu BigQuery<\/strong>, pute\u021bi analiza date provenite dintr-o varietate de surse \u2013 din Google Marketing Platform, Google Analytics, YouTube \u0219i sute de aplica\u021bii externe SaaS. De asemenea, pute\u021bi muta datele \u00een BigQuery din alte solu\u021bii de infrastructur\u0103 dec\u00e2t GCP.<\/span><\/p>\n\n\n\n

Suport pentru machine learning (ML)<\/span><\/h3>\n\n\n\n

Una dintre func\u021biile disponibile este BigQuery ML, dedicat\u0103 pentru crearea \u0219i dezvoltarea capacit\u0103\u021bii de \u00eenv\u0103\u021bare automatizat\u0103 folosind interog\u0103ri SQL standard. BigQuery ML \u00eembun\u0103t\u0103\u021be\u0219te viteza de dezvoltare a produselor care accept\u0103 \u00eenv\u0103\u021barea automatizat\u0103, reduc\u00e2nd \u00een acela\u0219i timp cerin\u021bele pentru scrierea codului surs\u0103 \u0219i mutarea datelor.<\/span><\/p>\n\n\n\n

Analize de afaceri (BI)<\/span><\/h3>\n\n\n\n

BigQuery este un instrument excelent pentru efectuarea de analize de afaceri (BI \u2013 business intelligence).  Serviciul permite analizarea unor seturi uria\u0219e de date \u0219i crearea de rapoarte extinse \u00een c\u00e2teva secunde<\/strong>. \u00cen acela\u0219i mod, sprijin\u0103 crearea de rapoarte “ad hoc” \u2013 adic\u0103 rapoarte care includ un set definit de date \u0219i nu necesit\u0103 implicarea departamentului de analize sau IT pentru a preg\u0103ti un sumar.<\/span><\/p>\n\n\n\n

\u00cen ambele cazuri, rapoartele pot fi prezentate utiliz\u00e2nd instrumente de vizualizare a datelor, cum ar fi Google Data Studio, Looker \u0219i Tableau.<\/span><\/p>\n\n\n\n

Exemple de utilizare BigQuery<\/span><\/h2>\n\n\n\n

Iat\u0103 c\u00e2teva exemple de utilizare a capacit\u0103\u021bilor BigQuery de c\u0103tre companii bine-cunoscute:<\/span><\/p>\n\n\n\n