问题 |
答案 |
Big data to duże dane do analizowania, których liczbę należy maksymalizować w celu wydobycia określonych wartości informacyjnych. 开始学习
|
|
|
|
|
Big data to duże dane do analizowania, których liczbę należy minimalizować w celu wydobycia określonych wartości informacyjnych. 开始学习
|
|
|
|
|
Big data bazuje na koncepcji 3 atrybutów (3V) 开始学习
|
|
|
|
|
Big data bazuje na koncepcji 4 atrybutów 开始学习
|
|
|
|
|
开始学习
|
|
objętość (volume), różnorodność (variety) oraz szybkość przetwarzania (vielocity)
|
|
|
开始学习
|
|
objętość (volume), różnorodność (variety) oraz szybkość przetwarzania (vielocity), wiarygodność(veracity)
|
|
|
Dane w big data są różnorodne 开始学习
|
|
|
|
|
Dane w big data są z różnych źródeł z dużą prędkością? 开始学习
|
|
|
|
|
Dane w big data są generowane z jednego źródła? 开始学习
|
|
|
|
|
Dane w big data są z różnych źródeł z małą prędkością? 开始学习
|
|
|
|
|
Wymień 6 atrybutów big data 开始学习
|
|
objętość, złożoność, szybkość, wartość, różnorodność, zmienność
|
|
|
W big data dane traktowane są jako strumienie a nie zbiory 开始学习
|
|
|
|
|
W big data dane traktowane są jako zbiory a nie strumienie 开始学习
|
|
|
|
|
Data scientist musi posiadać wiedzę zarówno z zakresu analiz danych jak również z zakresu technologii informatycznych 开始学习
|
|
|
|
|
Data scientist musi posiadać wiedzę dotyczącą technologii informatycznych 开始学习
|
|
|
|
|
Objętość danych to ich pojemność, słuzy do wprowadzania nowych idei i pomysłów, wymaga odpowiedniej infrastruktury programistycznej 开始学习
|
|
|
|
|
Objętość danych to ich pojemność, słuzy do wprowadzania nowych idei i pomysłów, nie posiada dużych wymagań 开始学习
|
|
|
|
|
Różnorodność danych mówi że dane pochodzą z różnorodnych źródeł, często w różnych formatach oraz w różnej formie 开始学习
|
|
|
|
|
Zmienność mówi że dane pochodzą z różnorodnych źródeł, często w różnych formatach oraz w różnej formie 开始学习
|
|
|
|
|
Różnorodność danych to inaczej heterogeniczność 开始学习
|
|
|
|
|
Złożoność danych to inaczej heterogeniczność 开始学习
|
|
|
|
|
Złożoność danych powiązana z hetefogenicznością danych, różnym źródłem ich pochodzenia, różnym sposobem uporządkowania danych 开始学习
|
|
|
|
|
Zmienność danych powiązana z hetefogenicznością danych, różnym źródłem ich pochodzenia, różnym sposobem uporządkowania danych 开始学习
|
|
|
|
|
Szybkość napływu danych posiada strumieniowy charakter. Dane przesyłane są z ogromną prędkością, wymagające często analizy w czasie rzeczywistym 开始学习
|
|
|
|
|
Szybkość napływu danych posiada strumieniowy charakter. Dane przesyłane są z niską prędkością, wymagające często analizy w czasie rzeczywistym 开始学习
|
|
|
|
|
Wartość danych Szybkość napływu danych posiada strumieniowy charakter. Dane przesyłane są z ogromną prędkością, wymagające często analizy w czasie rzeczywistym 开始学习
|
|
|
|
|
Wysoki poziom zmienności danych związana jest z prędkością przepływu danych oraz ich różnorodnym charakterem 开始学习
|
|
|
|
|
Wartość danych jest to cecha wynikająca z pozostałych atrybutów. 开始学习
|
|
|
|
|
Szybkość napływu jest to cecha wynikająca z pozostałych atrybutów. 开始学习
|
|
|
|
|
Wartość danych jest zwiazana bezpośrednio z wartością dodaną, jaką można wygenerować na podstawie danych 开始学习
|
|
|
|
|
Wartość danych jest zwiazana pośrednio z wartością dodaną, jaką można wygenerować na podstawie danych 开始学习
|
|
|
|
|
Big data - uporządkowanie danych możemy podzielić na: dane o określonej strukturze, o mieszanej strukturze oraz o określonej strukturze 开始学习
|
|
|
|
|
Big data - uporządkowanie danych możemy podzielić na: dane o określonej strukturze, o mieszanej strukturze oraz o zgodnej strukturze 开始学习
|
|
|
|
|
Big data - uporządkowanie danych możemy podzielić na: dane o zmiennej strukturze, o mieszanej strukturze oraz o określonej strukturze 开始学习
|
|
|
|
|
Wyzwania badawcze Big Data związane są bezpośrednio z atrybutami big data 开始学习
|
|
|
|
|
Wyzwania badawcze Big Data związane są bezpośrednio z metodami big data 开始学习
|
|
|
|
|
Wyzwania badawcze Big Data można podzielić na dotyczące technologii oraz dotyczące danych. 开始学习
|
|
|
|
|
Wyzwania badawcze Big Data można podzielić na dotyczące technologii oraz dotyczące problemów 开始学习
|
|
|
|
|
Wyzwania technologiczne związane są z opracowanie odpowiedniej architektury informatycznej 开始学习
|
|
|
|
|
Wyzwania technologiczne związane są z ich charakterem i różnorodnością 开始学习
|
|
|
|
|
Wyzwania badawcze Big Data związane są z opracowanie odpowiedniej architektury informatycznej 开始学习
|
|
|
|
|
Wyzwania dotyczące danych Big Data związane są z opracowanie odpowiedniej architektury informatycznej 开始学习
|
|
|
|
|
Wyzwania dotyczące danych Big Data związane sa z ich charakterem i różnorodnością 开始学习
|
|
|
|
|
Wyzwania technologiczne- architektura informatyczna: źródła danych -> pobór danych -> gromadzenie danych -> wstępne przetwarzanie danych -> rozdzielanie danych -> Analiza danych -> modelowanie danych -> wnioskowanie na podstawie wyników analiz 开始学习
|
|
|
|
|
Wyzwania technologiczne- architektura informatyczna: 开始学习
|
|
źródła danych -> pobór danych -> gromadzenie danych -> wstępne przetwarzanie danych -> rozdzielanie danych -> Analiza danych -> modelowanie danych -> wnioskowanie na podstawie wyników analiz
|
|
|
Charakter danych możemy podzielić na: różnorodnosć źródeł, różnorodność formatów, jakość, wielowymiarowość, pojemność informacyjna, wartość biznesowa 开始学习
|
|
|
|
|
Charakter danych możemy podzielić na: jakość źródeł, różnorodność formatów, wartość, wielowymiarowość, pojemność informacyjna, wartość biznesowa 开始学习
|
|
|
|
|
Charakter danych możemy podzielić na: różnorodnosć źródeł, różnorodność formatów, jakość, wielowymiarowość, pojemność informacyjna, wartość wynikowa 开始学习
|
|
|
|
|
Cloud computing to tzw przetwarzanie w chmurze 开始学习
|
|
|
|
|
Cloud computing to tzw przetwarzanie na serwerze 开始学习
|
|
|
|
|
Cloud computing możemy podzielić na Private Cloud, Hybrid Cloud oraz Public Cloud 开始学习
|
|
|
|
|
Cloud computing możemy podzielić na Private Cloud, Hybrid Cloud oraz Protected Cloud 开始学习
|
|
|
|
|
Architektura informatyczna to połaczenie sprzetu i odpowiedniego oprogramowania wspierającego proces przetwarzania danych Big Data 开始学习
|
|
|
|
|
Apache Hadoop jest to projekt którego celem jest rozwój oprogramowania typu "open-source" do przetwarzania rozproszonych dużych zasobów danych w klastrach serwerów przy uzyciu prostych metod programistycznych 开始学习
|
|
|
|
|
Zalety Hadoop: Skalowalność, elastyczność, opłacalność, bezawaryjność 开始学习
|
|
|
|
|
Zalety Hadoop w opszarze Big Data: Skalowalność, elastyczność, niska cena, bezawaryjność 开始学习
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy umożliwirnir dodania nowych węzłów bez konieczności zmiany formatów danych, jakie są ładowane (skalowalność) 开始学习
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy umożliwirnir dodania nowych węzłów z koniecznością zmiany formatów danych, jakie są ładowane (skalowalność) 开始学习
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy dodanie możliwości poboru wszelkich rodzajów danych, o dowolnych formatach, z różnych źródeł (elastyczność) 开始学习
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy dodanie możliwości poboru wszelkich rodzajów danych, o określonych formatach, z różnych źródeł (elastyczność) 开始学习
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy umożliwienie prowadzenie równolegle obliczeń na wielu serwerach (cost-reduced) (opłacalność) 开始学习
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy umożliwienie prowadzenie równolegle obliczeń na dwóch serwerach (cost-reduced) (opłacalność) 开始学习
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy w razie problemów z jednym węzłem jego zadania zostają przekierowane do innych jednostek (bezawaryjność) 开始学习
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy w razie problemów z jednym węzłem jego zadania zostają przekierowane do innych danych (bezawaryjność) 开始学习
|
|
|
|
|
Cecha NoSQL: jest to system nie posiadajacy relacji oraz zdefiniowanego jezyka 开始学习
|
|
|
|
|
Cecha NoSQL jest to system posiadajacy relacje oraz zdefiniowany język 开始学习
|
|
|
|
|
Cecha NoSQL wykorzystywany dla danych nie posiadających określonej struktury lub semi-strukturalnych 开始学习
|
|
|
|
|
Cecha NoSQL wykorzystywany dla danych posiadających określoną struktury lub semi-strukturalnych 开始学习
|
|
|
|
|
Cecha NoSQL Skalowalność i elastyczność bazy – możliwość zwiększania wydajności systemu wraz z rosnącym zapotrzebowaniem 开始学习
|
|
|
|
|
Cecha NoSQL Skalowalność i elastyczność bazy – możliwość zwiększania wydajności systemu wraz z malejącym zapotrzebowaniem 开始学习
|
|
|
|
|
NoSQL może być stosowany ze zwykłym SQLem 开始学习
|
|
|
|
|
NoSQL nie może być stosowany ze zwykłym SQLem 开始学习
|
|
|
|
|
Klasyczne narzędzia analizy danych Big Data: 开始学习
|
|
Przetwarzanie sieciowe (Grid-computing), przetwarzanie w bazie danych (in-database-processing), analityka w pamięci (in-memory analytics)
|
|
|
Klasyczne narzędzia analizy danych Big Data: Przetwarzanie sieciowe (Grid-computing), przetwarzanie w bazie danych (in-database-processing), analityka w pamięci (in-memory analytics) 开始学习
|
|
|
|
|
NoSQL – (non SQL) nierelacyjna baza danych, umożliwiająca przechowywanie i pobieranie danych w różnych formatach w nieograniczony sposób 开始学习
|
|
|
|
|
Cykl analizy Big Data: użytkownik biznesowy -> Administrator hurtowni danych ->Data scientist->Analityk Business Intelligence->Końcowy uzytkownik biznesowy 开始学习
|
|
|
|
|
Cykl analizy Big Data - użytkownik biznesowy jest odpowiedzialny za określenie i analizę wskaźników wydajności KPI oraz za formuowanie wymagań analitycznych odnośnie danych 开始学习
|
|
|
|
|
Cykl analizy Big Data - Uzytkownik biznesowy jest to osoba odpowiedzialna za zidentyfikowanie podstawowych procesów biznesowych 开始学习
|
|
|
|
|
Cykl analizy Big Data - Administrator hurtowni Danych odpowiedzialny za definiowanie, rozwój oraz obsługę hurtowni danych oraz zarządzanie narzędziami wspomagającymi Big Data 开始学习
|
|
|
|
|
Cykl analizy Big Data - Uzytkownik biznesowy odpowiedzialny za definiowanie, rozwój oraz obsługę hurtowni danych oraz zarządzanie narzędziami wspomagającymi Big Data 开始学习
|
|
|
|
|
Cykl analizy Big Data - Data Scientist - osoba odpowiedzialna za budowę modeli analitycznych oraz ich implementację w środowisko informatyczne wspomagające Big Data 开始学习
|
|
|
|
|
Cykl analizy Big Data - Końcowy użytkownik biznesowy – (final business user, end-user) osoba wykorzystująca w swojej pracy wszelkie informacje wygenerowane przez pozostałych uczestników cyklu analizy Big Data 开始学习
|
|
|
|
|
Cykl analizy Big Data - analityk BI - Końcowy użytkownik biznesowy – (final business user, end-user) osoba wykorzystująca w swojej pracy wszelkie informacje wygenerowane przez pozostałych uczestników cyklu analizy Big Data 开始学习
|
|
F (końcowy użytkownik biznesowy)
|
|
|
Cykl analizy Big Data - analityk BI - osoba odpowiedzialna za identyfikację, zarządzanie i publikowanie kluczowych wskaźników wydajności oraz raportów, zazwyczaj w czasie zbliżonym do rzeczywistego 开始学习
|
|
|
|
|
Cykl analizy Big Data - Końcowy użytkownik biznesowy – osoba odpowiedzialna za identyfikację, zarządzanie i publikowanie kluczowych wskaźników wydajności oraz raportów, zazwyczaj w czasie zbliżonym do rzeczywistego 开始学习
|
|
|
|
|
Zarządzanie bazą danych – wszelkie działania mające na celu usprawnienie procesu pracy z danymi, przyczyniające się do obniżenia kosztów obsługi danych, przechowywania danych, administrowania oraz eksploracji 开始学习
|
|
|
|
|
Zarządzanie bazą danych typu Big Data Działania na danych możemy podzielić na: 开始学习
|
|
Gromadzenie danych, próbkowanie, wstępne przetwarzanie
|
|
|