ПІ
Пащенко А. Б. Розробка та дослідження методів роботи сервісів з великими обсягами даних у хмарі : магістерська атестаційна робота, пояснювальна записка / А. Б. Пащенко ; кер. роботи проф. Руткас А.Г. ; ХНУРЕ, Кафедра Програмної інженерії. – Харків, 2016. – 68 с. : CD
Пащенко А. Б. Розробка та дослідження методів роботи сервісів з великими обсягами даних у хмарі : магістерська атестаційна робота, пояснювальна записка / А. Б. Пащенко ; кер. роботи проф. Руткас А.Г. ; ХНУРЕ, Кафедра Програмної інженерії. – Харків, 2016. – 68 с. : CD
Анотація:
Об'єктом дослідження є інструменти обробки великих обсягів даних.
Предметом дослідження є підвищення ефективності системи Apache Hadoop з використанням додатку розподілених обчислень Apache Spark.
Мета дослідження - розробка та дослідження методів роботи з великими обсягами даних в хмарі.
Шляхи досягнення мети - моделювання роботи системи розподіленої обробки даних та методів їх покращення.
Наукове та практичне значення полягає у розгляді та аналізі існуючих методів обробки великих обсягів даних та у розробці покращеного методу.
Галузь застосування - системи розподілених обчислень.
ХМАРНІ ОБЧИСЛЕННЯ, BIG DATA, APACHE HADOOP, MAPREDUCE, APACHE SPARK, SCALA
ABSTRACT
The object of study is a tool for processing large amounts of data.
The subject of the study is improving the effectiveness of Apache Hadoop with Apache Spark.
The aim - to search existing tools for working with large volumes of data and research methods of optimizing data when working with them.
Ways to achieve goal - simulation of distributed data processing system, identify important parameters and methods of improvement.
The scientific and practical importance are based on the review and the analysis of existing tools for handling large amounts of data and the methods of optimizing their performance
Areas of application - distributed computing systems.
CLOUD COMPUTING, BIG DATA, APACHE HADOOP, MAPREDUCE, APACHE SPARK, SCALA
Предметом дослідження є підвищення ефективності системи Apache Hadoop з використанням додатку розподілених обчислень Apache Spark.
Мета дослідження - розробка та дослідження методів роботи з великими обсягами даних в хмарі.
Шляхи досягнення мети - моделювання роботи системи розподіленої обробки даних та методів їх покращення.
Наукове та практичне значення полягає у розгляді та аналізі існуючих методів обробки великих обсягів даних та у розробці покращеного методу.
Галузь застосування - системи розподілених обчислень.
ХМАРНІ ОБЧИСЛЕННЯ, BIG DATA, APACHE HADOOP, MAPREDUCE, APACHE SPARK, SCALA
ABSTRACT
The object of study is a tool for processing large amounts of data.
The subject of the study is improving the effectiveness of Apache Hadoop with Apache Spark.
The aim - to search existing tools for working with large volumes of data and research methods of optimizing data when working with them.
Ways to achieve goal - simulation of distributed data processing system, identify important parameters and methods of improvement.
The scientific and practical importance are based on the review and the analysis of existing tools for handling large amounts of data and the methods of optimizing their performance
Areas of application - distributed computing systems.
CLOUD COMPUTING, BIG DATA, APACHE HADOOP, MAPREDUCE, APACHE SPARK, SCALA