
Trinity
Администратор
- Регистрация
- 10.07.21
- Сообщения
- 41.318
- Реакции
- 662.982
Последние темы автора:
[Анастасия Белолипецкая] Как вырастить здоровую эмаль ребенку? Фторид и...
[Современное образование] Русский язык. Орфография. 1 - 11 класс (2025)
[Nikolietta calligraphy] Классическая каллиграфия в стиле Copperplate (2024)
[Ирина Довгалева] [DIVA] Практикум «Плоский живот» (2024)
[Светлана Орлова, Аида Манукова] [Англомастер] Лексика для ОГЭ...
[Современное образование] Русский язык. Орфография. 1 - 11 класс (2025)
[Nikolietta calligraphy] Классическая каллиграфия в стиле Copperplate (2024)
[Ирина Довгалева] [DIVA] Практикум «Плоский живот» (2024)
[Светлана Орлова, Аида Манукова] [Англомастер] Лексика для ОГЭ...
[Udemy] Практическое руководство по настройке кластера Hadoop и Spark с использованием CDH (2019)
Cloudera — один из ведущих поставщиков дистрибутивов, связанных с Hadoop и Spark. В рамках этого Практического руководства вы пошагово изучите процесс настройки Hadoop и Spark Cluster с помощью CDH.
Установка. Продемонстрируйте понимание процесса установки Cloudera Manager, CDH и проектов экосистемы.
Подробнее:
Cloudera — один из ведущих поставщиков дистрибутивов, связанных с Hadoop и Spark. В рамках этого Практического руководства вы пошагово изучите процесс настройки Hadoop и Spark Cluster с помощью CDH.
Установка. Продемонстрируйте понимание процесса установки Cloudera Manager, CDH и проектов экосистемы.
- Настройте локальный репозиторий CDH
- Выполнение настройки на уровне ОС для установки Hadoop
- Установите сервер Cloudera Manager и агенты
- Установите CDH с помощью Cloudera Manager
- Добавить новый узел в существующий кластер
- Добавить сервис с помощью Cloudera Manager
- Настройка сервиса с помощью Cloudera Manager
- Создайте домашний каталог пользователя HDFS
- Настройка высокой доступности NameNode
- Настройка высокой доступности ResourceManager
- Настроить прокси для Hiveserver2/Impala
- Перебалансировать кластер
- Настройте оповещение о чрезмерном заполнении диска
- Определение и установка сценария топологии стойки
- Установите новый тип библиотеки сжатия ввода-вывода в кластере
- Пересмотрите назначение ресурсов YARN на основе отзывов пользователей.
- Ввод/вывод узла
- Настройка списков ACL HDFS
- Установите и настройте Сентри
- Настройте авторизацию и аутентификацию пользователей Hue
- Включить/настроить журнал и редактирование запросов
- Создание зашифрованных зон в HDFS
- Выполнение команд файловой системы через HTTPFS
- Эффективно копировать данные внутри кластера/между кластерами
- Создание/восстановление моментального снимка каталога HDFS
- Получить/установить ACL для файла или структуры каталогов
- Сравните кластер (ввод-вывод, ЦП, сеть)
- Устранение ошибок/предупреждений в Cloudera Manager
- Устранение проблем с производительностью/ошибок в работе кластера
- Определить причину сбоя приложения
- Настройте Fair Scheduler для устранения задержек приложений
- Вы начнете с создания виртуальной машины Cloudera QuickStart (если у вас есть ноутбук с 16 ГБ ОЗУ и четырехъядерным процессором). Это поможет вам освоиться с Cloudera Manager.
- Вы сможете зарегистрироваться в GCP и воспользоваться кредитом до 300 долларов США, пока действует предложение. Кредиты действительны до года.
- Затем вы поймете краткий обзор GCP и предоставления от 7 до 8 виртуальных машин с использованием шаблонов. Вы также подключите внешний жесткий диск для настройки HDFS позже.
- Как только серверы будут подготовлены, вы приступите к настройке Ansible для автоматизации серверов.
- Вы позаботитесь о локальном репозитории для Cloudera Manager и Cloudera Distribution of Hadoop с помощью пакетов.
- Затем вы настроите Cloudera Manager с пользовательской базой данных, а затем Cloudera Distribution of Hadoop с помощью мастера, который входит в состав Cloudera Manager.
- В рамках настройки Cloudera Distribution of Hadoop вы настроите HDFS, изучите команды HDFS, настроите YARN, настроите HDFS и высокую доступность YARN, узнаете о планировщиках, настроите Spark, перейдете к участкам, настроите Hive и Impala, настроите HBase и Kafka и т. д. .
- Системные администраторы, которые хотят понять экосистему больших данных и настроить кластеры
- Опытные администраторы больших данных, которые хотят научиться управлять настройкой кластеров Hadoop и Spark с помощью CDH.
- Профессионалы начального уровня, которые хотят изучить основы и настроить кластеры больших данных
- Базовые навыки работы с Linux
- 64-битный компьютер с оперативной памятью не менее 4 ГБ.
- Операционная система — Windows 10 или Mac или Linux Flavor
Подробнее:
Скачать:![]()
Practical Guide to setup Hadoop and Spark Cluster using CDH
Step by step instructions to setup Hadoop and Spark Cluster using Cloudera Distribution of Hadoop (Formerly CCA 131)www.udemy.com
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.