Основы Big Data. Погружение в HDFS

Что такое большие данные с точки зрения Computer Science, а не маркетинговых терминов типа 3V?
Чем отличается распределенная файловая система от обычной?
Вы получите ответы на эти и многие другие вопросы в рамках мини-курса по HDFS.

Данный мини-курс не требует навыков программирования.
Оставляйте свой email и мы сообщим, как только курс будет доступен.
О курсе
Курс в первую очередь ориентирован на Data Engineer, но также будет полезен:

  • аналитикам данных (Data Scientist, Data Analyst), поскольку все чаще приходится обрабатывать большие массивы информации, которые не помещаются в память одного (даже мощного) компьютера;
  • системным администраторам и разработчикам, которые хотят переквалифицироваться и перейти в сферу работы с большими данными;
  • всем заинтересованным, кто хочет расширить свой набор навыков на задачи, связанные с Big Data.

      Чему научитесь

      После завершения этого курса вы узнаете и сможете уверенно работать с распределенной файловой системой HDFS, например:
        Создавать, читать, обновлять и удалять файлы в HDFS
        Как балансируется нагрузка на использование различных компонент вычислительного кластера
        Изменять коэффициент репликации данных в HDFS
        Как происходит запись данных в HDFS, какие состояния бывают у блоков на Namenode и реплик на Datanode
        Авторизовывать запрос на изменение данных через WebHDFS
        Почему Secondary Namenode не лучшее название и что означает Checkpoint Namenode
        Преподаватель
        Алексей Драль
        Основатель и ген.директор BigData Team
        • 10-летний опыт работы в ведущих российских и международных компаниях, включая Amazon AWS, Яндекс, Сбербанк, Рамблер
        • Основатель и директор BigData Team. Компания занимается образованием в сфере больших данных и машинного обучения
        • Руководитель международной специализации на Coursera 'Big Data For Data Engineers', более 42 000 слушателей
        • Преподаватель по большим данным, машинному обучению в ведущих университетах (МГУ, НИУ ВШЭ, МФТИ, Harbour.Space University...)
        Алексей Драль
        Основатель и ген.директор BigData Team
        • 10-летний опыт работы в ведущих российских и международных компаниях, включая Amazon AWS, Яндекс, Сбербанк, Рамблер
        • Основатель и директор BigData Team. Компания занимается образованием в сфере больших данных и машинного обучения
        • Руководитель международной специализации на Coursera 'Big Data For Data Engineers', более 42 000 слушателей
        • Преподаватель по большим данным, машинному обучению в ведущих университетах (МГУ, НИУ ВШЭ, МФТИ, Harbour.Space University...)

        FAQ
        Как проходит?
        Курс проходит полностью онлайн. Как только он будет запущен, вы сможете смотреть видеозаписи и решать практические задания
        Сколько стоит?
        Цена курса: 850 рублей
        Какими знаниями необходимо обладать?
        Данный курс не требует навыков программирования.

        Для выполнения практического домашнего задания предполагается опыт работы с командной строкой (Linux / Unix CLI). В этом случае, слушатель не должен бояться следующих команд: ssh, scp, cd, ls, cat, head, tail, find
        Получу ли я сертификат о прохождении?
        Да, вы получите электронный сертификат о прохождении курса
        Задавайте любые вопросы!

        ОБУЧЕНИЕ
        ДОКУМЕНТЫ
        © 2017 - 2022 BigData Team
        ПОДПИСАТЬСЯ
        Icons provided by Tilda publishing
        Illustrations designed by Freepik