Онлайн-мітап “Spark ML Pipelines [Under the Hood]” для Data-інженерів

Онлайн-мітап “Spark ML Pipelines [Under the Hood]” для Data-інженерів

Про подію

15 липня Grid Dynamics запрошує Data-інженерів на онлайн-мітап “Spark ML Pipelines [Under the Hood]” у рамках Dynamic Talks.

Спікер — Віталій Монастирьов, Big Data Engineer у Grid Dynamics. Мова доповіді: російська

Коротко про подію:

Сучасні IT-компанії активно розвивають Data Science-напрям у своїх проєктах, щоб прогнозувати прибуток на наступні квартали, налаштовувати таргетовану рекламу, будувати систему рекомендацій тощо.

Дані для побудови ML-моделей зазвичай важать сотні гігабайтів чи більше. Закономірно, що виникає багато запитань:

  • Як працювати з такою кількістю даних?
  • Як генерувати фічі?
  • Як тренувати моделі?
  • Як побудувати взаємодію між Data Engineer та Data Science-командами? 
Кому буде цікаво?

Data-інженерам, які раніше працювали з Apache Spark чи розуміють загальну логіку його роботи. Знання Spark ML не є обов'язковим.

 

Під час мітапу ви дізнаєтеся про

  • Загальні особливості бібліотеки Spark ML
  • Шляхи інтеграції декількох мов програмування у межах єдиного навчального процесу
  • Параметри використання базових класів Spark ML для реалізації модулів обробки даних
  • Опції використання прикладів, доступних після звіту

Реєстрація