
Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных, показаны основы обработки данных в PySpark и Python на примере очистки данных, подробно освещается машинное обучение с помощью Spark. Книга поможет читателю понять, как устроен и работает весь конвейер PySpark для комплексной аналитики больших наборов данных: от создания и оценки моделей до очистки, предварительной обработки и исследования данных с особым акцентом на производственные приложения. Отдельные главы посвящены обработке изображений и библиотеке Spark NLP.
Московский дом книги
- Вид товара:Книги
- Рубрика:Теория и технология программирования
- Целевое назначение:Учебники и учеб. пособ.д/ прочих видов обучения
- ISBN:978-5-9775-1770-6
- Серия:Несерийное издание
- Издательство: БХВ-Петербург
- Год издания:2025
- Количество страниц:224
- Тираж:100
- Формат:70х100/16
- Доп. сведения:пер. с англ.
- Переплет:мягкая обложка
- Автор/Редактор/Составитель:А. Тандон, С. Райза, У. Ласерсон и др.
- Вес, г.:295
- Код товара:6653432