Apache Spark — мощный механизм обработки с открытым исходным кодом, основанный на скорости, простоте использования и сложной аналитике. Он был запущен в UC Berkeley в 2009 году и теперь разработан в независимом от поставщиков Apache Software Foundation. С момента своего выпуска Spark быстро встретил предприятия в самых разных отраслях. Интернет-электростанции, такие как Yahoo, eBay и Netflix, развернули Spark в массовом масштабе, обрабатывая несколько петабайт данных на кластерах из более чем 8000 узлов. Apache Spark также стал крупнейшим сообществом с открытым исходным кодом в больших данных, причем более 1000 участников из более чем 250 организаций.

Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: