Meetup №8 (офлайн + онлайн): Автофейловер и данные в двух датацентрах и Алгоритмы для непрерывной обработки запросов

Восьмой митап российского сообщества разработчиков СУБД и распределенных систем. Обсудим вариант реализации автофейловера между ДЦ и фундаментальные проблемы современных систем анализа потоковых данных, таких как Apache Flink.

Приглашаем вас на восьмой митап сообщества Database Internals. В программе два доклада от разработчиков из компании VK Tech и руководителя направления больших данных Исследовательского института Ломоносова.

Мероприятие пройдет офлайн в офисе VK Tech по адресу г. Москва, Ленинградский пр-т, д. 70, БЦ “Алкон”, вход “Север”, этаж 3, конференц-зал.

Участвующим онлайн будет доступна трансляция на VK Video, YouTube и чат.

Мероприятие бесплатное. Регистрация обязательна. При очном участии обязательно наличие паспорта. Количество мест ограничено.

Трансляция мероприятия организована нашими друзьями из компании VK Tech.

Программа

  • 18:00 – 19:00 Автофейловер и данные в двух датацентрах. Александр Туренко и Георгий Белянин, разработчики VK Tech
  • 19:00 – 19:10 Перерыв
  • 19:10 – 20:10 Алгоритмы для непрерывной обработки запросов. Рене ван Беверн, руководитель направления больших данных, Исследовательский институт Ломоносова

Доклады

Автофейловер и данные в двух датацентрах

Александр Туренко и Георгий Белянин, разработчики VK Tech

Широко известен алгоритм RAFT, в котором главный узел выбирается голосованием внутри кластера. Для RAFT’а надо минимум три ЦОДа, это довольно затратно. В докладе рассматривается подход с внешним арбитром и СУБД в двух ЦОДах. Расскажем про разные аварии, нюансы распределенных блокировок а-ля redlock, про fencing tokens, двухфазные вызовы, плюсы и минусы внешнего состояния, особенности разбора проблем и подходы к усилению мощности тестирования.

Алгоритмы для непрерывной обработки запросов

Рене ван Беверн, руководитель направления больших данных, эксперт по обработке больших данных в реальном времени, Исследовательский институт Ломоносова

Непрерывная обработка запросов позволяет проводить анализ потоков данных в реальном времени, но создает алгоритмические проблемы из-за неограниченного объема данных, строгих ограничений по задержке и непредсказуемой динамики потоков. В этом докладе рассматриваются основные алгоритмические методы, лежащие в основе современных систем анализа потоковых данных, таких как Apache Flink, включая эффективные агрегации над окнами, инкрементальные вычисления, управление состоянием, отказоустойчивость, приближённую и адаптивную обработку запросов.

Регистрация

Back to Home