Команда фонда n-ost вместе с Теплицей социальных технологий, Четвертым сектором и Важными историями приглашает принять участие журналистов и всех интересующихся работой с данными в онлайн-курсе «Веб-скрейпинг для журналистов. С программированием и без». Онлайн-курс пройдет 18-22 января.
О курсе
Практически ни одно расследование не обходится без сбора данных. Не всегда данные представлены в виде готовых таблиц. Иногда они сверстаны в виде HTML-страниц. Собирать такие данные вручную тяжело и долго.
Решить задачу помогает веб-скрейпинг – автоматический сбор данных со страниц сайта. Собирать данные можно с помощью сторонних сервисов или программирования. Об этих способах мы и поговорим на курсе.
Ведущие курса
Кому будет полезно
Онлайн-курс будет полезен всем журналистам и тем, кто занимается расследованиями и исследованиями на основе данных, вне зависимости от уровня навыков в программировании.
Курс разделен на две части: на первом вебинаре эксперты расскажут о веб-скрейпинге и его роли в журналистике, а на втором Андрей Дорожный проведет практическое занятие с инструментами, которые позволят обойтись без программирования, когда появилась необходимость получить данные сайта. Остальные два вебинара будут посвящены программированию.
Как устроен онлайн-курс
Курс будет состоять из четырех вебинаров и начнется 18 января 2021 г. Вебинары будут проходить в 13:00 по московскому времени. Курс завершится 22 января. Для участия необходимо зарегистрироваться. Все зарегистрированные участники получат доступ к записям вебинаров.
Темы и даты вебинаров
Вебинар № 1: Веб-скрейпинг для журналиста
Алеся Мароховская, Андрей Дорожный и Михаил Данилович расскажут о журналистских кейсах, которые получились только благодаря веб-скрейпингу.
Первый вводный вебинар поможет определить, насколько вам необходимо использовать программирование или вы можете обойтись инструментами, о которых будет рассказывать и показывать Андрей Дорожный на втором вебинаре.
Когда: 18 января в 13:00 МСК.
Длительность: 1 час.
Вебинар № 2: Скрейпинг данных без программирования
Андрей Дорожный расскажет о сервисах, которые помогут журналисту собирать данные с сайтов автоматически и без программирования. Для занятия понадобится браузер Google Chrome или Яндекс браузер. Также необходимо скачать расширения для браузера: первое, второе, третье, четвертое.
Когда: 19 января в 13:00 МСК.
Длительность: 2 часа.
Вебинар № 3: Скрейпинг с Python. Часть 1
Алеся Мароховская расскажет, как использовать библиотеки BeautifulSoup и Requests, чтобы скрейпить сайты с помощью Python.
Для участия в вебинарах Алеси нужно иметь хотя бы базовые знания языка программирования Python. Также нужно установить Anaconda, чтобы на занятии вы могли использовать Jupyter Notebook (идет в комплекте Анаконды). Ссылка для скачивания.
Можете использовать и любой другой редактор кода, если вам он кажется более удобным, но на занятии Алеся будет использовать Jupyter Notebook.
Когда: 20 января в 13:00 МСК.
Длительность: 3 часа.
Вебинар № 4: Скрейпинг с Python. Часть 2
Алеся Мароховская расскажет, как использовать библиотеку Selenium для более сложных случаев скрейпинга с помощью Python.
Для участия вам понадобится все тот же Jupyter Notebook (или другой редактор кода). Также вам нужно будет скачать или обновиться до самой последней версии браузера Chrome. И скачать такую же версию Chrome Driver по ссылке. Обязательно убедитесь, что у браузера и Driver одинаковые версии.
Когда: 22 января в 13:00 МСК.
Длительность: 3 часа.
Где учимся
Вебинары пройдут в сервисе Zoom. Ссылку на подключение и подробности курса организаторы вышлют зарегистрированным слушателям. Вопросы по курсу вы можете задать Алисе Цветковой по почте [email protected] или телеграм @itisalise