Добыча данных с сайтов (web scraping)

Screen/web scraping - это метод извлечения текста с экрана, чтобы его можно было анализировать. Как правило, он используется для извлечения текстов с веб-сайтов.

Данный доклад — это невероятный тур по глубинам интернета в поисках данных. Егор расскажет как о самых простых способах утащить данные с сайта, так и самых сложных и крайне неочевидных на первый взгляд. Доклад будет интересен тем, кто хотел бы сделать полезное приложение, но постоянно откладывал эту задачу на потом. А все потому, что добывать данные из интернета — здорово!

Слайды доклада Добываем данные из интернета


What's difference between web scraping and data mining?

Похожие записи

+function ($) { "use strict"; }(window.jQuery);

  • объявляется IIFE (немедленно выполняемая функция-выражение)
  • в функцию передаётся объект библиотеки jQuery, которая внутри будет доступна через переменную с именем $
  • включается «строгий режим»

AWS шпаргалка

Названия более 50 службами amazon web services на понятном языке