Добыча данных с сайтов (web scraping)

Screen/web scraping - это метод извлечения текста с экрана, чтобы его можно было анализировать. Как правило, он используется для извлечения текстов с веб-сайтов.

Данный доклад — это невероятный тур по глубинам интернета в поисках данных. Егор расскажет как о самых простых способах утащить данные с сайта, так и самых сложных и крайне неочевидных на первый взгляд. Доклад будет интересен тем, кто хотел бы сделать полезное приложение, но постоянно откладывал эту задачу на потом. А все потому, что добывать данные из интернета — здорово!

Слайды доклада Добываем данные из интернета


What's difference between web scraping and data mining?

Похожие записи

NPM. Разница между тильдой(~) и крышкой(^) в package.json

Тильда(~) подбирает последнюю минорную версию пакета (последнюю цифру), например ~7.3.3 найдет последнюю 7.3.x, допустим 7.3.12 но не 7.4.0.

Крышка(^) подбирает последнюю мажорную версию пакета (среднюю цифру), например ^7.3.3 найдет последнюю 7.x.x, допустим 7.4.0 но не 8.0.0.

npm semver calculator

Semver check

19 октября 2017 г. в NodeJS

AWS шпаргалка

Названия более 50 службами amazon web services на понятном языке

О шрифтах

Ссылки на 2 хорошо структурированных материала про шрифты.

  • Статья для тех, кто ничего не понимает в шрифтах.
  • Видео для тех, кто хочет заразиться страстью к шрифтам и типографике