Как в Python извлечь все ссылки на веб‑странице

Получение всех ссылок на веб-странице — обычная задача для веб-парсеров, полезно создавать продвинутые парсеры, которые сканируют каждую страницу определенного веб-сайта для извлечения данных, его также можно использовать для процесса диагностики SEO или даже на этапе сбора информации для проникновения. тестеры. Здесь узнаете, как создать инструмент для извлечения ссылок на Python с нуля, используя только библиотеки requests и BeautifulSoup.
Читать далее «Как в Python извлечь все ссылки на веб‑странице»

Как, используя Python, загрузить все изображения с веб-страницы

Наверняка, хоть раз в жизни вам хотелось загрузить все изображения с понравившейся веб‑страницы? Сейчас вы узнаете, как создать парсер Python, который извлекает все изображения с веб‑страницы по ее URL‑адресу и загружает их с помощью библиотек requests и BeautifulSoup.
Читать далее «Как, используя Python, загрузить все изображения с веб-страницы»

Как с помощью Python извлечь метаданные изображения

Узнайте, как можно извлекать метаданные изображения, такие как информация GPS, марка камеры, модель и многое другое, с помощью Exchangeable Image File Format (EXIF) в Python с библиотекой Pillow.

Читать далее «Как с помощью Python извлечь метаданные изображения»

Как с помощью Python извлечь метаданные PDF

Метаданные PDF‑файлов содержат полезную информацию о PDF‑документе. Они включают заголовок документа, автора, дату последнего изменения, дату создания, тему и многое другое. Некоторые файлы PDF содержат больше мета‑информации, некоторые меньше и в этом наставлении вы узнаете, как извлечь метаданные PDF с помощью Python.
Читать далее «Как с помощью Python извлечь метаданные PDF»

Что такое нейронные сети прямого распространения

В этой статье мы узнаем о нейронных сетях прямого распространения, также известных как сети с глубокой прямой связью или многослойные персептроны. Они составляют основу многих важных нейронных сетей, используемых в последнее время, таких как сверточные нейронные сети (широко используемые в приложениях компьютерного зрения), рекуррентные нейронные сети (широко используемые для понимания естественного языка и последовательного обучения) и так далее. Мы постараемся понять важные концепции, используя интуитивно понятную игрушку и не будем вдаваясь в математику. Если вы хотите погрузиться в глубокое обучение, но не обладаете достаточным опытом в области статистики и машинного обучения, то эта статья станет идеальной отправной точкой.
Читать далее «Что такое нейронные сети прямого распространения»

Урок 2. Гистограмма направленных градиентов с использованием OpenCV

В этом уроке мы узнаем, что такое дескриптор признаков гистограммы направленных градиентов (HOG). Мы узнаем, что находится под капотом и как этот дескриптор рассчитывается внутри OpenCV, MATLAB и другими пакетами.

Этот пост является частью мини-курса из серии уроков, которые я пишу, о распознавании изображений и обнаружении объектов. Полный список уроков из этой серии приведен ниже:
Читать далее «Урок 2. Гистограмма направленных градиентов с использованием OpenCV»

Как визуализировать пандемию коронавируса с помощью фоновых картограмм

Вступление

Я активный сторонник визуализации данных, потому как считаю, что это наиболее эффективный метод иллюстрации и объяснения сложной информации, особенно числовых данных, в простой и удобоваримой форме. Кроме того, при грамотном исполнении, инфографика при интерпретации данных позволяет уменьшить или смягчить систематические ошибки. Один из заслуживающих особого внимания видов визуализации — анимированные фоновые картограммы или хороплеты. Сейчас идет пандемия, накопились огромные датасеты, и я подумал, что самое время продемонстрировать на них всю силу анимированных картограмм.

Здесь вы узнаете:

  • Что такое хороплеты.
  • Когда и почему их наиболее эффективно использовать.
  • Код Python для создания ваших собственных фоновых картограмм

Читать далее «Как визуализировать пандемию коронавируса с помощью фоновых картограмм»