Как в Python извлечь все ссылки на веб‑странице

Получение всех ссылок на веб-странице — обычная задача для веб-парсеров, полезно создавать продвинутые парсеры, которые сканируют каждую страницу определенного веб-сайта для извлечения данных, его также можно использовать для процесса диагностики SEO или даже на этапе сбора информации для проникновения. тестеры. Здесь узнаете, как создать инструмент для извлечения ссылок на Python с нуля, используя только библиотеки requests и BeautifulSoup.
Читать далее «Как в Python извлечь все ссылки на веб‑странице»

Как, используя Python, загрузить все изображения с веб-страницы

Наверняка, хоть раз в жизни вам хотелось загрузить все изображения с понравившейся веб‑страницы? Сейчас вы узнаете, как создать парсер Python, который извлекает все изображения с веб‑страницы по ее URL‑адресу и загружает их с помощью библиотек requests и BeautifulSoup.
Читать далее «Как, используя Python, загрузить все изображения с веб-страницы»

Как с помощью Python извлечь метаданные изображения

Узнайте, как можно извлекать метаданные изображения, такие как информация GPS, марка камеры, модель и многое другое, с помощью Exchangeable Image File Format (EXIF) в Python с библиотекой Pillow.

Читать далее «Как с помощью Python извлечь метаданные изображения»

Как с помощью Python извлечь метаданные PDF

Метаданные PDF‑файлов содержат полезную информацию о PDF‑документе. Они включают заголовок документа, автора, дату последнего изменения, дату создания, тему и многое другое. Некоторые файлы PDF содержат больше мета‑информации, некоторые меньше и в этом наставлении вы узнаете, как извлечь метаданные PDF с помощью Python.
Читать далее «Как с помощью Python извлечь метаданные PDF»

Как визуализировать пандемию коронавируса с помощью фоновых картограмм

Вступление

Я активный сторонник визуализации данных, потому как считаю, что это наиболее эффективный метод иллюстрации и объяснения сложной информации, особенно числовых данных, в простой и удобоваримой форме. Кроме того, при грамотном исполнении, инфографика при интерпретации данных позволяет уменьшить или смягчить систематические ошибки. Один из заслуживающих особого внимания видов визуализации — анимированные фоновые картограммы или хороплеты. Сейчас идет пандемия, накопились огромные датасеты, и я подумал, что самое время продемонстрировать на них всю силу анимированных картограмм.

Здесь вы узнаете:

  • Что такое хороплеты.
  • Когда и почему их наиболее эффективно использовать.
  • Код Python для создания ваших собственных фоновых картограмм

Читать далее «Как визуализировать пандемию коронавируса с помощью фоновых картограмм»

Выбор модели и сравнительный анализ с помощью Modelplace.AI

В этом посте расскажу, как выбрать правильную модель с помощью Modelplace.AI. Выбор правильной модели ускорит ваше приложение, поможет масштабировать его до миллионов запросов и сэкономит кучу денег на облачных вычислениях.

Прежде чем перейти к техническим деталям, посмотрим на проблемы n00b (новичка).
Читать далее «Выбор модели и сравнительный анализ с помощью Modelplace.AI»

Как обстоят дела с распознаванием речи в 2021 году

Итак, вы захотели распознать речь на Python и обнаружили, что существует множество различных вариантов. Не бойтесь, я здесь, чтобы помочь. Мы можем разделить наши параметры распознавания речи Python на две основные категории: с открытым исходным кодом и облако.

Решения с открытым исходным кодом — это библиотеки с открытым исходным кодом (обычно на github), которые вы импортируете в свою программу и используете программно, выполняя вычисления на своих собственных ресурсах. Облачные решения для распознавания речи Python выполняют вычисления на облачных ресурсах и обычно предоставляются через конечные точки API, которые вы можете использовать.
Читать далее «Как обстоят дела с распознаванием речи в 2021 году»