Как с помощью Python преобразовать pdf‑файлы в doc

Развлечение на сегодняшний вечер — показать вам, как можно использовать библиотеку pdf2docx для преобразования файлов PDF в расширение docx. Наша задача — разработать Python-модуль для преобразования одного или нескольких файлов PDF, расположенных в одной папке, в форме легкой утилиты командной строки не полагаясь на какие-либо внешние утилиты за пределами экосистемы Python.

Топ 5 тенденций web-разработки на Python для 2021 года

Недавний опрос 24 000 разработчиков Python в 150 странах мира, который провела компания Packt показал, что, более половины всех разработчиков Python традиционно используют его и для веб-разработки, хотя 59% разработчиков используют его в проектах Data Scienceએ! Python обогнал Javaએ и в мире стал вторым по популярности языком программирования для Web. Уже готов богатый набор фреймворков, например, … Читать далее «Топ 5 тенденций web-разработки на Python для 2021 года»

Рецепт приготовления нейронных сетей

Года три назад в своих Записках я опубликовал историю из научно-популярной лекции «ШАМАНСТВО» В АНАЛИЗЕ ДАННЫХ доцента ВМК МГУ имени М.В. Ломоносова, д.ф.-м.н. А.Г. Дьяконова. В ней внятно объясняется слово «шаманство» по отношении к обработке больших данных и необходимость наличия у исследователя некоторого эмпирического опыта, а не только знания строгостей математики. Вопрос соотношения детерминизма и … Читать далее «Рецепт приготовления нейронных сетей»

Чтение и запись видео с использованием OpenCV

Чтение и запись видео в OpenCV очень похоже на чтение и запись изображений. Видео — это не что иное, как серия изображений, которые часто называют кадрами. Итак, все, что вам нужно сделать, это перебрать все кадры в видеопоследовательности, а затем обрабатывать по одному кадру за раз. В этом посте мы покажем, как читать, отображать и … Читать далее «Чтение и запись видео с использованием OpenCV»

Лучшие инструменты Python ETL на 2021 год

При создании хранилища данных, для их перемещения в это хранилище обязательно встанет вопрос об ETLએ (от англ. Extract, Transform, Load — дословно «извлечение, преобразование, загрузка»). Первоначально данные извлекаются из массивов различных источников. Затем необходимо сделать преобразования в формат, который нужен для использования данных в дальнейшем, и, наконец, происходит загрузка в свое хранилище данных. Есть масса … Читать далее «Лучшие инструменты Python ETL на 2021 год»

Пытаетесь структурировать код в крупных проектах? Отличные ресурсы для новичка, которые не так легко найти

Итак, заканчивая первый курс и освоив дисциплины «Программирования» и «Курс молодого бойца: Python«, вы медленно, но верно должны превратиться в продвинутого новичка — некоторый путь к основам Python пройден и вы уже можете решать реальные проблемы. Возможно, очень скоро вы приступить к своему первому большому проекту, однако не знаете, с чего начать, как его структурировать … Читать далее «Пытаетесь структурировать код в крупных проектах? Отличные ресурсы для новичка, которые не так легко найти»

Как с помощью в Python извлечь все ссылки на веб‑сайты

Извлечение всех ссылок на веб-странице — обычная задача для веб-парсеров, полезно создавать продвинутые парсеры, которые сканируют каждую страницу определенного веб-сайта для извлечения данных, его также можно использовать для процесса диагностики SEO или даже на этапе сбора информации для проникновения. тестеры. В этом руководстве я расскажу, как с нуля на Python создать инструмент для извлечения ссылок, … Читать далее «Как с помощью в Python извлечь все ссылки на веб‑сайты»