Как с помощью Python распознать текст в изображениях

Мы легко понимаем текст на картинке, просто на неё взглянув. Однако, с компьютерам всё как‑то не так. Им нужна какая‑то мето́да или алгоритм. Здесь на помощь приходит Optical Character Recognition (OCR) или оптическое распознавание символов. Оптическое распознавание символовએ — это процесс обнаружения текстового содержимого на изображениях и преобразование его в машинно-кодированный текст, к которому мы можем … Читать далее «Как с помощью Python распознать текст в изображениях»

Поиск лиц на изображении с использованием OpenCV в Python

Обнаружение объектов — это компьютерная технология, связанная с компьютерным зрением и обработкой изображений, которая занимается обнаружением экземпляров семантических объектов определенного класса, например, человеческие лица, автомобили, фрукты и т. д., в цифровых изображениях и видео. В этом уроке мы будем создавать простой скрипт Python, который занимается обнаружением человеческих лиц на изображении, мы будем использовать два метода из … Читать далее «Поиск лиц на изображении с использованием OpenCV в Python»

Создание недорогой стереокамеры с использованием OpenCV

В этом посте мы узнаем, как создать нестандартную недорогую стереокамеру (используя пару веб-камер) и снимать с ее помощью 3D-видео с помощью OpenCV. Мы предоставляем код на Python. В частности, вы узнаете следующее: Шаги создания и настройки стереокамеры Важность стереокалибровки и коррекции Шаги стереокалибровки и коррекции Шаг 1: Индивидуальная калибровка правой и левой камер Шаг 2: Выполнение стереокалибровки … Читать далее «Создание недорогой стереокамеры с использованием OpenCV»

Введение в эпиполярную геометрию и стереозрение

Вы когда-нибудь задумывались, почему можно испытать этот чудесный 3D-эффект, когда смотрите фильм в этих специальных 3D-очках? Или почему сложно поймать мяч для крикета с одним закрытым глазом? Все это относится к стереоскопическому зрению, то есть нашей способности воспринимать глубину обоими глазами. Этот пост использует OpenCV и стереозрение для вычисления глубины изображения. Код предоставляется на Python.

9 лучших библиотек Python для специалистов по данным и инженеров по машинному обучению

Возможно, вы уже знаете, что Python — это язык программирования, который позволяет работать быстро и более эффективно интегрировать системы. Кроме того, Python — это язык общего назначения и это означает, что на нём можно создавать самые разные приложения, от веб-разработки с использованием Djangoએ или Flaskએ до науки о данных с использованием таких замечательных библиотек, как … Читать далее «9 лучших библиотек Python для специалистов по данным и инженеров по машинному обучению»

Мульти-метки при классификация изображений с PyTorch

Еще в 2012 году нейронная сеть впервые победила в конкурсе ImageNet Large Scale Visual Recognition. Алекс Крижевский, Илья Суцкевер и Джеффри Хинтон произвели революцию в области классификации изображений. В настоящее время задача присвоения отдельной метки изображению (или классификации изображения) хорошо известна. Однако практические сценарии не ограничиваются задачей «одна метка на одно изображение» — иногда нам нужно … Читать далее «Мульти-метки при классификация изображений с PyTorch»

Как легально использовать картинки из интернета

  В черновиках статья пролежала неделю, но когда заметил, что ссылки на фотостоки мне требуются ежедневно, понял — пора публиковать Визуальный контент — отличный способ улучшить свой сайт, повысить конверсию и продажи. В век интернета найти подходящие иллюстрации стало одновременно и просто, и сложно. Источников фото и картинок масса, но какие из них можно законно использовать … Читать далее «Как легально использовать картинки из интернета»