Как с помощью Python распознать текст в изображениях

Мы легко понимаем текст на картинке, просто на неё взглянув. Однако, с компьютерам всё как‑то не так. Им нужна какая‑то мето́да или алгоритм. Здесь на помощь приходит Optical Character Recognition (OCR) или оптическое распознавание символов. Оптическое распознавание символов — это процесс обнаружения текстового содержимого на изображениях и преобразование его в машинно-кодированный текст, к которому мы можем получить доступ и манипулировать в Python (или любом другом языке программирования) как со строковой переменной. Для этого в нашем уроке мы будем использовать библиотеку Tesseract.
Читать далее «Как с помощью Python распознать текст в изображениях»

Как создать классификатор изображений на Python с помощью Tensorflow 2 и Keras

Во времена цифровизации производственных бизнес-процессов особое значение приобретают навыки работы с изображениями, Computer Vision. Здесь приведен небольшой пример построение и обучение модели, которая классифицирует изображения наборов данных CIFAR-10. Для его загрузки использован Tensorflow, а сам наборов данных содержит изображения самолетов, собак, кошек и еще 7 объектов. Библиотеки Tensorflow 2 и Keras Python помогут нам создать и обучить прогностическую модель, а также проверить её.

Классификация изображений относится к процессу компьютерного зрения, который может классифицировать изображение в соответствии с его визуальным содержанием. Например, алгоритм классификации изображений может быть разработан, чтобы определить, содержит ли изображение кошку или собаку. Хотя обнаружение объекта для человека тривиально, надежная классификация изображений по-прежнему является проблемой в приложениях компьютерного зрения.

В этом уроке вы узнаете, как успешно классифицировать изображения в наборе данных CIFAR-10 (который состоит из самолетов, собак, кошек и других 7 объектов) с помощью Tensorflow в Python.
Читать далее «Как создать классификатор изображений на Python с помощью Tensorflow 2 и Keras»

Поиск лиц на изображении с использованием OpenCV в Python

Обнаружение объектов — это компьютерная технология, связанная с компьютерным зрением и обработкой изображений, которая занимается обнаружением экземпляров семантических объектов определенного класса, например, человеческие лица, автомобили, фрукты и т. д., в цифровых изображениях и видео.

В этом уроке мы будем создавать простой скрипт Python, который занимается обнаружением человеческих лиц на изображении, мы будем использовать два метода из библиотеки OpenCV. Во-первых, мы собираемся использовать каскадные классификаторы Хаара, что является простым (и не очень точным), но наиболее удобным способом для новичков.

После этого мы погрузимся в использование детекторов Single Shot Multibox (или коротко SSD), которые представляют собой метод обнаружения объектов на изображениях с использованием одной глубокой нейронной сети.

Примечание: стоит упомянуть, что вам нужно различать обнаружение объекта и классификацию объекта, обнаружение объекта — это обнаружение объекта и его расположение на изображении, а классификация объектов — это распознавание того, к какому классу принадлежит объект. Если вас интересует классификация изображений, перейдите к этому уроку.

Читать далее «Поиск лиц на изображении с использованием OpenCV в Python»

Защищено: Рисуем в воздухе с помощью виртуальной ручки, ластика и OpenCV

Это содержимое защищено паролем. Для его просмотра введите, пожалуйста, пароль:

Комната смеха во времена пандемии COVID-19

Люди моего поколения ещё помнят то замечательное время, когда в каждом городском парке обязательно была комната смеха. Впервые в комнату смеха я попал году в 66-67 прошлого века на ВДНХ (Выставка достижений народного хозяйства, г. Москва) и с тех пор ни одна семейная прогулка в парке из моего детства не обходилась без этого развлечения. Конечно, весело было посмотреть на себя, но особенно на старших, как они молодели, становясь стройными и подтянутыми. Долго там делать нечего, но минут 15-20 безудержного, до слёз, смеха обеспечено.
Читать далее «Комната смеха во времена пандемии COVID-19»

Примеры гомографии с использованием OpenCV

Мифическая сказка из Библии рассказывает о первой для людей инженерной катастрофе — Вавилонская башня. У проекта было всё: ясная миссия, огромный человеческий ресурс, отсутствие временных ограничений и адекватные технологии (кирпичи и строительный раствор). Тем не менее, всё это эффектно провалилось, потому что Бог перепутал языки и люди больше не смогли общаться.

Такие термины, как «гомография», сбивают с толку и напоминают, как мы всё еще частенько боремся с общением. Гомография — такая простая концепция, но так странно называется!
Читать далее «Примеры гомографии с использованием OpenCV»

Дополненная реальность с маркерами ArUco в OpenCV

Здесь вы узнаете, что такое маркеры ArUco и зачем они нужны в задачах дополненной реальности с использованием OpenCV.

В задачах дополненной реальности маркеры ArUco некоторое время применяли для оценке позиционирования и калибровки камеры. Давайте узнаем об это побольше.
Читать далее «Дополненная реальность с маркерами ArUco в OpenCV»