Мы легко понимаем текст на картинке, просто на неё взглянув. Однако, с компьютерам всё как‑то не так. Им нужна какая‑то мето́да или алгоритм. Здесь на помощь приходит Optical Character Recognition (OCR) или оптическое распознавание символов. Оптическое распознавание символовએ — это процесс обнаружения текстового содержимого на изображениях и преобразование его в машинно-кодированный текст, к которому мы можем получить доступ и манипулировать в Python (или любом другом языке программирования) как со строковой переменной. Для этого в нашем уроке мы будем использовать библиотеку Tesseract. Читать далее «Как с помощью Python распознать текст в изображениях»
Во времена цифровизации производственных бизнес-процессов особое значение приобретают навыки работы с изображениями, Computer Vision. Здесь приведен небольшой пример построение и обучение модели, которая классифицирует изображения наборов данных CIFAR-10. Для его загрузки использован Tensorflow, а сам наборов данных содержит изображения самолетов, собак, кошек и еще 7 объектов. Библиотеки Tensorflow 2 и Keras Python помогут нам создать и обучить прогностическую модель, а также проверить её.
Классификация изображений относится к процессу компьютерного зрения, который может классифицировать изображение в соответствии с его визуальным содержанием. Например, алгоритм классификации изображений может быть разработан, чтобы определить, содержит ли изображение кошку или собаку. Хотя обнаружение объекта для человека тривиально, надежная классификация изображений по-прежнему является проблемой в приложениях компьютерного зрения.
Обнаружение объектов — это компьютерная технология, связанная с компьютерным зрением и обработкой изображений, которая занимается обнаружением экземпляров семантических объектов определенного класса, например, человеческие лица, автомобили, фрукты и т. д., в цифровых изображениях и видео.
В этом уроке мы будем создавать простой скрипт Python, который занимается обнаружением человеческих лиц на изображении, мы будем использовать два метода из библиотеки OpenCV. Во-первых, мы собираемся использовать каскадные классификаторы Хаара, что является простым (и не очень точным), но наиболее удобным способом для новичков.
После этого мы погрузимся в использование детекторов Single Shot Multibox (или коротко SSD), которые представляют собой метод обнаружения объектов на изображениях с использованием одной глубокой нейронной сети.
Примечание: стоит упомянуть, что вам нужно различать обнаружение объекта и классификацию объекта, обнаружение объекта — это обнаружение объекта и его расположение на изображении, а классификация объектов — это распознавание того, к какому классу принадлежит объект. Если вас интересует классификация изображений, перейдите к этому уроку.
Люди моего поколения ещё помнят то замечательное время, когда в каждом городском парке обязательно была комната смеха. Впервые в комнату смеха я попал году в 66-67 прошлого века на ВДНХ (Выставка достижений народного хозяйства, г. Москва) и с тех пор ни одна семейная прогулка в парке из моего детства не обходилась без этого развлечения. Конечно, весело было посмотреть на себя, но особенно на старших, как они молодели, становясь стройными и подтянутыми. Долго там делать нечего, но минут 15-20 безудержного, до слёз, смеха обеспечено. Читать далее «Комната смеха во времена пандемии COVID-19»
Мифическая сказка из Библии рассказывает о первой для людей инженерной катастрофе — Вавилонская башняએ. У проекта было всё: ясная миссия, огромный человеческий ресурс, отсутствие временных ограничений и адекватные технологии (кирпичи и строительный раствор). Тем не менее, всё это эффектно провалилось, потому что Бог перепутал языки и люди больше не смогли общаться.
Такие термины, как «гомография», сбивают с толку и напоминают, как мы всё еще частенько боремся с общением. Гомография — такая простая концепция, но так странно называется! Читать далее «Примеры гомографии с использованием OpenCV»