Геометрия формирования изображений

  Написано специально для студентов Бизнес‑информатики, которые только начинают осваивать OpenCV и всякий там Computer Vision, которым тяжело с математикой

Здесь с геометрической точки зрения объясняются основы формирование изображения.

В частности, рассматривается математика, стоящая за тем, как точка в 3D‑изображении проецируется на плоскость изображения.

Статья по своей природе не математическая и предназначена исключительно для новичков. Тем не менее, что такое перемножение матриц знать надо.
Читать далее «Геометрия формирования изображений»

Работа с PDF-файлами в Python (часть I): чтение и разбор

В эпоху бурной цифровизации Portable Document Format (PDF) — межплатформенный открытый формат электронных документов, изначально разработанный компанией Adobe Systems с использованием ряда возможностей языка PostScript, стал особенно популярным. В первую очередь, он предназначен для представления в электронном виде полиграфической продукции. C 1 июля 2008 года PDF стал открытым стандартом ISO 32000. Последняя версия ISO 32000‑2: 2017 впитала в себя весь опыт использования стандарта и отражает его эволюцию. Сегодня PDF, де‑факто, стал стандартном обмена информации и для многих приложений стал бесценным источником контента. Но работать с таким контентом сложно.
Читать далее «Работа с PDF-файлами в Python (часть I): чтение и разбор»

7 обязательных плагинов IntelliJ IDEA для работы с Python

Одиноко на вершине Олимпа.

Зевс, вечный царь богов, пытаясь сохранить свое царствование, столкнулся с серьёзными трудностями. В битве за власть Аид чуть не узурпировал своего брата Зевса. В преддверии битвы, большинство было на стороне Зевса. Кто захочет связываться с парнем, который мечет молнии? Некоторые из самых недовольных богов встали на сторону Аида и битва разгорелась.

Бэк-энд мира программирования мало чем отличается от вершины Олимпа. Здесь всегда идут сражения за превосходство. В 2020 году все ещё нет победителя в битве между Java и Python. Подобно древним грекам, большинство бойцов-разработчиков «поклоняются» одному или двум широко известным языкам программирования. Однако, в отличие от Древней Греции, современные продвинутые программисты (на самом деле их не очень много) более изощрённы.
Читать далее «7 обязательных плагинов IntelliJ IDEA для работы с Python»

На «Бизнес-информатике» в ЮУрГУ учат Python: девять советов из практики

Полтора года назад, после восьми-летнего перерыва, с удовольствием возобновил курс «Программирование». Этому предшествовали два месяца отпуска, два месяца мучительных сомнений, как это делать сейчас, с чего начать, если для многих первокурсников это первый практический опыт изложения своих мыслей на языке программирования? За восемь лет многое изменилось, много воды утекло, особенно в ИТ. И хотя «родные» языки для меня «С» и «С++», на которых работа не прекращалась ни на один день (это как у музыканта, играть надо ежедневно и без перерывов, ни дня без строчки кода); и по-прежнему считаю, что уважающий себя программист должен их знать и ими владеть, всё-таки начал с Python. По всей видимости, перед прикладниками автоматизации процессов в экономико-управленческой сфере, перед бизнес-информатиками, которые для этого более всех подготовлены, никогда не будут стоять задачи по реализации своей операционной системы или управления техническими устройствами на уровне контроллера, где «С» и «С++» наиболее эффективны. Да, по прежнему считаю, что чистый «С» без «плюсов» — самый действенный инструмент воспитания алгоритмического мышления. Но в XXI веке скорость один из решающих факторов успеха в профессии. Поэтому этот промежуточный этап, наверное, становится лишней тратой времени. Будем формировать агоритмическое мышление на Python.

Читать далее «На «Бизнес-информатике» в ЮУрГУ учат Python: девять советов из практики»

Подборка датасетов для машинного обучения

Перед вами статья-путеводитель по открытым наборам данных для машинного обучения. В ней, для начала, собрана подборка интересных и свежих (относительно) датасетов. А бонусом, в конце статьи, прикреплены полезные ссылки для облегчения самостоятельного поиска датасетов.

Меньше слов, больше данных.
Поехали…

Основы градиентного бустинга

Александр СербулДеревья градиентного бустинга, с помощью которых сейчас много соревнований выигрывают с пол-пинка, ставят под сомнение возможности и перспективы deep learning 😉 Зачем нейросети, если можно гораздо точнее, с помощью последовательной компенсации ошибки предыдущей модели, добавлять деревья друг на друга, упрощая оптимизацию через хак в разложение функции потерь в ряд Тейлора и вырезание первых двух членов. А еще можно делать на деревьях сразу и регуляризацию, заодно, и решение становится из коробки хорошо устойчивым к переобучению. Красота — нейросетям и не снилось 🙂

Александр Сербул
Руководитель направления контроля качества интеграции и внедрений в 1С-Битрикс

Классная, подробная и понятная преза по деталям внутри деревьев градиентного бустинга от создателей XGBoost — от простого к сложному:
Читать далее «Основы градиентного бустинга»

TOP 5 фреймворков Python для Web-разработки в 2020 году

Python — универсальный язык программирования и его можно пользовать для реализации любого класса задач от простого сценария автоматизации до системного программирования, от разработки игр до научных графических и веб‑приложений. Последнее время именно в науке о данных и машинном обучении Python набирает обороты. Интеграция серьёзных вычислительных приложений с web-приложениями для представленя результатов в интернете — ведущий тренд современности. Поэтому в этой статье обсуждаются 5 лучших веб‑фреймворков Python с более-менее внятными подробностями и комментариями.

Веб‑приложение состоит из двух частей: клиентской и серверной. Клиентская часть — это, в основном, HTML, CSS и Javascript и рассматривается она, как способ представления информации пользователям. Серверная часть, как правило, является наиболее сложной и описывает всю бизнес-логику приложения. Веб‑разработку серверной части можно выполнить на многих языках, таких как Java, .Net, PHP, Ruby on Rails, Javascript и т. д. Сегодня Python с его веб‑фреймворками также служит основой серверной части приложений.
Хочу узнать