Сборка, разборка и эмуляция с использованием Python

Бывают такие нелегкие для прикладника времена, когда надо работать на низком уровне и просто ловить биты в центральном процессоре. Бывают они не часто, но случилось. Последний раз что-то подобное мне приходилось делать лет этак 30-35 назад. Так, что вспоминаем молодость и различные архитектуры процессоров, но уже не с «С++», а на Python. Он теперь ближе…

Вспоминаем ассемблерный код, который является языком программирования низкого уровня, напрямую использующий регистры и память внутри собственного исполняемого файла. В собранном виде ассемблерный код хранится в виде двоичных данных и для каждого процессора есть своё руководство, в котором описано, как каждая инструкция закодирована в байты данных.

Дизассемблер — это процесс, обратный сборке, байты данных анализируются и преобразуются в инструкции сборки (которые более удобочитаемы для пользователей).
Читать далее «Сборка, разборка и эмуляция с использованием Python»

Как с помощью Python преобразовать pdf‑файлы в картинки

Ещё одно вечернее развлечение посвящаю разработке легкого инструмента командной строки для преобразования файлов PDF в картинки.

Будем использовать PyMuPDF, универсальное настраиваемое решение для интерпретатора PDF, XPS и электронных книг, которое можно использовать в широком спектре приложений, таких как средство визуализации PDF, средство просмотра или набор инструментов.
Читать далее «Как с помощью Python преобразовать pdf‑файлы в картинки»

Как с помощью Python преобразовать pdf‑файлы в doc

Развлечение на сегодняшний вечер — показать вам, как можно использовать библиотеку pdf2docx для преобразования файлов PDF в расширение docx.

Наша задача — разработать Python-модуль для преобразования одного или нескольких файлов PDF, расположенных в одной папке, в форме легкой утилиты командной строки не полагаясь на какие-либо внешние утилиты за пределами экосистемы Python.
Читать далее «Как с помощью Python преобразовать pdf‑файлы в doc»

Разведочный анализ данных в Python: руководство для новичков на 2021 год

Мне часто приходится говорить, что для понимания проще нарисовать, лучше всего нарисовать. В подавляющем большинстве случаев, после того, как всё стало понятно, остальное не так и сложно, становится делом техники. То же самое и в науке о данных, и этап, на котором всё «понимается» называется Exploratory Data Analysis (EDA) или разведочный анализ данных. EDA играет важнейшую роль после получения набора данных и ставит своей целью выяснить, как с ним работать и получить требуемый результат.

Итак, в этой статье познакомлю новичков с EDA. Не волнуйтесь, всё когда-то впервые и если вы только что узнали, что EDA существует, то к концу статьи вы будете иметь четкое представление обо всех основных моментах, связанных с EDA и вместе с тем увидите пошаговые практические примеры кодирования. Давайте разбираться!
Читать далее «Разведочный анализ данных в Python: руководство для новичков на 2021 год»

Генеративная и дискриминативная модели

Большинство задач, которые вы решаете в области машинного и глубокого обучения, основываны на генеративной и дискриминативной моделях. В машинном обучении нужно четко различать два типа моделирования:

  • Классификация изображения, например, собаки или кошки, которое подпадает под дискриминативное моделирование.
  • Создание реалистичного изображения, той же собаки или кошки — задача генеративного моделирования.

Чем больше нейронные сети вторгаются в нашу жизнь, тем больше разрастаются области генеративного и дискриминативного моделирования. Для понимания алгоритмов, основанных на этих моделях, необходимо изучить теорию и все концепции моделирования.

Что нужно для взлёта?   

Базовое понимание машинного обучения и глубокого обучения — это то, с чего нужно начать. После того, как появится основа, переходите к более сложным темам, таким как генеративные состязательные сети или GAN. Если у вас есть какой-то опыт в задачах классификации изображений (дискриминация) или реконструкции изображений (генерация), то это будет значительным бонусом. Не понимать, что именно скрывается под капотом и как моделируются проблемы — это нормально.
Читать далее «Генеративная и дискриминативная модели»

Новое пополнение команды цифровой трансформации бизнеса

Вчера, 16 июня 2021, завершились защиты ВКР бакалавров образовательного направления 38.03.05 «Бизнес-информатика». Традиционно, и это надо отметить, качество представленных к защите работ в 2021 было значительно лучше, чем в 2020. Глубина проработки и практические решения, определи успех результатов ВКР на предприятиях Челябинска. Более половины из них уже внедрены. Признание результатов ВКР практиками бизнеса является лучшим подтверждением компетенций наших выпускников.
Читать далее «Новое пополнение команды цифровой трансформации бизнеса»

2:0 в пользу Бизнес-информатики

Мотивом этой записки стала мысль Уилла Гейбрика, финансового директора Stripe и члена генерального финансового совета CNBC (Will Gaybrick, Stripe CFO and a member of the CNBC Global CFO Council), высказанная им на портале CNBC в 2018 году, и которая звучит так: «Tech’s ultimate success: Software developers are now more valuable to companies than money» или в переводе на русский «Окончательный успех технологий — для компаний теперь более ценны программисты, а не деньги».

В большинстве компаний осознали, что отсутствие доступа к разработчикам программного обеспечения является бо́льшей угрозой для успеха, чем отсутствие доступа к капиталу.

Тем не менее, своим самым важным ресурсом компании злоупотребляют, потому как слишком много разработчиков связаны с проектами поддержки устаревших систем и плохого программного обеспечения, и обходятся в $300 миллиардов в год, а $85 миллиардов, связаны только с наличием плохого кода.

В следующее десятилетие опыт программистов, при правильном использовании, может добавить $3 триллиона к мировому ВВП.


Читать далее «2:0 в пользу Бизнес-информатики»