Теперь, когда летние курсы подходят к концу [EWD895], самое время посмотреть на их тему под другим углом зрения.
Официальная тема курсов: «Потоки управления и потоки данных: Концепции распределенного программирования» — всего лишь определила направление, обычно мы приходили к гораздо более общим вопросам, которые, вероятно, жизненно важны для информатики в целом. Итак, какова природа информатики или, что возможно более точно, какой она должна быть? Читать далее «О природе информатики»
На сегодняшний день правовое регулирование интеллектуальной собственности внутри страны осуществляется на основе части 4 Гражданского кодекса Российской Федерации (ч. 4 ГК РФ), действующей с 1 января 2008 года. Разработка ч. 4 ГК РФ инициирована тогдашним президентом Дмитрием Медведевым. За шесть с небольшим лет в неё внесено двенадцать изменений. Читать далее «Гражданский кодекс РФ и защита авторских прав в Интернете»
Раньше термин «компьютерная грамотность» по своей сути означал умение работать с офисным пакетом, но жизнь не стоит на месте, и теперь всё больше экспертов (и даже звезда НБА Крис Бош) заявляют о том, что крайне важным навыком для широкого круга людей становится умение программировать. Читать далее «Тренды 2015: Почему всё больше «не-технарей» изучают вёрстку»
Minimum Viable Product (MVP) — минимальный жизнеспособный продукт, создаваемый в соответствии с концепцией «Бережливый стартапએ», это версия продукта с минимальным набором характеристик, за которые пользователь готов «платить». Здесь под платой понимаются не только деньги, но и внимание пользователя, его время и интерес. Читать далее «Смотри как надо делать Landing Page»
«Золотое» правило всех администраторов баз данных – не делай ничего серьезного с базой данных, если у тебя нет бэкапа. Если ты собрался серьезно изменить параметры базы данных, провести операции по техническому обслуживанию базы данных и т.п. – то всегда перед этим надо выполнить операцию резервного копирования. Этот принцип достаточно долго работал и оправдывал себя, и даже в нескольких случаях помогал восстановить базу данных на определенный момент времени.
Недавно перед нами была поставлена задача – разработать процедуру резервного копирования хранилища данных размером в 20 Терабайт. Используя наработанные практики резервного копирования, я попытался разработать такую процедуру и уложиться в то же время в рамки RPOએ (recovery point objective) и RTOએ (recovery time objective). Обе эти характеристики измеряются во времени и представляют собой следующее: RPO – допустимый объем возможных потерь данных, RTO – допустимое время простоя или за какое время база данных должна восстановиться. Вот тут-то и началось самое интересное – как бы я не прикидывал и не рассчитывал, но разработанная процедура резервного копирования никак не желала укладываться в эти рамки – слишком большой объем данных надо было забэкапить. В самом лучшем случае, с многочисленными оговорками и условиями база данных восстанавливалась за несколько часов, а такого бизнес себе позволить не мог. Хотя, у Сбербанка на этот счет несколько иное мнение и они считают, что клиенты могут и подождать. Но тут был не Сбербанк. В обычной же ситуации, когда на базу данных не налагались серьезные ограничения и условия, восстановление заняло бы несколько дней. Это усугублялось тем, что невозможно «снять» бэкап за приемлемое время – это также занимало несколько дней и создавало большую нагрузку на базу данных. Сразу оговорюсь, что эта база данных не поддерживает инкрементальный бэкап в текущей версии. Возможно, если бы мы могли получить инкрементальностьએ, то игра и стоила бы свеч, и традиционная процедура резервного копирования имела бы право на жизнь в этом случае.
Поняв, что процедура резервного копирования здесь нежизнеспособна, я начал поиск уже существующих решений этой проблемы. Довольно быстро обнаружилось, что такие объемы информации никто не бэкапит «в лоб». Существуют несколько подходов, которые позволяют иметь резервную копию базы данных такого объема, более или менее актуальную во времени.
Инкрементальность
Если база данных поддерживает инкрементальный бэкапએ и размер постоянных изменений в базе данных относительно невелик, то можно попробовать выполнять процедуру инкрементального резервного копирования в определенные промежутки времени. Однако этот способ подходит не всем и довольно неудобен в том плане, что этот бэкап надо постоянно «накатывать» на второй экземпляр базы данных. Тут инкрементальный бэкап играет роль скорей всего последнего средства, а инкрементальность позволяет снять лишнюю нагрузку на базу данных и бэкапить только измененные данные. Тем не менее, с рядом условий это решение имеет право на жизнь, хотя и не является самым лучшим на мой взгляд.
Репликация
Одно из самых распространенных решений – это репликацияએ новых и измененных данных на одну или несколько копий базы данных. Существует множество технологий, позволяющих проводить такую репликацию, как на транзакционном уровне, так и на уровне файловой системы, она может быть как синхронной, так и асинхронной. Преимущества такой репликации состоят в том, что у вас будет практически точная копия базы данных. Механизмы отлавливания ошибок во время репликации позволяют довольно быстро и безболезненно понять их причину и, вследствие этого, быстро исправить. Самый же большой недостаток – это большая нагрузка и высокая стоимость этих технологий. Однако в отсутствии возможностей поддерживать резервную копию базы данных в актуальном состоянии с помощью других средств, репликация была и будет одним из наиболее применяемых решений для сверхбольших данных.
«Двойной» ETL
Как правило, перед тем, как попасть в хранилище данных, данные проходят через ETLએ или ELT процедуры. Сама аббревиатура ETLએ говорит нам, что данные перед тем, как попасть в хранилище данных соответствующим образом преобразовываются, а лишние данные отсекаются. Этот процесс можно распараллелить – т.е. сделать загрузку данных не в одно хранилище данных, а в два или несколько. Таким образом, у нас будет столько копий хранилища данных, сколько нам потребуется. Но, несмотря на это, такой подход обладает существенным недостатком – зачастую копии не идентичны, так как в процессе загрузки данных возникают ошибки и несоответствия. Не всегда понятно, какая из копий является более правильной. Может быть, какой-то бизнес и может допустить такое несоответствие, но если речь идет о финансовых компаниях, то тут такое допущение не имеет право на существование. Можно разработать сложную процедуру верификации и исправлении ошибок, но, как правило, это лишь затрудняет и замедляет весь процесс. Подводя итог этому подходу, можно сказать, что он применим в ограниченном количестве случаев.
Как уже стало понятно, практика восстановления таких объемов с бэкапов не применяется нигде – это занимает несколько дней, а то и недель. Основной методикой восстановления функциональности в случае падения основной базы данных, является переход на работающую копию базы данных. Для поддержания актуальности этой копии применяется ряд методов, некоторые из которых я перечислил выше. Традиционные подходы к резервному копированию, заключающиеся в сохранении копии базы данных и восстановлении с неё в случае отказа не работают с базами данных сверхбольших объемов – за примерами далеко ходить не надо. Суммируя всё вышесказанное, хочется поставить запятую в заголовке на правильное место – backup делать нельзя, работать без него.
Технические проблемы c проектором на крайней лекции по курсу «Современные Web-технологии» ускорили написание и завершение этого опуса, прежде всего, необходимого для демонстрации живых ссылок с иллюстрацией тезисов. Надеюсь, что это первая, т.е. не последняя, статья из серии материалов, посвященных одностраничным сайтам. Что это такое и для какой такой своей пользы необходимо и обязательно заниматься этим вопросом студентам Бизнес-информатики? В популярном «требнике» Wikipedia это явление называется «Целевая страницаએ» — почитайте, это займет всего-то пять сек.
I. Прежде чем пытаться ответить на поставленный вопрос посмотрите герою дня в лицо. Типичные примеры:
Что отличает «кормильца»?
II. Посмотрели? Да, да такие сайты за их ничем не прикрытую прагматичность часто называют «кормильцами». От них ожидают активного действия посетителя — сделать заказ, зарегистрироваться на мероприятие, оставить отзыв, заполнить контактную форму, позвонить по телефону. В дальнейшем это активное действие в соответствии с разнообразными, но практически шаблонными бизнес-моделями, превращается в выгоду или в доход владельца сайта, т.е., как это модно и принято сейчас говорить, монетизируются.
Чем выделяется типичный «кормилец»:
Состоит из всего одной страницы (логично следует из названия), выполненной, как правило, в HTML-коде с CSS, иногда, с JavaScript для драйва на стороне клиента без использования серверных скриптов или программ, баз данных и прочих сопутствующих инструментов;
Скромный дизайн, но качественные юзабилити, UI и простая, интуитивно-понятная, навигация на странице, подчеркиваю, на странице;
Агрессивный текст или попытка сделать текст таковым с «предложением, от которого невозможно отказаться», побуждающим посетителя к активным действиям без которых рухнет мир, вас ожидает большая беда, но вечное блаженство в противном случае;
Обилие красочных рисунков, шрифтов, цветов, заголовков и подзаголовков (зачастую гипнотически «глаз застит»), призванные произвести впечатление и надолго остаться в памяти посетителей;
Большая кнопка в стиле «Сделать заказ», «Не опоздай, регистрируйся», «Сделай это немедленно»;
Фотографии довольных посетителей, свершивших решающее деяние и ставших довольными клиентами с их восторженными отзывами;
Реже на теле кормильца имеются портреты создателя, автограф, биография;
Еще реже гарантии того, что вам не станет хуже от решительного нажатия кнопки;
Иногда одностраничник становится многоэкранником – текст занимает от 5 до 20 экранов, но html-файл при этом всегда один, но
Общая линейная схема построения так же всегда одна – яркий заголовок, слоган и от него вправо-вниз лента, как правило, с вертикальной прокруткой, на которой последовательно 1) обозначение проблемы и 2) единственного путь ее решения, 3) преимущества единственного решения, 4) восторженные отзывы тех, кто попробовал, 5) гарантии и 6) призыв к активным действиям. Навигация — вертикальная прокрутка по перечисленным пунктам. Грубо, но безотказно работает в сети для достижении поставленной цели — продажи.
III. Кому нужны одностраничники?
Прежде всего, торговцам одного товара;
Фрилансерам – для саморекламы, «себя не похвалишь, кто похвалит?», это сайт-визитка.
Организаторам мероприятий – для приглашения на одноразовое мероприятие (например, конференция, презентация или незабываемая свадьба).
Свежим выпускникам – для создания эффектного и простого резюме.
Жителям виртуального пространства, работающим над построением сайта – для создания временной страницы «Сайт находится в разработке».
Поклонникам принципов «меньше – это больше» под лозунгом «Краткость — сестра таланта».
Давайте предоставим сайтам-одностраничникам возможность говорить самим за себя или: