Пишете ли вы электронное письмо, проверяете свои твиты, слушаете музыку или обсуждаете важнейшие вопросы типа, «различают ли собаки цвета?», в
Ещё недавно в интернете бизнес зарабатывал деньги по-простому, продавая доступ к своим услугам, программам или приложениям. Однако, по мере роста конкуренции и изменения тенденций покупательского спроса всё больше и больше подобных товаров теперь предлагается бесплатно. Бизнесмены внезапно стали благотворителями? — Нет, они по прежнему извлекают прибыль. Только придумали другой способ зарабатывать деньги. Можете догадаться, какой?
Некоторым образом реклама может позволить бизнесу предлагать свои программы и сервисы бесплатно, но это не самое прибыльное дело. Безусловно, наибольшую ценность представляют данные, которые мы создаём при использовании их инструментов и приложений. Такая информация гораздо дороже любой другой цены, которую готовы заплатить мы. Информация обладает самой большой ценностью, если знать куда её применить и что с ней делать.
Независимо от того, знаете вы, что оставляете цифровой след, когда серфите по интернету или нет, большинство будет удивлено, насколько ваш след велик. Количество данных, которые генерируем мы все ежедневно ошеломляет.
В своём проекте
По оценкам демографии население мира к 2020 году составит около 7,76 миллиарда человек. Это означает, что общий объем данных, генерируемых ежедневно, составит 1,14 зеттабайт. Если бы 1,2 зеттабайта букв были напечатаны в книгах, то ими можно было бы покрыть всю поверхность Земли в слоем высотой в 52 книги. Поскольку население продолжает расти и все больше и больше людей в интернете, то цифры эти будут расти в геометрической прогрессии.
Это огромные цифры, но то, что может быть достигнуто с использованием этих данных, еще более впечатляет. Например, используя эти данные, мы учимся предсказывать будущее, узнавая, что люди ищут в интернете.
18_domo_data-never-sleeps-6+verticals (1)
Забрать этот файл
Для понимания масштаба цифр рекомендую прочитать статью Йоттабайт и йобибайт — это круто.
Проблема заключается в том, что в сыром виде большинство наборов данных просто слишком велики для нашего восприятия.
Большим числам трудно заставить голову правильно работать. Если бы вы увидели две автостоянки, где на одной стоит 10 автомобилей, а на другой — 100, то понять разницу легко. Но что, если на стоянке 10 000, 100 000, 1 000 000 или даже больше машин? Когда мы имеем дело с массой вещей, когда для записи их количества требуется пять и более цифр, человеческий мозг теряется, пытаясь изо всех сил их осознать. Закон Миллераએ утверждает, что максимальное число объектов, которые средний человеческий мозг может удерживать в кратковременной памяти, составляет 7 ± 2. Людям нужна помощь, когда они имеем дело с большими наборами данных.
Чтобы оценить истинную ценность, данные необходимо дополнительно обрабатывать и преобразовывать во что‑то, что позволит увидеть важную информацию, выявлять закономерности, понимать сложные концепции, получать информацию, основанную на данных и, в конечном итоге, принимать более эффективные решения. Визуализация данных — наш союзник.
Разработка эффективной визуализации — это совсем не то, чтобы заставить цифры выглядеть красиво. Это упражнение в Ясной визуальной коммуникации. Чтобы вступить на правильный путь и создавать действительно полезные и эстетически приятные визуализации, необходимо задать себе несколько вопросов:
- Какие данные вы хотите отобразить? Прежде чем вы начнёте делать что‑то ещё, определитесь с данными, которые хотите визуализироваться, какие цели вы преследуете и что хотите показать людям. У каждой визуализации должна быть четко определенная цель для грамотного проектирования.
- Что вам нужно для полного осознания этих данных? Как следствие предыдущего вопроса, необходимо решить, в чём заключается полное осознание своих данных. Надо подумать о том, нужно ли сравнивать наборы данных, надо ли корректировать диапазон представления и какие самые важные акценты необходимо расставить.
- Будет ли визуализация понятна с первого взгляда? Мысли, которые вы хотите передать с помощью своей визуализации должны быть восприняты почти мгновенно. Постоянно пересматривайте свои проекты и упрощайте там, где это возможно. Потребуется много размышлений и усилий, но будьте терпеливы. Это очень важно для эффективной визуализации.
- Знаете ли вы свою аудиторию? Даже если это только для вас, подумайте, кто может просмотреть вашу визуализацию. Чего они от неё хотят? Если она интерактивная, то как они, вероятно, будут с ней взаимодействовать? Находится ли аудитория в контексте? Ваша визуализация данных должна быть построена вокруг потребностей аудитории и разработана именно для неё.
- Точно ли вы интерпретируете свои данные? Здесь можно легко сделать ошибки. Убедитесь, что ваша интерпретация данных точна и прозрачна. Следите за системой координат или искажением данных, если оси не начинаются с нуля. Подумайте о том, могут ли, намеренно или нет, ваши проектные решения привести к неправильной интерпретации.
- Может быть, вы пытаетесь объять необъятное? После того, как вы начнете легко поддаться искушению и добавлять все больше и больше деталей к своей визуализации. Не делай этого! Визуализация может очень хорошо передать одну мысль и плохо — несколько. Направьте свою визуализации на единственную цель и придерживайтесь ее. Если вы хотите добавить дополнительные детали, даже если уверены на все 100%, то все равно не делайте этого! То, что вам нужно — это еще одна визуализация, а не дополнительные сведения о данных.
- Можно ли сделать визуализацию интерактивной? Создание интерактивной визуализации данных, дополненную переходами и анимациями, позволяет читателям настраивать ее в соответствии со своими потребностями, фильтровать набор данных по своему усмотрению и дает возможность детализации информацию для конкретных разделов, не затеняя главного. Короче говоря, интерактивность позволяет «поиграть» с данными, что может быть основой понимания и источником озарений.
Два наиболее эффективных инструмента интерактивной визуализации фреймворки Python dash и bokeh. Пройдите по этим ссылкам и получите более полное представление о визуализации больших данных.
Использованы материалы:
Наш цифровой след и его визуализация, опубликовано К ВВ, лицензия — Creative Commons Attribution-NonCommercial 4.0 International.
Респект и уважуха