В каком виде могут быть представлены данные

Машинные данные на рисунке выше хорошо укладываются в структуру классической базы данных. Это не лучший формат для данных с высокой степенью связности или «сетевых» данных, в которых достаточно значимую роль играют отношения между сущностями.
Термин «графовые данные» может сбить с толку, потому что любые данные могут быть представлены в виде графа. Под «графом» в данном случае имеется в виду понятие графа из математической теории графов — математическая структура для моделирования попарных отношений между объектами. Вкратце, в графовых, или сетевых, данных особое внимание уделяется связям или смежности объектов. Графовые структуры данных используют узлы, ребра и свойства для представления и хранения графических данных. Графовые данные естественным образом подходят для представления социальных сетей, а их структура позволяет вычислять такие специфические метрики, как влияние участников и кратчайший путь между двумя людьми.
Примеры графовых данных встречаются на многих веб-сайтах социальных сетей. Например, в LinkedIn можно увидеть, кого вы знаете в той или иной компании. Ваш список читателей в Твиттере также является примером графовых данных. Сила и мощь связанных данных проявляется при анализе нескольких перекрывающихся графов, построенных на одних и тех же узлах. Например, представьте, что ребра обозначают «друзей» на Facebook. А теперь возьмем другой граф с теми же людьми, но связывающий коллег по бизнесу через LinkedIn, и третий граф, основанный на интересе к фильмам на Netflix. Наложение этих трех графов позволит получить ответы на многие интересные вопросы.
Для хранения графовых данных используются графовые базы данных, а для построения запросов к ним — такие специализированные языки запросов, как SPARQL.
Работа с графовыми данными создает специфические проблемы, причем для компьютера эта задача становится еще сложнее.
Аудио, видео и графика — типы данных, ставящие непростые задачи перед специалистом data science. Задачи, тривиальные с точки зрения человека (например, распознавание объекта на картинке), оказываются сложными для компьютера. В 2014 году компания MLBAM (Major League Baseball Advanced Media) объявила, что объем записываемых видеоматериалов для одного бейсбольного матча будет увеличен приблизительно до 7 Тбайт с целью проведения оперативного анализа. Высокоскоростные камеры на стадионах записывают движения мяча и спортсменов для того, например, чтобы вычислять в реальном времени траекторию движения защитника.
Недавно компании DeepMind удалось создать алгоритм, который способен обучаться играть в видеоигры. Алгоритм получает на входе содержимое экрана и учится интерпретировать эти данные в сложном процессе глубокого обучения. Это замечательное достижение, и компания Google приобрела DeepMind для разработки искусственного интеллекта. Алгоритм обучения получает данные, генерируемые компьютерной игрой, т. е. потоковые данные.
Потоковые данные могут принимать почти любую из перечисленных форм, однако у них имеется одно дополнительное свойство. Данные поступают в систему при возникновении некоторых событий, а не загружаются в хранилище данных большими массивами. И хотя формально они не являются отдельной разновидностью данных, мы выделяем их в особую категорию, потому что вам придется приспособить свой рабочий процесс для работы с потоковой информацией.
Примерами потоковых данных могут служить раздел «Что происходит?» в Твиттере, прямые трансляции спортивных и музыкальных мероприятий и данные биржевых котировок.

Скачать пример

1. Исходные данные
Предположим, нам нужно показать динамику темпов роста выручки:

Добавим в таблицу строку «подписи» — с суммой немного больше исходного значения. И строку «рост», где будет рассчитан прирост выручки к предыдущему периоду. В первой колонке проставляем #Н/Д для того, чтобы не значения этого столбца не выводились в диаграмме.

2. Вставляем гистограмму с накоплением
Выделяем таблицу с выручкой и новыми строками. Добавляем гистограмму с накоплением: меню Вставка → Гистограмма → Гистограмма с накоплением.

3. Рост и подписи превращаем в график с накоплением

Выделяем гистограмму мышкой, переходим в меню Конструктор → Изменить тип диаграммы → выбираем вид диаграммы Комбинированная, для данных «подписи» и «рост» выбираем тип диаграммы — график с накоплением. Благодаря этому график с малыми значениями «наложится» на график с большими значениями.

4. Добавляем подписи линии роста

Добавляем подписи для линии роста: выделяем на диаграмме линию роста, в меню переходим на вкладку Конструктор → Добавить элемент диаграммы → Метки данных → выбираем Слева.

Делаем линию роста на диаграмме невидимой: выделяем линию правой кнопкой мышки, нажимаем Формат ряда данных, назначаем тип линии = Нет линий.

5. Добавляем линии ряда данных, удаляем легенду

Выделяем столбцы гистограммы, переходим в меню Конструктор → Добавить элемент диаграммы → Линии → Линии ряда данных (если такая линия не появилась, проверьте, правильный ли у вас тип диаграммы — должна быть Гистограмма с накоплением).
Удаляем легенду.

6. Задаем тип стрелки

Задаем тип стрелки — выделяем линию правой кнопкой мышки → Формат линий ряда → задаем тип стрелки.
Готово! Подписи и эффекты добавлять по вкусу.