Бизнес аналитика больших данных для реальной жизни

Smart Data Lab популяризирует инструменты data science с целью развития бизнес аналитики в компаниях.

Мы обучаем аналитиков самостоятельно, гибко и надёжно обрабатывать большие массивы данных с помощью кода.

Мы помогаем компаниям превращать накопленные массивы данных в рентабельный актив.

Основой нашей технологии является R – специализированный язык программирования для обработки данных и визуализации.

R как первый выбор в data science

Работа с большими данными – это не экзотика из жизни крупнейших компаний, а неизбежность в рядовых аналитических задачах.

Ни в одной компании не удастся  возложить всю работу с большими данными на айтишников, а data scientists до сих пор не хватает даже для крупного бизнеса. Современные бизнес аналитики должны уметь обрабатывать большие данные “в режиме самообслуживания”.

В мире активно развиваются пользовательские решения для data analytics, первым выбором из которых для не-айтишников является R.

Это прикладной язык программирования, предназначенный чисто для статистических задач и визуализации. У него простой синтаксис и развитая экосистема.

R бурно растет в мире и входит в лучшие программы MBA.

Про R подробнее

Наше предложение

ДЛЯ БИЗНЕСА

Мы обучим ваших аналитиков бизнес анализу в R и поможем реализовать пилотный аналитический проект.

Для аналитических задач, требующих более сложного кодирования, мы напишем скрипты в R – самостоятельные, или интегрированные в ERP или другие системы.

Подробнее про консалтинг

ДЛЯ ВСЕХ

В нашем курсе «Основы бизнес анализа в R» обучение программированию максимально «экселизировано». Ставя навыки анализа больших данных, мы делаем акцент на знакомым всем типах трансформации таблиц.

Помимо программирования, на этом курсе слушатели осваивают научные принципы работы с большими данными.

Подробнее про курс

Кейсы

СОСЕДСТВО ТОВАРОВ В ЧЕКЕ

 

лупа

Описание: У аптечной сети стоит задача развить продажи некоего сопутствующего лекарства. Нужно проанализировать, с какими основными лекарствами потребитель покупает данный продукт чаще всего.

В распоряжении аналитиков – массив всех чеков всех аптек за год, несколько десятков миллионов строк.

Аналитик – экселист: Рассчитаны общие пропорции продаж сопутствующего и основных препаратов по сводным годовым данным. Выводы о частоте покупки данного препарата отдельно или в паре с теми или иными лекарствами – умозрительные.

Современный аналитик: Написан R скрипт, выбирающий из каждого чека комбинации лекарств с данным препаратом. Комбинации ранжированы по частоте, рассчитана вероятность покупки сопутствующего препарата отдельно или в паре с тем ими иным лекарством. Выявлен ряд факторов, повышающих вероятность продажи данного лекарства вместе с основным (география, тип аптеки, сезон и т.д.). 

АНАЛИЗ РОЗНИЧНЫХ ПРОДАЖ

 

блокнот с ручкой

Описание: Производитель продуктов питания получает отчёты розничных сетей о продажах.

Данные отчёты имеют сотни тысяч строк и разнородную номенклатуру названий СКЮ, брендов, поставщиков и категорий.

Аналитик – экселист: Потребовалась помощь IT в приведении данных к единой номенклатуре. Возникло много ручной работы по совмещению вновь появившихся СКЮ и поставщиков
Не хватило времени на анализ, поскольку уже поступили отчёты за следующий период.

Современный аналитик: Написан R скрипт, чистящий номенклатуру. Новые позиции быстро найдены и добавлены в мэппинг. Сэкономленное на чистке данных время использовано на глубинную аналитику.

АНАЛИЗ ПОВЕДЕНИЯ ДЕРЖАТЕЛЕЙ КРЕДИТНЫХ КАРТ

нормальное распределение

Описание: Банк за последние пять лет выпустил десятки тысяч кредитных карт. Есть запрос на выявление образцов потребительского поведения, потенциально ведущего к снижению платежеспособности.

В распоряжении аналитиков – база всех транзакциях по картам за пять лет, информация о клиентах, миллионы строк.

Аналитик – экселист: Анализ сводной информации позволил выявить средний размер просроченной заложенности на проблемного заёмщика, и проанализировать вероятности дефолта по основным социодемографическим признакам. 

Современный аналитик: Написан R скрипт, обрабатывающий массив транзакций по картам лиц, допускавших просрочки. Выявлены и ранжированы признаки, предшествующие неплатёжеспособности, такие как снятия наличных с кредитных карт, крупные траты на курортах, в ночных клубах, алкогольных магазинах и т.п.