Для правильного принятия бизнес-решений необходимо владеть наиболее полной и подробной информацией о состоянии дел в компании. Но нередко такая информация ограничена годовыми да квартальными отчётами.
Для эффективного анализа на предприятиях часто внедряют системы бизнес-аналитики (англ. business intelligence, далее - BI-системы). Сегодня мы хотим поделиться несколькими советами, которые могут помочь при создании BI-системы в вашей компании.
Никогда не стоит надеяться на то, что фиксированных графиков и отчётов будет достаточно.
Старайтесь анализировать «сырые» данные. Не делайте предварительной агрегации. Помните: как только вы делаете агрегацию данных, вы теряете информацию.
Помните, что вы - не первый, кто создаёт BI-систему. И для многих задач уже существуют готовые решения. Потому большая часть разработки может просто сводиться к сбору данных и конфигурированию программ анализа.
Системой, которую вы проектируете, будут пользоваться обычные менеджеры, у которых слова «первая производная по времени» могут вызвать нестерпимую изжогу. Интерфейс к данным должен быть предельно простым и однозначным. Именно поэтому не стоит заново изобретать интерфейс. Лучше посмотреть, что уже придумано до вас.
Проектирование, разработка и внедрение BI-системы - процесс довольно долгий и сложный. Это тот самый случай, когда 9 женщин не смогут родить ребёнка за один месяц.
Если вы хотите начать собирать данные о поведении пользователей, то делайте это асинхронно. Помните, что сбор данных об объекте надо проводить без заметного вмешательства в поведение этого объекта.
Обязательно нарисуйте для себя схему перемещения данных в системе. Следите, чтобы не возникало циклов (обратных связей).
Не допускайте, чтобы исследуемые объекты получали информацию из BI-системы.
При внедрении BI-системы необходимо проверять поступающие данные, причём делать это нужно очень тщательно. Например, если вы получаете параметры пользователей системы, обязательно проверьте распределение дат регистрации, дней рождения и т.д.
Часто при добавлении новых данных встречается ситуация, когда значение столбца во всех строках одинаково. Практически всегда причиной является человеческий фактор - разработчик просто забыл про этот столбец.
Когда вы смотрите, какие данные нужно импортировать в систему, помните, что лишних данных не бывает. Бывают повторы данных. И вот к повторам нужно отнестись с подозрением. Лучше взять дополнительные данные и убедиться, что у вас есть те же самые значения, чем заранее отказаться от повторов. Это помогает выявить ошибки в системах.
Сравнивая и сопоставляя данные из разных источников, не гонитесь за 100% соответствием. Если вы достигли 95% совпадения, этого, скорее всего, уже достаточно.
Очень часто расхождение данных вызвано объективными причинами, например, такими как рассинхронизация времени.
Эти советы не универсальны, на каждый из них можно найти исключение. Не нужно их воспринимать как абсолютную истину.
По материалам сайта Хабр.
cont📧ct © 123lab.ru d💰nate 2006-2024 хостинг🌐сайтов