Описательная статистика – это термин, который используется в аналитике данных и представляет собой краткое описание значимых рассчитанных показателей определенной выборки данных. Чтобы на первом этапе понять главные закономерности анализируемого массива. В список классических показателей входит среднее значение, медиана, мода; меры изменчивости: дисперсия, максимальное/минимальное значение либо асимметрия. Проще говоря, описательная статистика помогает понять особенности того или иного набора данных.
Описательная статистика очень важна, иначе, было бы очень сложно представить на начальных этапах какие инструменты необходимо использовать в той или иной задаче. В последующем процессе анализа данные показатели будут служить для вас параметрами в будущих функциях и моделях.
CaseWare IDEA поможет выполнить данную задачу одним нажатием, причем расчет статистических показателей не только числовых массивов, но и дат, времени и даже текстовых данных. В таблице справа представлена информация, которую дает CaseWare IDEA на первом этапе обработки данных.
База данных, на основе которой программа рассчитала статистические показатели, содержит 41 млн. строк информации объемом в 42 Гб.
Разработчики пошли дальше, и не так давно было добавлено дополнение с подробной аналитикой на портал IDEA Lab. Это дополнение дает широкий обзор ваших данных. Еще больше описательной статистики и не только. Гистограммы распределений, корреляции, графики рассеивания для определения характера зависимости и даже предупреждения о рисках. Кроме этого, данное расширение является бесплатным для пользователей CaseWare IDEA. Автоматизируйтесь!
Плохо поставленная задача займет в трое больше времени, чем нужно. Хорошо поставленная — только вдвое. Любая поставленная задача будет выполнена в сроки с помощью CaseWare IDEA!