Описательная статистика – это термин, который используется в аналитике данных и представляет собой краткое описание значимых рассчитанных показателей определенной выборки данных. Чтобы на первом этапе понять главные закономерности анализируемого массива. В список классических показателей входит среднее значение, медиана, мода; меры изменчивости: дисперсия, максимальное/минимальное значение либо асимметрия. Проще говоря, описательная статистика помогает понять особенности того или иного набора данных.
Описательная статистика очень важна, иначе, было бы очень сложно представить на начальных этапах какие инструменты необходимо использовать в той или иной задаче. В последующем процессе анализа данные показатели будут служить для вас параметрами в будущих функциях и моделях.
Caseware IDEA поможет выполнить данную задачу одним нажатием, причем расчет статистических показателей не только числовых массивов, но и дат, времени и даже текстовых данных. В таблице справа представлена информация, которую дает Caseware IDEA на первом этапе обработки данных.
База данных, на основе которой программа рассчитала статистические показатели, содержит 41 млн. строк информации объемом в 42 Гб.
Также, в рамках дальнейшего развития был добавлен модуль с подробной аналитикой на портал IDEA Lab. Это дополнение предоставляет широкий обзор ваших данных. Ещё больше описательной статистики и не только. Гистограммы распределений, корреляции, диаграммы рассеяния для определения характера зависимости и даже предупреждения о рисках. Кроме того, это расширение является бесплатным для пользователей Caseware IDEA . Автоматизируйтесь!
Плохо поставленная задача займет в трое больше времени, чем нужно. Хорошо поставленная — только вдвое. Любая поставленная задача будет выполнена в сроки с помощью Caseware IDEA.