ТурбоХакатон на платформе codenrock.com
При создании статистической математической модели оборудования в системе предиктивной аналитики (далее – СПА) требуется провести чистку исходных архивных данных для обучающей модель выборки.
При валидации отбраковываются:
Недостоверные данные;
Нехарактерные выбросы значений, как во временных рядах, так и в корреляциях параметров.
Предполагается, что дополнительный инструмент по обработке исходных данных ускорит работу специалистов по разработке моделей подключаемого к СПА оборудования, что позволит значительно сократить время подключения нового оборудования к системе предиктивной аналитики.
Участникам предоставляются два неразмеченных АРХИВа данных, содержащий в себе период штатной эксплуатации агрегата, на котором предлагается отработать подходы к автоматизированной отбраковке данных для обучающих выборок.
В качестве примера правильной подготовки данных для модели, также предоставляются очищенные экспертом вышеобозначенные АРХИВы.
Для обеспечения чистоты математического подхода данные о физическом смысле сигналов – не передаются.
Данные