Исследователи MIT создали инструмент для предсказания будущего

802

Исследователи разрабатывают удобный интерфейс, который помогает неспециалистам делать прогнозы, используя данные, собранные за определенный период времени.

Если кто-то пытается предсказать завтрашнюю погоду, спрогнозировать будущие цены на акции, определить упущенные возможности для продаж в розничной торговле или оценить риск развития заболевания у пациента, ему, вероятно, потребуется интерпретировать данные временного ряда, которые представляют собой набор записанных со временем данных.

Создание прогнозов с использованием данных временных рядов обычно требует нескольких этапов обработки данных и использования сложных алгоритмов машинного обучения, которые имеют такую ​​сложную кривую обучения, что не всегда доступны для неспециалистов.

Чтобы сделать эти мощные инструменты более удобными для пользователя, исследователи Массачусетского технологического института разработали систему, которая напрямую интегрирует функции прогнозирования поверх существующей базы данных временных рядов.

Их упрощенный интерфейс, который они называют tspDB (база данных прогнозов временных рядов), выполняет все сложное моделирование за кулисами, поэтому неспециалист может легко сгенерировать нужный прогноз всего за несколько секунд.

Новая система точнее и эффективнее современных методов глубокого обучения при выполнении двух задач: предсказание будущих значений и заполнение отсутствующих точек данных.

Одна из причин успеха системы tspDB заключается в том, что она включает в себя новый алгоритм прогнозирования временных рядов.

Этот алгоритм особенно эффективен при прогнозировании многомерных данных временных рядов, то есть данных, содержащих более одной переменной, зависящей от времени. В базе данных погоды, например, температура, точка росы и облачность зависят от своих прошлых значений.

Алгоритм также оценивает волатильность многомерного временного ряда, чтобы предоставить пользователю уровень достоверности его прогнозов.

«Несмотря на то, что данные временных рядов становятся все более и более сложными, этот алгоритм может эффективно фиксировать любую структуру временных рядов. Похоже, мы нашли подходящую линзу, чтобы взглянуть на сложность моделей данных временных рядов», — говорят ученые.

Когда пользователь устанавливает tspDB поверх существующей базы данных, он может выполнить прогнозный запрос всего несколькими нажатиями клавиш примерно за 0,9 миллисекунды по сравнению с 0,5 миллисекундами для стандартного поискового запроса.

Доверительные интервалы также предназначены для того, чтобы помочь неспециалистам принимать более обоснованные решения, учитывая степень неопределенности прогнозов при принятии решений. Например, система может позволить неспециалисту прогнозировать будущие цены на акции с высокой точностью всего за несколько минут, даже если набор данных временного ряда содержит пропущенные значения.

Исследование будет представлено на конференции ACM SIGMETRICS. arXiv:2006.13448

Смотрите также:
Подписаться
Уведомление о
guest
0 Комментарий
Встроенные отзывы
Посмотреть все комментарии