Twitter опубликовал новый открытый проект AnomalyDetection, представляющий собой пакет на языке R для автоматического выявления аномалий в статистических наборах данных. Поддерживается определение различных типов аномалий: локальные и глобальные отклонения, положительные (например, всплески трафика) и отрицательные (например, снижение числа запросов) изменения. Код опубликован под лицензией GPLv3.

Например, пакет позволяет выявить отклонения от нормы в потоке информации, поступающей от системы мониторинга или от различных сенсоров, в том числе можно фиксировать активность, связанную с деятельностью ботов и спамеров, или оценивать изменения параметров работы после перехода на новую версию ПО. Кроме того, пакет можно использовать для отслеживания заслуживающих внимания изменений метрик в различных областях, связанных с изучением событий в экономике и политике, например, определять события, вызывающие особый резонанс в обсуждениях и прессе.



Источник: http://www.opennet.ru/opennews/art.shtml?num=41405