Представлен Apache Flume 1.3.0, второй стабильный релиз, готовый для промышленного внедрения, выпущенный за время существования проекта. Apache Flume позволяет организовать работу распределённого и отказоустойчивого сервиса, гарантирующего сохранение данных и обеспечивающего эффективный сбор большого объёма логов, его агрегирование и перемещение в хранилище. Код системы написан на языке Java и поставляется под лицензией Apache.

Архитектура Apache Flume имеет модульную структуру и основана на манипулировании потоками данных между обработчиками (модуль приёма направляет данные в модуль очереди передачи, из которой данные извлекаются модулями фильтрации, сохранения или передачи по цепочке). Система предусматривает возможность использования различных механизмов для достижения гарантированной доставки данных и восстановления в случае выявления сбоев. Apache Flume отличается использованием простой и расширяемой модели данных, что делает продукт интересным решением для построения таких систем, как приложения для online-аналитики.

В новой версии добавлено несколько новых источников данных: HTTP Post (сбор данных через инициирование HTTP POST-запросов), Spool Directory (забираются файлы, сохранённые в директорию) и Multi-port Syslog (приём логов от нескольких демонов syslog). Обеспечена поддержка шифрования каналов передачи файлов. Добавлен модуль для извлечения данных из потока на основании правил, оформленных в форме регулярных выражений.

Источник: http://www.opennet.ru/opennews/art.shtml?num=35505