Фонд Apache сообщил о придании Apache Drill статуса первичного проекта Apache. Перевод в разряд первичных проектов произведён после двух лет проверки в инкубаторе Apache способности следования принципам разработки и управления, принятым в сообществе Apache и основанным на идеях меритократии. Отныне Apache Drill признан готовым для самостоятельного существования, не требующего дополнительного надзора. Интерес к разработке Apache Drill уже проявили такие компании, как MapR, LinkedIn, Hortonworks, Pentaho и Cisco.

Apache Drill представляет собой движок для организации выполнения SQL-запросов над полуструктурированными данными, хранящимися в NoSQL-хранилищах. Особенностью движка является независимость от схемы хранения данных, что позволяет организовать анализ данных в различных хранилищах без предварительного определения их структуры (schema-free). В частности, Apache Drill даёт возможность выполнять интерактивные запросы на языке ANSI SQL для сложных или постоянно изменяющихся структур данных, включая форматы JSON, ProtoBuf, XML, AVRO и Parquet, а также таблицы HBase, без необходимости задания схемы хранения.

Структура данных в хранилище распознаётся на лету и преобразуется во внутреннюю JSON-подобную модель данных, которая предоставляет информацию о структуру БД при выполнении SQL-запросов. Для обработки сложных и вложенных типов данных в Apache Drill предусмотрен ряд расширений SQL. В качестве одного из практических применений Apache Drill называется возможность интеграции завязанных на SQL систем бизнес-аналитики и хранилищ больших объёмов данных на основе Apache Hadoop или MongoDB, а также сопряжение существующих продуктов с Hadoop через штатные интерфейсы JDBC/ODBC. Код проекта написан на языке Java.

Источник: http://www.opennet.ru/opennews/art.shtml?num=41177