Apache Drill получил статус первичного проекта Apache
Apache Drill представляет собой движок для организации выполнения SQL-запросов над полуструктурированными данными, хранящимися в NoSQL-хранилищах. Особенностью движка является независимость от схемы хранения данных, что позволяет организовать анализ данных в различных хранилищах без предварительного определения их структуры (schema-free). В частности, Apache Drill даёт возможность выполнять интерактивные запросы на языке ANSI SQL для сложных или постоянно изменяющихся структур данных, включая форматы JSON, ProtoBuf, XML, AVRO и Parquet, а также таблицы HBase, без необходимости задания схемы хранения.
Структура данных в хранилище распознаётся на лету и преобразуется во внутреннюю JSON-подобную модель данных, которая предоставляет информацию о структуру БД при выполнении SQL-запросов. Для обработки сложных и вложенных типов данных в Apache Drill предусмотрен ряд расширений SQL. В качестве одного из практических применений Apache Drill называется возможность интеграции завязанных на SQL систем бизнес-аналитики и хранилищ больших объёмов данных на основе Apache Hadoop или MongoDB, а также сопряжение существующих продуктов с Hadoop через штатные интерфейсы JDBC/ODBC. Код проекта написан на языке Java.
Источник: http://www.opennet.ru/opennews/art.shtml?num=41177
|
0 | Tweet | Нравится |
|