DBMS > Apache Impala vs. Blazegraph vs. Datastax Enterprise vs. Microsoft Azure Cosmos DB vs. Trino
System Properties Comparison Apache Impala vs. Blazegraph vs. Datastax Enterprise vs. Microsoft Azure Cosmos DB vs. Trino
Editorial information provided by DB-Engines | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Name | Apache Impala Xexclude from comparison | Blazegraph Xexclude from comparison | Datastax Enterprise Xexclude from comparison | Microsoft Azure Cosmos DB former name was Azure DocumentDB Xexclude from comparison | Trino Xexclude from comparison | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Amazon has acquired Blazegraph's domain and (probably) product. It is said that Amazon Neptune is based on Blazegraph. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Description | Analytic DBMS for Hadoop | High-performance graph database supporting Semantic Web (RDF/SPARQL) and Graph Database (tinkerpop3, blueprints, vertex-centric) APIs with scale-out and High Availability. | DataStax Enterprise (DSE) is the always-on, scalable data platform built on Apache Cassandra and designed for hybrid Cloud. DSE integrates graph, search, analytics, administration, developer tooling, and monitoring into a unified platform. | Globally distributed, horizontally scalable, multi-model database service | Fast distributed SQL query engine for big data analytics. Forked from Presto and originally named PrestoSQL | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Primary database model | Relational DBMS | Graph DBMS RDF store | Wide column store | Document store Graph DBMS Key-value store Wide column store | Relational DBMS | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Secondary database models | Document store | Document store Graph DBMS Spatial DBMS Search engine Vector DBMS | Spatial DBMS | Document store Key-value store Spatial DBMS Search engine Time Series DBMS Wide column store | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Website | impala.apache.org | blazegraph.com | www.datastax.com/products/datastax-enterprise | azure.microsoft.com/services/cosmos-db | trino.io | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Technical documentation | impala.apache.org/impala-docs.html | wiki.blazegraph.com | docs.datastax.com | learn.microsoft.com/azure/cosmos-db | trino.io/broadcast trino.io/docs/current | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Social network pages | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Developer | Apache Software Foundation Apache top-level project, originally developed by Cloudera | Blazegraph | DataStax | Microsoft | Trino Software Foundation | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Initial release | 2013 | 2006 | 2011 | 2014 | 2012 2020 rebranded from PrestoSQL | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Current release | 4.1.0, June 2022 | 2.1.5, March 2019 | 6.8, April 2020 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
License Commercial or Open Source | Open Source Apache Version 2 | Open Source extended commercial license available | commercial | commercial | Open Source Apache Version 2.0 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Cloud-based only Only available as a cloud service | no | no | no | yes | no | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBaaS offerings (sponsored links) Database as a Service Providers of DBaaS offerings, please contact us to be listed. | Datastax Astra DB: Astra DB simplifies cloud-native Cassandra application development for your apps, microservices and functions. Deploy in minutes on AWS, Google Cloud, Azure, and have it managed for you by the experts, with serverless, pay-as-you-go pricing. | Starburst Galaxy offers a feature-rich user interface to connect all your data sources, manage your Trino clusters, and query your data. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Implementation language | C++ | Java | Java | Java | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Server operating systems | Linux | Linux OS X Windows | Linux OS X | hosted | Linux macOS for devlopment | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Data scheme | yes | schema-free | schema-free | schema-free | yes | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Typing predefined data types such as float or date | yes | yes RDF literal types | yes | yes JSON types | yes | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
XML support Some form of processing data in XML format, e.g. support for XML data structures, and/or support for XPath, XQuery or XSLT. | no | no | no | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Secondary indexes | yes | yes | yes | yes All properties auto-indexed by default | depending on connected data-source | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
SQL Support of SQL | SQL-like DML and DDL statements | SPARQL is used as query language | SQL-like DML and DDL statements (CQL); Spark SQL | SQL-like query language | yes | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
APIs and other access methods | JDBC ODBC | Java API RESTful HTTP API SPARQL QUERY SPARQL UPDATE TinkerPop 3 | Proprietary protocol CQL (Cassandra Query Language) TinkerPop Gremlin with DSE Graph | DocumentDB API Graph API (Gremlin) MongoDB API RESTful HTTP API Table API | JDBC RESTful HTTP API Trino CLI | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Supported programming languages | All languages supporting JDBC/ODBC | .Net C C++ Java JavaScript PHP Python Ruby | C C# C++ Java JavaScript (Node.js) PHP Python Ruby | .Net C# Java JavaScript JavaScript (Node.js) MongoDB client drivers written for various programming languages Python | Go Java JavaScript (Node.js) Python R Ruby | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Server-side scripts Stored procedures | yes user defined functions and integration of map-reduce | yes | no | JavaScript | yes, depending on connected data-source | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Triggers | no | no | yes | JavaScript | no | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Partitioning methods Methods for storing different data on different nodes | Sharding | Sharding | Sharding no "single point of failure" | Sharding Implicit feature of the cloud service | depending on connected data-source | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Replication methods Methods for redundantly storing data on multiple nodes | selectable replication factor | yes | configurable replication factor, datacenter aware, advanced replication for edge computing | yes Implicit feature of the cloud service | depending on connected data-source | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
MapReduce Offers an API for user-defined Map/Reduce methods | yes query execution via MapReduce | no | yes | with Hadoop integration Integration with Hadoop/HDInsight on Azure* | no | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Consistency concepts Methods to ensure consistency in a distributed system | Eventual Consistency | Immediate Consistency or Eventual Consistency depending on configuration | Immediate Consistency Tunable Consistency consistency level can be individually decided with each write operation | Bounded Staleness Consistent Prefix Eventual Consistency Immediate Consistency Consistency level configurable on request level Session Consistency | depending on connected data-source | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Foreign keys Referential integrity | no | yes Relationships in Graphs | no | no | no | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Transaction concepts Support to ensure data integrity after non-atomic manipulations of data | no | ACID | no Atomicity and isolation are supported for single operations | Multi-item ACID transactions with snapshot isolation within a partition | depending on connected data-source | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Concurrency Support for concurrent manipulation of data | yes | yes | yes | yes | yes | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Durability Support for making data persistent | yes | yes | yes | yes | depending on connected data-source | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
In-memory capabilities Is there an option to define some or all structures to be held in-memory only. | no | yes | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
User concepts Access control | Access rights for users, groups and roles based on Apache Sentry and Kerberos | Security and Authentication via Web Application Container (Tomcat, Jetty) | Access rights for users can be defined per object | Access rights can be defined down to the item level | SQL standard access control | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
More information provided by the system vendor | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Apache Impala | Blazegraph | Datastax Enterprise | Microsoft Azure Cosmos DB former name was Azure DocumentDB | Trino | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Specific characteristics | DataStax Enterprise is scale-out data infrastructure for enterprises that need to... » more | Trino is the fastest open source, massively parallel processing SQL query engine... » more | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Competitive advantages | Supporting the following application requirements: Zero downtime - Built on Apache... » more | High performance analtyics and data processing of very large data sets Powerful ANSI... » more | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Typical application scenarios | Applications that must be massively and linearly scalable with 100% uptime and able... » more | Performant analytics query engine for data warehouses, data lakes, and data lakehouses... » more | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Key customers | Capital One, Cisco, Comcast, eBay, McDonald's, Microsoft, Safeway, Sony, UBS, and... » more | Trino is widely adopted across the globe as freely-available open source software.... » more | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Market metrics | Among the Forbes 100 Most Innovative Companies, DataStax is trusted by 5 of the top... » more | 33000+ commits in GitHub 8200+ stargazers in GitHub 1200+ pull requests merged in... » more | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Licensing and pricing models | Annual subscription » more | Trino is an open source project and usage is therefore free. Commercial offerings... » more | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
News | Big names round out the Trino Fest 2024 lineup 59: Querying Trino with Java and jOOQ A sneak peek of Trino Fest 2024 Time travel in Delta Lake connector 58: Understanding your users with Trino and Mitzu | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
We invite representatives of system vendors to contact us for updating and extending the system information, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Related products and services | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3rd parties | CData: Connect to Big Data & NoSQL through standard Drivers. » more | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
We invite representatives of vendors of related products to contact us for presenting information about their offerings here. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
More resources | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Apache Impala | Blazegraph | Datastax Enterprise | Microsoft Azure Cosmos DB former name was Azure DocumentDB | Trino | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Recent citations in the news | Apache Impala 4 Supports Operator Multi-Threading Apache Impala becomes Top-Level Project Cloudera Bringing Impala to AWS Cloud Apache Doris just 'graduated': Why care about this SQL data warehouse Hudi: Uber Engineering’s Incremental Processing Framework on Apache Hadoop provided by Google News | Back to the future: Does graph database success hang on query language? Harnessing GPUs Delivers a Big Speedup for Graph Analytics This AI Paper Introduces A Comprehensive RDF Dataset With Over 26 Billion Triples Covering Scholarly Data Across All Scientific Disciplines Representation Learning on RDF* and LPG Knowledge Graphs Faster with GPUs: 5 turbocharged databases provided by Google News | DataStax and LlamaIndex Partner to Make Building RAG Applications Easier than Ever for GenAI Developers DataStax Introduces Enhanced RAG Capabilities Through Astra DB and NVIDIA Tech DataStax Rolls Out Vector Search for Astra DB to Support Gen AI DataStax adds vector search to boost support for generative AI workloads DataStax goes vector searching with Astra DB – Blocks and Files provided by Google News | Start your AI journey with Microsoft Azure Cosmos DB—compete for $10K Public preview: Change partition key of a container in Azure Cosmos DB (NoSQL API) | Azure updates Evaluating Performance: CosmosDB vs. Azure SQL Azure Synapse Link for Cosmos DB: New Analytics Capabilities How to Migrate Azure Cosmos DB Databases | by Arwin Lashawn provided by Google News | The Perfect AI Storage: Trino From Facebook And Iceberg From Netflix? Starburst Brings Dataframes Into Trino Platform Query big data with resilience using Trino in Amazon EMR with Amazon EC2 Spot Instances for less cost | Amazon ... Trino: The Open-source Data Query Engine That Split from Facebook A look at Presto, Trino SQL query engines provided by Google News |
Share this page