[VELODB.IO]
DATANOMIX.PRO // СРАВНЕНИЕ // DORIS vs STARROCKS

Apache Doris vs StarRocks: форк против оригинала

Лицензия, архитектура, hybrid search, lakehouse: объективное сравнение двух OLAP-систем с общим происхождением.

Подготовлено:
Datanomix.pro
Время чтения:
~14 мин

1. Общее происхождение: форк, который стал конкурентом

StarRocks (изначально DorisDB) был форкнут из Apache Doris примерно в 2020 году компанией CelerData. С тех пор оба проекта развиваются независимо, принимая разные архитектурные решения.

Общий фундамент: обе системы — MPP-колоночные OLAP-базы с архитектурой FE (Frontend) + BE (Backend), vectorized execution и поддержкой MySQL-протокола.

После форка пути разошлись: StarRocks сфокусировался на производительности в специфических workloads и коммерциализации через CelerData. Apache Doris — на расширении экосистемы под зонтиком Apache Foundation: unified lakehouse, полнотекстовый поиск, vector search.

Сегодня оба — зрелые, production-grade OLAP-системы. Но различия в лицензии, возможностях и стратегии делают выбор между ними принципиальным.

2. Лицензия: Apache 2.0 vs Elastic License 2.0

Это ключевое различие, которое часто упускают при техническом сравнении.

Apache DorisStarRocks
Apache License 2.0Elastic License 2.0 (ELv2)
Полная свобода: использование, модификация, дистрибуция, SaaSЗапрет на предоставление StarRocks как managed service
Никаких ограничений для облачных провайдеровОблачные провайдеры — только через соглашение с CelerData
Гарантирована Apache Software FoundationМожет измениться по решению CelerData

Для enterprise: Apache 2.0 — нулевой лицензионный риск. ELv2 требует юридической проверки и несёт долгосрочные риски при построении сервисов поверх StarRocks.

VeloDB (коммерческий Doris) — 100% совместим с open-source, без vendor lock-in.

3. Архитектура и хранение

Обе системы унаследовали общую архитектуру FE+BE, но после форка развивались по-разному.

ВозможностьApache DorisStarRocks
Модели данныхDuplicate, Unique, Aggregate KeyDuplicate, Primary, Aggregate
Real-time UPSERTDelete Bitmap (Unique Key) — эффективный merge-on-readPrimary Key с UPDATE on merge
Полнотекстовый поискInverted Index + BM25 scoringБазовый LIKE, нет BM25
Vector SearchNative HNSW, IVFPQ для AI/RAGНет native vector search
Lakehouse федерацияMulti-Catalog: Iceberg, Hudi, Delta, Hive, JDBCExternal Catalog: Iceberg, Hudi, Delta, Hive, JDBC
Compute-storage separationОпциональный decoupled modeShared-data архитектура
Auto-balance шардовАвтоматическая балансировкаРучная/полуавтоматическая

Главное архитектурное различие — Doris инвестирует в unified возможности (search + analytics + vector), StarRocks — в оптимизацию чистых OLAP-сценариев.

4. Производительность: бенчмарки

Оба движка показывают конкурентную производительность на стандартных бенчмарках. Общее происхождение означает похожие engine internals.

БенчмаркApache DorisStarRocksКомментарий
TPC-H (22 запроса)22/22 ✓22/22 ✓Результаты в пределах 10–20%
TPC-DS (99 запросов)99/99 ✓Большинство запросов ✓Doris проходит все 99
ClickBenchТоп-позицииТоп-позицииОба в лидерах, разница минимальна
SSB-FlatВысокая скоростьВысокая скоростьПохожие результаты

Ключевой вывод: форк означает похожие движки. Дифференциация — в возможностях, а не в raw speed. Реальная производительность зависит от модели данных и тюнинга.

Источники: независимые бенчмарки influxdata.com, tinybird.co, clickbench.com.

5. Unified Lakehouse vs OLAP Focus

Здесь стратегии расходятся принципиально. Doris стремится заменить 4–5 систем одной платформой.

// ПРИМЕР: HYBRID SEARCH В DORIS (OLAP + FULL-TEXT + VECTOR) SELECT doc_id, title, score, TOKENIZE(content, 'russian') AS tokens, L2_DISTANCE(embedding, [0.1, 0.3, ...]) AS dist FROM documents WHERE content MATCH 'аналитика реального времени' AND category_id IN (SELECT id FROM categories WHERE region = 'CentralAsia') ORDER BY score DESC, dist ASC LIMIT 20;

Apache Doris — Unified Platform

  • OLAP-аналитика ✓
  • Полнотекстовый поиск (Inverted Index, BM25) ✓ — замена Elasticsearch
  • Vector Search для AI/RAG (HNSW, IVFPQ) ✓
  • Lakehouse-федерация (Multi-Catalog) ✓
  • CDC / Real-time ingest (Kafka, Flink, Stream Load) ✓

StarRocks — OLAP Engine

  • OLAP-аналитика ✓
  • Ограниченный поиск (LIKE, нет BM25)
  • Нет native vector search
  • External Catalog для федерации ✓
  • Real-time ingest ✓

Итог: Doris стремится консолидировать data stack. StarRocks фокусируется на скорости OLAP-запросов.

6. Экосистема и community

Масштаб community влияет на скорость развития, качество документации и доступность специалистов.

МетрикаApache DorisStarRocks
ФондApache Software FoundationLinux Foundation
Контрибьюторы900+350+
GitHub Stars12K+9K+
Production-деплои4000+ (банки, телеком, финтех)Широкое, но меньше публичных данных
Коммерческий бэкерVeloDB + сообществоCelerData (основной)
MySQL-протокол✓ — plug-and-play с любым BI✓ — аналогичная совместимость

Оба проекта активно развиваются с регулярными релизами. Doris выигрывает в масштабе community и количестве enterprise-внедрений.

7. Стоимость владения (TCO)

При схожей MPP-архитектуре инфраструктурные затраты сопоставимы. Ключевые различия — в лицензировании и стратегических рисках.

ЛицензияApache 2.0 — бесплатна навсегда, без ограничений. ELv2 — ограничения для managed-сервисов, зависимость от CelerData.
Коммерческая поддержкаVeloDB (enterprise Doris) vs CelerData (enterprise StarRocks). Оба предлагают managed-решения.
ИнфраструктураСхожие ресурсные требования — одинаковая MPP-архитектура FE+BE.
Операционная сложностьСопоставимая: обе системы требуют FE+BE, мониторинг, backup.
Консолидация стекаDoris заменяет ES + OLAP + Vector DB = экономия на 3–4 системах. StarRocks — только OLAP.
Долгосрочный рискApache 2.0 — гарантированная свобода. ELv2 — может измениться по решению CelerData.

8. Когда StarRocks может быть лучше

Справедливости ради — у StarRocks есть сценарии, где он может быть предпочтительнее:

  • Если ваша единственная задача — OLAP-запросы, и вам не нужен полнотекстовый поиск или vector search.
  • Если вы уже используете CelerData managed service и экосистема устраивает.
  • Если специфические оптимизации StarRocks точно совпадают с вашим workload-паттерном.

Но: если нужна unified платформа (search + OLAP + vector + lake) — Doris объективно предлагает больше.

И: если лицензионная свобода критична — Apache 2.0 (Doris) безопаснее, чем ELv2 (StarRocks).

Источники

FAQ

StarRocks — это форк Doris?

Да. StarRocks (ранее DorisDB) был форкнут из Apache Doris ~2020 году. С тех пор проекты развиваются независимо, принимая разные архитектурные решения.

Какая лицензия у StarRocks?

Elastic License 2.0 (ELv2). Это означает ограничения на предоставление StarRocks как managed service без соглашения с CelerData.

Кто быстрее — Doris или StarRocks?

На стандартных бенчмарках (TPC-H, ClickBench) результаты в пределах 10–20%. Реальная производительность зависит от модели данных и тюнинга, а не от выбора движка.

Есть ли у StarRocks аналог hybrid search?

Нет. StarRocks не поддерживает inverted index для full-text search и не имеет native vector search. Для гибридных сценариев (поиск + аналитика) Doris предлагает unified решение.

Хотите сравнить Doris и StarRocks на ваших данных?

./ЗАПРОСИТЬ_СРАВНЕНИЕ.sh
© 2026 DATANOMIX.PRO — ЭКСКЛЮЗИВНЫЙ ПАРТНЁР VELODB В ЦЕНТРАЛЬНОЙ АЗИИ
VeloDB — Real-Time Analytics /ГЛАВНАЯ