[VELODB.IO]
DATANOMIX.PRO // САЛЫСТЫРУ // DORIS vs STARROCKS

Apache Doris vs StarRocks: форк пен түпнұсқа

Лицензия, архитектура, hybrid search, lakehouse: ортақ тегі бар екі OLAP-жүйенің объективті салыстыруы.

Дайындаған:
Datanomix.pro
Оқу уақыты:
~14 мин

1. Ортақ шығу тегі: бәсекелеске айналған форк

StarRocks (бастапқы аты DorisDB) 2020 жылы шамасында CelerData компаниясымен Apache Doris-тен форкталған. Сол кезден бері екі жоба тәуелсіз дамуда.

Ортақ негіз: екеуі де — MPP-колоночтық OLAP-базалар, FE (Frontend) + BE (Backend) архитектурасымен, vectorized execution және MySQL-протоколды қолдаумен.

Форктан кейін жолдар ажырасты: StarRocks нақты workload-тардағы өнімділікке және CelerData арқылы коммерциализацияға бағытталды. Apache Doris — Apache Foundation қолшатыры астында экожүйені кеңейтуге: unified lakehouse, толық мәтіндік іздеу, vector search.

Бүгін екеуі де — жетілген, production-grade OLAP-жүйелер. Бірақ лицензия, мүмкіндіктер және стратегиядағы айырмашылықтар таңдауды принципиалды етеді.

2. Лицензия: Apache 2.0 vs Elastic License 2.0

Бұл техникалық салыстыруда жиі назардан тыс қалатын маңызды айырмашылық.

Apache DorisStarRocks
Apache License 2.0Elastic License 2.0 (ELv2)
Толық еркіндік: пайдалану, өзгерту, тарату, SaaSStarRocks-ты managed service ретінде ұсынуға тыйым
Бұлттық провайдерлер үшін ешқандай шектеу жоқБұлттық провайдерлер — тек CelerData-мен келісім арқылы
Apache Software Foundation кепілдегенCelerData шешімімен өзгеруі мүмкін

Enterprise үшін: Apache 2.0 — нөлдік лицензиялық тәуекел. ELv2 заңдық тексеруді талап етеді және StarRocks үстіне сервис құруда ұзақ мерзімді тәуекелдер бар.

VeloDB (коммерциялық Doris) — open-source-пен 100% үйлесімді, vendor lock-in жоқ.

3. Архитектура және сақтау

Екі жүйе де ортақ FE+BE архитектурасын мұра етті, бірақ форктан кейін әр түрлі дамыды.

МүмкіндікApache DorisStarRocks
Деректер модельдеріDuplicate, Unique, Aggregate KeyDuplicate, Primary, Aggregate
Real-time UPSERTDelete Bitmap (Unique Key) — тиімді merge-on-readPrimary Key UPDATE on merge арқылы
Толық мәтіндік іздеуInverted Index + BM25 scoringБазалық LIKE, BM25 жоқ
Vector SearchNative HNSW, IVFPQ — AI/RAG үшінNative vector search жоқ
Lakehouse федерацияMulti-Catalog: Iceberg, Hudi, Delta, Hive, JDBCExternal Catalog: Iceberg, Hudi, Delta, Hive, JDBC
Compute-storage separationОпциялық decoupled modeShared-data архитектурасы
Шардтарды авто-балансировкаАвтоматты балансировкаҚолмен/жартылай автоматты

Басты архитектуралық айырмашылық — Doris unified мүмкіндіктерге инвестициялайды (search + analytics + vector), StarRocks — таза OLAP-сценарийлерді оптимизациялайды.

4. Өнімділік: бенчмарктар

Екі қозғалтқыш та стандартты бенчмарктарда бәсекеге қабілетті өнімділік көрсетеді. Ортақ шығу тегі ұқсас engine internals дегенді білдіреді.

БенчмаркApache DorisStarRocksТүсініктеме
TPC-H (22 сұраныс)22/22 ✓22/22 ✓Нәтижелер 10–20% аралығында
TPC-DS (99 сұраныс)99/99 ✓Көпшілік сұраныстар ✓Doris барлық 99-ды өтеді
ClickBenchТоп-позицияларТоп-позицияларЕкеуі де көшбасшы, айырмашылық аз
SSB-FlatЖоғары жылдамдықЖоғары жылдамдықҰқсас нәтижелер

Негізгі қорытынды: форк ұқсас қозғалтқыштарды білдіреді. Дифференциация — мүмкіндіктерде, raw speed-те емес.

Дереккөздер: influxdata.com, tinybird.co, clickbench.com тәуелсіз бенчмарктары.

5. Unified Lakehouse vs OLAP Focus

Мұнда стратегиялар принципиалды түрде ажырасады. Doris бір платформамен 4–5 жүйені алмастыруға ұмтылады.

// МЫСАЛ: DORIS-ТА HYBRID SEARCH (OLAP + FULL-TEXT + VECTOR) SELECT doc_id, title, score, TOKENIZE(content, 'russian') AS tokens, L2_DISTANCE(embedding, [0.1, 0.3, ...]) AS dist FROM documents WHERE content MATCH 'аналитика реального времени' AND category_id IN (SELECT id FROM categories WHERE region = 'CentralAsia') ORDER BY score DESC, dist ASC LIMIT 20;

Apache Doris — Unified Platform

  • OLAP-аналитика ✓
  • Толық мәтіндік іздеу (Inverted Index, BM25) ✓ — Elasticsearch алмастырады
  • AI/RAG үшін Vector Search (HNSW, IVFPQ) ✓
  • Lakehouse-федерация (Multi-Catalog) ✓
  • CDC / Real-time ingest (Kafka, Flink, Stream Load) ✓

StarRocks — OLAP Engine

  • OLAP-аналитика ✓
  • Шектеулі іздеу (LIKE, BM25 жоқ)
  • Native vector search жоқ
  • Федерация үшін External Catalog ✓
  • Real-time ingest ✓

Қорытынды: Doris data stack-ті консолидациялауға ұмтылады. StarRocks OLAP-сұраныстар жылдамдығына фокусталады.

6. Экожүйе және community

Community масштабы даму жылдамдығына, құжаттама сапасына және мамандар қолжетімділігіне әсер етеді.

МетрикаApache DorisStarRocks
ҚорApache Software FoundationLinux Foundation
Контрибьюторлар900+350+
GitHub Stars12K+9K+
Production-деплойлар4000+ (банктер, телеком, финтех)Кең, бірақ жариялы деректер аз
Коммерциялық бэкерVeloDB + қоғамдастықCelerData (негізгі)
MySQL-протоколы✓ — кез келген BI-мен plug-and-play✓ — ұқсас үйлесімділік

Екі жоба да белсенді дамуда. Doris community масштабы мен enterprise-енгізулер санында алда.

7. Иелену құны (TCO)

Ұқсас MPP-архитектурада инфрақұрылымдық шығындар салыстырмалы. Негізгі айырмашылықтар — лицензиялау мен стратегиялық тәуекелдерде.

ЛицензияApache 2.0 — мәңгі тегін, шектеусіз. ELv2 — managed-сервистерге шектеу, CelerData-ға тәуелділік.
Коммерциялық қолдауVeloDB (enterprise Doris) vs CelerData (enterprise StarRocks). Екеуі де managed-шешімдер ұсынады.
ИнфрақұрылымҰқсас ресурстық талаптар — бірдей MPP-архитектура FE+BE.
Операциялық күрделілікСалыстырмалы: екі жүйе де FE+BE, мониторинг, backup талап етеді.
Стек консолидациясыDoris ES + OLAP + Vector DB алмастырады = 3–4 жүйеде үнемдеу. StarRocks — тек OLAP.
Ұзақ мерзімді тәуекелApache 2.0 — кепілденген еркіндік. ELv2 — CelerData шешімімен өзгеруі мүмкін.

8. StarRocks қашан жақсырақ болуы мүмкін

Әділеттілік үшін — StarRocks артықшылықтары бар сценарийлер:

  • Жалғыз міндетіңіз — OLAP-сұраныстар, толық мәтіндік іздеу немесе vector search қажет емес.
  • CelerData managed service қазірдің өзінде пайдаланасыз және экожүйе сізді қанағаттандырады.
  • StarRocks-тың нақты оптимизациялары сіздің workload-паттерніңізге дәл сәйкес келеді.

Бірақ: unified платформа қажет болса (search + OLAP + vector + lake) — Doris объективті түрде көбірек ұсынады.

Және: лицензиялық еркіндік маңызды болса — Apache 2.0 (Doris) ELv2-ден (StarRocks) қауіпсізірек.

Дереккөздер

FAQ

StarRocks — бұл Doris форкі ма?

Иә. StarRocks (бұрын DorisDB) ~2020 жылы Apache Doris-тен форкталған. Сол кезден бері жобалар тәуелсіз дамуда.

StarRocks-тың лицензиясы қандай?

Elastic License 2.0 (ELv2). Бұл StarRocks-ты CelerData-мен келісімсіз managed service ретінде ұсынуға шектеу қояды.

Кім жылдамырақ — Doris пе, StarRocks па?

Стандартты бенчмарктарда (TPC-H, ClickBench) нәтижелер 10–20% аралығында. Нақты өнімділік деректер моделі мен тюнингке байланысты.

StarRocks-та hybrid search аналогы бар ма?

Жоқ. StarRocks full-text search үшін inverted index-ті қолдамайды және native vector search жоқ. Гибридті сценарийлер үшін Doris unified шешім ұсынады.

Doris пен StarRocks-ты өз деректеріңізде салыстырғыңыз келе ме?

./САЛЫСТЫРУ_СҰРАУ.sh
© 2026 DATANOMIX.PRO — VELODB-НЫҢ ОРТАЛЫҚ АЗИЯДА ЭКСКЛЮЗИВТІК СЕРІКТЕСІ
VeloDB — Real-Time Analytics /БАСТЫ