1. Ортақ шығу тегі: бәсекелеске айналған форк
StarRocks (бастапқы аты DorisDB) 2020 жылы шамасында CelerData компаниясымен Apache Doris-тен форкталған. Сол кезден бері екі жоба тәуелсіз дамуда.
Ортақ негіз: екеуі де — MPP-колоночтық OLAP-базалар, FE (Frontend) + BE (Backend) архитектурасымен, vectorized execution және MySQL-протоколды қолдаумен.
Форктан кейін жолдар ажырасты: StarRocks нақты workload-тардағы өнімділікке және CelerData арқылы коммерциализацияға бағытталды. Apache Doris — Apache Foundation қолшатыры астында экожүйені кеңейтуге: unified lakehouse, толық мәтіндік іздеу, vector search.
Бүгін екеуі де — жетілген, production-grade OLAP-жүйелер. Бірақ лицензия, мүмкіндіктер және стратегиядағы айырмашылықтар таңдауды принципиалды етеді.
2. Лицензия: Apache 2.0 vs Elastic License 2.0
Бұл техникалық салыстыруда жиі назардан тыс қалатын маңызды айырмашылық.
| Apache Doris | StarRocks |
|---|---|
| Apache License 2.0 | Elastic License 2.0 (ELv2) |
| Толық еркіндік: пайдалану, өзгерту, тарату, SaaS | StarRocks-ты managed service ретінде ұсынуға тыйым |
| Бұлттық провайдерлер үшін ешқандай шектеу жоқ | Бұлттық провайдерлер — тек CelerData-мен келісім арқылы |
| Apache Software Foundation кепілдеген | CelerData шешімімен өзгеруі мүмкін |
Enterprise үшін: Apache 2.0 — нөлдік лицензиялық тәуекел. ELv2 заңдық тексеруді талап етеді және StarRocks үстіне сервис құруда ұзақ мерзімді тәуекелдер бар.
VeloDB (коммерциялық Doris) — open-source-пен 100% үйлесімді, vendor lock-in жоқ.
3. Архитектура және сақтау
Екі жүйе де ортақ FE+BE архитектурасын мұра етті, бірақ форктан кейін әр түрлі дамыды.
| Мүмкіндік | Apache Doris | StarRocks |
|---|---|---|
| Деректер модельдері | Duplicate, Unique, Aggregate Key | Duplicate, Primary, Aggregate |
| Real-time UPSERT | Delete Bitmap (Unique Key) — тиімді merge-on-read | Primary Key UPDATE on merge арқылы |
| Толық мәтіндік іздеу | Inverted Index + BM25 scoring | Базалық LIKE, BM25 жоқ |
| Vector Search | Native HNSW, IVFPQ — AI/RAG үшін | Native vector search жоқ |
| Lakehouse федерация | Multi-Catalog: Iceberg, Hudi, Delta, Hive, JDBC | External Catalog: Iceberg, Hudi, Delta, Hive, JDBC |
| Compute-storage separation | Опциялық decoupled mode | Shared-data архитектурасы |
| Шардтарды авто-балансировка | Автоматты балансировка | Қолмен/жартылай автоматты |
Басты архитектуралық айырмашылық — Doris unified мүмкіндіктерге инвестициялайды (search + analytics + vector), StarRocks — таза OLAP-сценарийлерді оптимизациялайды.
4. Өнімділік: бенчмарктар
Екі қозғалтқыш та стандартты бенчмарктарда бәсекеге қабілетті өнімділік көрсетеді. Ортақ шығу тегі ұқсас engine internals дегенді білдіреді.
| Бенчмарк | Apache Doris | StarRocks | Түсініктеме |
|---|---|---|---|
| TPC-H (22 сұраныс) | 22/22 ✓ | 22/22 ✓ | Нәтижелер 10–20% аралығында |
| TPC-DS (99 сұраныс) | 99/99 ✓ | Көпшілік сұраныстар ✓ | Doris барлық 99-ды өтеді |
| ClickBench | Топ-позициялар | Топ-позициялар | Екеуі де көшбасшы, айырмашылық аз |
| SSB-Flat | Жоғары жылдамдық | Жоғары жылдамдық | Ұқсас нәтижелер |
Негізгі қорытынды: форк ұқсас қозғалтқыштарды білдіреді. Дифференциация — мүмкіндіктерде, raw speed-те емес.
Дереккөздер: influxdata.com, tinybird.co, clickbench.com тәуелсіз бенчмарктары.
5. Unified Lakehouse vs OLAP Focus
Мұнда стратегиялар принципиалды түрде ажырасады. Doris бір платформамен 4–5 жүйені алмастыруға ұмтылады.
// МЫСАЛ: DORIS-ТА HYBRID SEARCH (OLAP + FULL-TEXT + VECTOR) SELECT doc_id, title, score,
TOKENIZE(content, 'russian') AS tokens,
L2_DISTANCE(embedding, [0.1, 0.3, ...]) AS dist
FROM documents
WHERE content MATCH 'аналитика реального времени' AND category_id IN (SELECT id FROM categories
WHERE region = 'CentralAsia')
ORDER BY score DESC, dist ASC LIMIT 20; Apache Doris — Unified Platform
- OLAP-аналитика ✓
- Толық мәтіндік іздеу (Inverted Index, BM25) ✓ — Elasticsearch алмастырады
- AI/RAG үшін Vector Search (HNSW, IVFPQ) ✓
- Lakehouse-федерация (Multi-Catalog) ✓
- CDC / Real-time ingest (Kafka, Flink, Stream Load) ✓
StarRocks — OLAP Engine
- OLAP-аналитика ✓
- Шектеулі іздеу (LIKE, BM25 жоқ)
- Native vector search жоқ
- Федерация үшін External Catalog ✓
- Real-time ingest ✓
Қорытынды: Doris data stack-ті консолидациялауға ұмтылады. StarRocks OLAP-сұраныстар жылдамдығына фокусталады.
6. Экожүйе және community
Community масштабы даму жылдамдығына, құжаттама сапасына және мамандар қолжетімділігіне әсер етеді.
| Метрика | Apache Doris | StarRocks |
|---|---|---|
| Қор | Apache Software Foundation | Linux Foundation |
| Контрибьюторлар | 900+ | 350+ |
| GitHub Stars | 12K+ | 9K+ |
| Production-деплойлар | 4000+ (банктер, телеком, финтех) | Кең, бірақ жариялы деректер аз |
| Коммерциялық бэкер | VeloDB + қоғамдастық | CelerData (негізгі) |
| MySQL-протоколы | ✓ — кез келген BI-мен plug-and-play | ✓ — ұқсас үйлесімділік |
Екі жоба да белсенді дамуда. Doris community масштабы мен enterprise-енгізулер санында алда.
7. Иелену құны (TCO)
Ұқсас MPP-архитектурада инфрақұрылымдық шығындар салыстырмалы. Негізгі айырмашылықтар — лицензиялау мен стратегиялық тәуекелдерде.
| Лицензия | Apache 2.0 — мәңгі тегін, шектеусіз. ELv2 — managed-сервистерге шектеу, CelerData-ға тәуелділік. |
| Коммерциялық қолдау | VeloDB (enterprise Doris) vs CelerData (enterprise StarRocks). Екеуі де managed-шешімдер ұсынады. |
| Инфрақұрылым | Ұқсас ресурстық талаптар — бірдей MPP-архитектура FE+BE. |
| Операциялық күрделілік | Салыстырмалы: екі жүйе де FE+BE, мониторинг, backup талап етеді. |
| Стек консолидациясы | Doris ES + OLAP + Vector DB алмастырады = 3–4 жүйеде үнемдеу. StarRocks — тек OLAP. |
| Ұзақ мерзімді тәуекел | Apache 2.0 — кепілденген еркіндік. ELv2 — CelerData шешімімен өзгеруі мүмкін. |
8. StarRocks қашан жақсырақ болуы мүмкін
Әділеттілік үшін — StarRocks артықшылықтары бар сценарийлер:
- Жалғыз міндетіңіз — OLAP-сұраныстар, толық мәтіндік іздеу немесе vector search қажет емес.
- CelerData managed service қазірдің өзінде пайдаланасыз және экожүйе сізді қанағаттандырады.
- StarRocks-тың нақты оптимизациялары сіздің workload-паттерніңізге дәл сәйкес келеді.
Бірақ: unified платформа қажет болса (search + OLAP + vector + lake) — Doris объективті түрде көбірек ұсынады.
Және: лицензиялық еркіндік маңызды болса — Apache 2.0 (Doris) ELv2-ден (StarRocks) қауіпсізірек.