1. Umumiy kelib chiqish: raqobatchiga aylangan fork
StarRocks (dastlabki nomi DorisDB) taxminan 2020-yilda CelerData kompaniyasi tomonidan Apache Doris dan forklangan. Oʼshandan beri ikkala loyiha mustaqil rivojlanmoqda.
Umumiy asos: ikkalasi ham — MPP-kolonchali OLAP-bazalar, FE (Frontend) + BE (Backend) arxitekturasi, vectorized execution va MySQL-protokol qoʼllab-quvvatlashi bilan.
Forkdan keyin yoʼllar ajraldi: StarRocks maxsus workload lardagi unumdorlik va CelerData orqali tijoratlashtirish ga yoʼnaltirildi. Apache Doris — Apache Foundation qoʼllab-quvvatlashi ostida ekotizimni kengaytirishga: unified lakehouse, toʼliq matnli qidiruv, vector search.
Bugun ikkalasi ham — yetuk, production-grade OLAP-tizimlar. Lekin litsenziya, imkoniyatlar va strategiyadagi farqlar tanlovni prinsipial qiladi.
2. Litsenziya: Apache 2.0 vs Elastic License 2.0
Bu texnik taqqoslashda koʼpincha eʼtibordan chetda qoladigan muhim farq.
| Apache Doris | StarRocks |
|---|---|
| Apache License 2.0 | Elastic License 2.0 (ELv2) |
| Toʼliq erkinlik: foydalanish, oʼzgartirish, tarqatish, SaaS | StarRocks ni managed service sifatida taqdim etish taqiqlangan |
| Bulutli provayderlar uchun hech qanday cheklov yoʼq | Bulutli provayderlar — faqat CelerData bilan kelishuv orqali |
| Apache Software Foundation kafolatlagan | CelerData qarori bilan oʼzgarishi mumkin |
Enterprise uchun: Apache 2.0 — nol litsenziya xavfi. ELv2 yuridik tekshiruvni talab qiladi va StarRocks ustiga xizmat qurishda uzoq muddatli xavflar mavjud.
VeloDB (tijorat Doris) — open-source bilan 100% mos, vendor lock-in yoʼq.
3. Arxitektura va saqlash
Ikkala tizim ham umumiy FE+BE arxitekturasini meros qilib olgan, lekin forkdan keyin har xil rivojlangan.
| Imkoniyat | Apache Doris | StarRocks |
|---|---|---|
| Maʼlumot modellari | Duplicate, Unique, Aggregate Key | Duplicate, Primary, Aggregate |
| Real-time UPSERT | Delete Bitmap (Unique Key) — samarali merge-on-read | Primary Key UPDATE on merge orqali |
| Toʼliq matnli qidiruv | Inverted Index + BM25 scoring | Bazaviy LIKE, BM25 yoʼq |
| Vector Search | Native HNSW, IVFPQ — AI/RAG uchun | Native vector search yoʼq |
| Lakehouse federatsiya | Multi-Catalog: Iceberg, Hudi, Delta, Hive, JDBC | External Catalog: Iceberg, Hudi, Delta, Hive, JDBC |
| Compute-storage separation | Ixtiyoriy decoupled mode | Shared-data arxitekturasi |
| Shardlarni avto-balanslashtirish | Avtomatik balanslashtirish | Qoʼlda/yarim avtomatik |
Asosiy arxitektura farqi — Doris unified imkoniyatlarga investitsiya qiladi (search + analytics + vector), StarRocks — sof OLAP-ssenariylarni optimallashtirishga.
4. Unumdorlik: benchmarklar
Ikkala dvigatel ham standart benchmarklarda raqobatbardosh unumdorlik koʼrsatadi. Umumiy kelib chiqish oʼxshash engine internals ni bildiradi.
| Benchmark | Apache Doris | StarRocks | Izoh |
|---|---|---|---|
| TPC-H (22 soʼrov) | 22/22 ✓ | 22/22 ✓ | Natijalar 10–20% oraligʼida |
| TPC-DS (99 soʼrov) | 99/99 ✓ | Koʼpchilik soʼrovlar ✓ | Doris barcha 99 tani oʼtadi |
| ClickBench | Top-pozitsiyalar | Top-pozitsiyalar | Ikkalasi ham yetakchi, farq minimal |
| SSB-Flat | Yuqori tezlik | Yuqori tezlik | Oʼxshash natijalar |
Asosiy xulosa: fork oʼxshash dvigatellarni bildiradi. Differensiatsiya — imkoniyatlarda, raw speed da emas.
Manbalar: influxdata.com, tinybird.co, clickbench.com mustaqil benchmarklari.
5. Unified Lakehouse vs OLAP Focus
Bu yerda strategiyalar prinsipial tarzda ajraladi. Doris bitta platforma bilan 4–5 tizimni almashtirishga intiladi.
// MISOL: DORIS DA HYBRID SEARCH (OLAP + FULL-TEXT + VECTOR) SELECT doc_id, title, score,
TOKENIZE(content, 'russian') AS tokens,
L2_DISTANCE(embedding, [0.1, 0.3, ...]) AS dist
FROM documents
WHERE content MATCH 'аналитика реального времени' AND category_id IN (SELECT id FROM categories
WHERE region = 'CentralAsia')
ORDER BY score DESC, dist ASC LIMIT 20; Apache Doris — Unified Platform
- OLAP-analitika ✓
- Toʼliq matnli qidiruv (Inverted Index, BM25) ✓ — Elasticsearch oʼrnini bosadi
- AI/RAG uchun Vector Search (HNSW, IVFPQ) ✓
- Lakehouse-federatsiya (Multi-Catalog) ✓
- CDC / Real-time ingest (Kafka, Flink, Stream Load) ✓
StarRocks — OLAP Engine
- OLAP-analitika ✓
- Cheklangan qidiruv (LIKE, BM25 yoʼq)
- Native vector search yoʼq
- Federatsiya uchun External Catalog ✓
- Real-time ingest ✓
Xulosa: Doris data stack ni konsolidatsiya qilishga intiladi. StarRocks OLAP-soʼrovlar tezligiga fokuslanadi.
6. Ekotizim va community
Community miqyosi rivojlanish tezligiga, hujjatlar sifatiga va mutaxassislar mavjudligiga taʼsir qiladi.
| Metrika | Apache Doris | StarRocks |
|---|---|---|
| Fond | Apache Software Foundation | Linux Foundation |
| Kontribyutorlar | 900+ | 350+ |
| GitHub Stars | 12K+ | 9K+ |
| Production-deploylar | 4000+ (banklar, telekom, fintech) | Keng, lekin ommaviy maʼlumotlar kam |
| Tijorat beker | VeloDB + jamoa | CelerData (asosiy) |
| MySQL-protokol | ✓ — har qanday BI bilan plug-and-play | ✓ — oʼxshash moslik |
Ikkala loyiha ham faol rivojlanmoqda. Doris community miqyosi va enterprise-joriy etishlar sonida oldinda.
7. Egalik qilish narxi (TCO)
Oʼxshash MPP-arxitekturada infratuzilma xarajatlari taqqoslanadigan. Asosiy farqlar — litsenziyalash va strategik xavflarda.
| Litsenziya | Apache 2.0 — abadiy bepul, cheklovsiz. ELv2 — managed-xizmatlar uchun cheklovlar, CelerData ga bogʼliqlik. |
| Tijorat qoʼllab-quvvatlash | VeloDB (enterprise Doris) vs CelerData (enterprise StarRocks). Ikkalasi ham managed-yechimlar taklif qiladi. |
| Infratuzilma | Oʼxshash resurs talablari — bir xil MPP-arxitektura FE+BE. |
| Operatsion murakkablik | Taqqoslanadigan: ikkala tizim ham FE+BE, monitoring, backup talab qiladi. |
| Stek konsolidatsiyasi | Doris ES + OLAP + Vector DB ni almashtiradi = 3–4 tizimda tejash. StarRocks — faqat OLAP. |
| Uzoq muddatli xavf | Apache 2.0 — kafolatlangan erkinlik. ELv2 — CelerData qarori bilan oʼzgarishi mumkin. |
8. StarRocks qachon yaxshiroq boʼlishi mumkin
Adolat uchun — StarRocks afzalliklari boʼlgan ssenariylar:
- Yagona vazifangiz — OLAP-soʼrovlar, toʼliq matnli qidiruv yoki vector search kerak emas.
- CelerData managed service dan allaqachon foydalanasiz va ekotizim sizni qanoatlantiradi.
- StarRocks ning aniq optimizatsiyalari sizning workload-patterningizga toʼgʼri keladi.
Lekin: unified platforma kerak boʼlsa (search + OLAP + vector + lake) — Doris objektiv tarzda koʼproq taklif qiladi.
Va: litsenziya erkinligi muhim boʼlsa — Apache 2.0 (Doris) ELv2 dan (StarRocks) xavfsizroq.