Тесттен алынған негізгі фактілер
- SSB: update-heavy сценарийінде Apache Doris ClickHouse ReplacingMergeTree-ден 34x дейін жылдам.
- ClickBench: Apache Doris update ratio мен ресурс профиліне қарай 1.7x-4.6x жылдам.
- ClickHouse ішінде MergeTree ReplacingMergeTree-ден тұрақты түрде жылдам, бұл update семантикасының құнын көрсетеді.
- Бизнес құндылығы: үздіксіз жаңартуларда BI, antifraud және risk үшін latency тұрақтылығы.
1. Не тексерілді және не үшін
VeloDB командасы Apache Doris пен ClickHouse-ты деректер жиі жаңаратын сценарийде салыстырды: жаңа оқиғалар, транзакция түзетулері, клиент атрибуттарының өзгеруі.
Мақсат: жоғары update жүктемесінде сұраныс латенттілігі қай платформада тұрақтырақ екенін көру.
2. Тест конфигурациясы
- VeloDB Cloud (Apache Doris): 1 node, 16 vCPU, 128 GB RAM
- ClickHouse Cloud: 2 node × (16 vCPU, 64 GB RAM)
- ClickHouse Cloud: 2 node × (8 vCPU, 32 GB RAM)
- Бенчмарк: SSB және ClickBench; update ratio: 25% және 100%
Салыстыру CPU және RAM бойынша екі профильде жасалды, бұл нәтижені әділ етуге көмектеседі.
3. Update механикасы: Doris vs ClickHouse
Apache Doris Unique Key + Delete Bitmap қолданады: ескі версия жазу кезінде белгіленеді, оқуда ауыр дедупликация азаяды.
ClickHouse ReplacingMergeTree-де жаңа версия append-only ретінде жазылады, ал нақты консолидация merge кезеңіне тәуелді.
Нәтижесі: update үлесі артқанда ClickHouse-та оқу құны өседі, Doris-та latency тұрақтырақ қалады.
4. SSB нәтижелері (real-time update)
- Doris vs ClickHouse ReplacingMergeTree (32c/128GB): 100% update-та 18x, 25% update-та 14x жылдам.
- Doris vs ClickHouse ReplacingMergeTree (16c/64GB): 100% update-та 34x, 25% update-та 25x жылдам.
- ClickHouse ішінде MergeTree, ReplacingMergeTree-ден 1.7-2.5x жылдам.
5. ClickBench нәтижелері (real-time update)
- Doris vs ClickHouse ReplacingMergeTree (32c/128GB): 2.5x және 1.7x жылдам.
- Doris vs ClickHouse ReplacingMergeTree (16c/64GB): 4.6x және 3.1x жылдам.
- ClickHouse ішінде MergeTree ReplacingMergeTree-ден 2.7-3.9x жылдам.
6. Неліктен бұл modern OLAP үшін маңызды
- Real-time аналитика ingest пен query latency-ді бірге талап етеді.
- Update кезінде latency өссе, BI және alert жүйелері кешігеді.
- Бұл әсіресе банк, fintech және e-commerce үшін критикалық.
- Сондықтан update қолдауы — басты таңдау критерийі.
8. Салыстырудың шектеулері мен шарттары
Нәтижелерді дұрыс түсіндіру үшін бастапқы эксперимент шекараларын ескеру керек:
- Тест нақты managed cloud конфигурацияларында орындалған (VeloDB Cloud және ClickHouse Cloud).
- Сценарий update-intensive workload-қа бағытталған; pure append/scan үшін нәтиже басқаша болуы мүмкін.
- Қорытындыға table model, merge/background compaction баптауы және query профилі қатты әсер етеді.
- SSB және ClickBench репрезентативті, бірақ нақты production шешімі үшін workload POC міндетті.
Ұсыныс: миграция алдында сіздің SLA, дерек схемасы және типтік сұраныстармен қысқа POC жүргізіңіз.
7. Apache Doris клиент кейстері
NetEase Cloud Music
ClickHouse-тан Doris-ке көшу: күн сайын триллион оқиға, ingest 6 GB/s, P99 latency -30%, concurrency 500+.
Lakala (fintech)
Elasticsearch/Hive/HBase/TiDB/Oracle-ды Doris-ке біріктіру: query 15x жылдам, сервер саны -52%.
Kwai
Doris негізіндегі unified lakehouse: күніне ~1 млрд сұраныс, кеш пен materialized view rewrite есебінен жылдамдық артуы.
Түпнұсқа дереккөз
VeloDB Engineering Team, "Apache Doris Up to 34x Faster Than ClickHouse in Real-Time Updates", 2025-10-01.
https://www.velodb.io/blog/apache-doris-34x-faster-clickhouse-realtime-updates