БЛОГ
Статьи, разборы и технические гайды от команды Datanomix
Data Residency в КЗ и УЗ: compliance для OLAP
Закон 94-V, ПДн, BYOC, on-premise, air-gapped. Как развернуть VeloDB/Apache Doris в соответствии с требованиями.
RegTech для банков: Data Lakehouse как основа отчётности
Как банкам КЗ и УЗ подготовить инфраструктуру к RegTech: CDC, Basel III, AML, дедлайн ЦБУ 2027. ~16 мин.
dbt + Apache Doris
SQL-трансформации в lakehouse: adapter, materializations, incremental, тесты, CI/CD.
Apache Iceberg + Doris
Lakehouse federation: Multi-Catalog, федеративные JOIN, time travel, write-back. Нулевое копирование данных.
Apache Doris vs Vertica
Масштабирование, лицензия, real-time, TCO: сравнение на основе кейса Авито. Инструменты миграции, SQL-совместимость.
Apache Doris vs StarRocks
Форк против оригинала: лицензия, hybrid search, lakehouse, community. Объективное сравнение OLAP-систем.
Apache Doris vs Greenplum
MPP DWH или Lakehouse: real-time, TCO, миграция X2Doris. Почему enterprise уходит с Greenplum.
Apache Doris vs ClickHouse
JOIN, real-time updates, SQL: детальное сравнение. TPC-H 3x, TPC-DS 99/99 vs ~50%, кейсы миграции.
Миграция с ClickHouse на Apache Doris
Маппинг MergeTree → Doris, SQL-адаптация, X2Doris, ClickHouse Catalog, zero-downtime подход.
Миграция с Vertica на Apache Doris
SQL-адаптация, projections → MV, инструменты переноса, 40-70% снижение TCO. Пошаговый гайд.
Apache Doris vs Elasticsearch
Архитектура, производительность, стоимость: почему компании переходят с ES на Doris. Кейсы 56x ускорения.
Flink CDC + Apache Doris: real-time пайплайн
CDC из MySQL, PostgreSQL, Oracle в Doris. Schema evolution, auto-table creation, exactly-once. ~10 мин.
Data Lakehouse для банков
Антифрод, compliance, единое хранилище. Кейсы: 650M клиентов, 56x ускорение, 52% меньше серверов.
Ускорим ваш BI-инструмент
SuperSet, PowerBI, Tableau тормозит? Sub-100ms аналитика, Auto Query Rewrite, бесплатный пилот за 2 недели.
Что такое Data Lakehouse — объясняю по-человечески
Data Warehouse vs Data Lake vs Lakehouse. Open table formats. Пять неочевидных преимуществ. ~15 мин.
Введение в Apache Doris / VeloDB
MPP-архитектура, сценарии использования, ключевые возможности. 5000+ компаний в production. ~12 мин.
Hybrid Search: почему векторы врут, а ключевые слова тупят
Vector + BM25 + RRF. Бенчмарк: 96% качества Reranker без GPU. SQL-примеры. ~12 мин.
5 точек отказа RAG-систем — и как их закрыть
RBAC, Embedding Drift, Semantic Confusion, аудит, Prompt Injection. Решения и ссылки на исследования. ~8 мин.
Airflow + Apache Doris / VeloDB — оркестрация пайплайнов
MySQL Protocol, три паттерна DAG, Stream Load. Job Scheduler vs Airflow. ~10 мин.
Apache Doris Kafka Connector: практический гайд
Kafka -> Doris: standalone/distributed, SSL, DLQ, schema evolution и best practices для production. ~14 мин.
Apache Doris до 34x быстрее ClickHouse на real-time update
Перевод benchmark-статьи VeloDB: SSB и ClickBench, сравнение Unique Key vs ReplacingMergeTree.
Как уйти от Observability Tax: OpenTelemetry + Grafana + VeloDB
Точный перевод статьи VeloDB: open observability stack, снижение стоимости до 10% от Elasticsearch-модели.
Кейс внедрения Data Lakehouse в Казахстане
Обезличенный кейс VeloDB: как было, как стало, какие бизнес-выгоды получил клиент за 4 месяца.
Kwai: ClickHouse + ES → Apache Doris (Bleem)
Перевод VeloDB: триллионы строк рекламы, единый движок, ZK+2PC, skew, partition pruning.