Tech Stack
Job Description, Responsibilities & Requirements
Про посаду
Команда CHI Software не стоїть на місці. Ми любимо свою роботу і віддаємо їй сто відсотків! Кожен новий проект - це виклик, який ми успішно вирішуємо. Єдине, що може нас зупинити... Ну, це нічого! Кількість проектів зростає, і разом з ними зростає і наша команда. І зараз нам потрібен Data Architect.
Обов'язки
- Проектування та впровадження архітектури корпоративних даних
- Управління сховищем даних і політиками життєвого циклу
- Забезпечення якості та управління даними
Вимоги
Обов'язкові навички
-
Архітектура даних (8+ років, 3+ як архітектор)
-
Архітектура корпоративних даних - концептуальне, логічне, фізичне моделювання
-
Патерни архітектури Lakehouse - патерн медальйону, принципи Data Mesh
-
Гібридна архітектура даних - переміщення даних між локальною мережею та хмарою, консистентність, управління
-
Моделювання даних - багатовимірне моделювання, Data Vault 2.0 або аналогічне для аналітичних робочих процесів
-
Cloudera / Hadoop Ecosystem (Критичне)
- Cloudera Data Platform (CDP) - архітектура, адміністрування, безпека
- Apache Hive / Iceberg - формати таблиць, стратегії розділення, компактування
- Apache Spark on Cloudera - налаштування продуктивності, управління ресурсами
- HDFS / Ozone - архітектура зберігання, реплікація, розподіл за рівнями
- Apache Ranger / Knox - безпека, контроль доступу, аудит
-
Шар запитів та аналітики
- Starburst / Trino - архітектура федерованих запитів, управління коннекторами, стратегії кешування
- Tableau - архітектура джерел даних, порівняння витягнення даних та прямих підключень, дизайн семантичного шару
- Оптимізація SQL для аналітичних робочих процесів - стратегії об'єднання, матеріалізовані види, кешування
-
Потокові та інтеграційні рішення
- Apache Kafka - дизайн тем, реєстр схем (Avro/Protobuf), семантично точні одноразові операції
- CDC (Change Data Capture) патерни - Debezium, Kafka Connect
- Проектування ETL/ELT трубопроводів - патерни пакетної та потокової обробки
- Apache Airflow - дизайн DAG для складних трубопроводів даних
-
Управління та якість
- Informatica - каталог даних, якість даних, управління метаданими
- Фреймворки управління даними - володіння даними, управління, лінія розвитку
- Реалізація ABAC для доступу до даних (контроль доступу на основі атрибутів)
- Метрики якості даних та моніторинг
- Управління діловим глосаріям
-
Хмарна архітектура даних (AWS)
- S3 - патерни зберігання даних у дата-лейку, політики життєвого циклу, класи зберігання
- AWS Glue - каталог, ETL завдання
- Lake Formation - точний контроль доступу
- Гібридна інтеграція - AWS Direct Connect, стратегії реплікації даних
Буде плюсом
- Моделі даних телекомунікаційних даних (CDR, мережеві події, дані абонентів, біллінг)
- Досвід міграції з традиційного Hadoop до сучасного Lakehouse
- Досвід впровадження Data Mesh
- Оптимізація витрат для масштабних платформ даних
- Сертифікація DAMA-DMBOK або еквівалентна сертифікація з управління даними
Модель залучення
- Повна тимчасова підтримка команди (вбудована в команду)
- Можливість віддаленої роботи
- Необхідне перекриття з робочим часом у Баку (GMT+4)
- Вимога до англійської мови
Ми пропонуємо
- Відпустка: 20 робочих днів та 5 вихідних днів
- Безкоштовні заняття з англійської мови
- Гнучкий робочий графік
- Дійсно дружня та підтримуюча атмосфера
- Можливість працювати віддалено або в одному з наших офісів
- Медичне страхування для працівників з України
- Правова підтримка
Про компанію
Ваша мрійна робота чекає на вас. Подайте заявку вже зараз!