Data catalog есть, а пользы нет: Частые ошибки внедрения

Data governance, data mesh, modern data stack, data lineage – столько разных data, столько разных популярных подходов и инструментов. Лидером по популярности (на мой скромный взгляд) среди всех них является data catalog. Многие говорят о нем, многие хотят его, многие уже внедрили. Но внедрить это одно дело, а вот получить от него пользу – дело совсем другое. Мы сформировали список самых частых проблем, основанные не только на нашем опыте, но и на опыте наших коллег, проанализировав множество статей и материалов на эту тему.

https://habr.com/ru/articles/1003158/

#data_catalog #data_governance #openmetadata #datahub #ai #metadata #метаданные #каталог_данных #управление_данными #data_quality

Data catalog есть, а пользы нет: Частые ошибки внедрения

Всех приветствую! Зовут меня Павел, работаю в Lasmart и веду направление разработки решения по автоматизации описания метаданных с AI (Datadesc). Часто сталкиваемся с каталогами данных и вот решили...

Хабр

Хороший, плохой, злой: База данных, data catalog и AI

Всех приветствую! Меня зовут Павел, работаю в компании Lasmart. Одно из направлений деятельности всегда было внедрение и развитие DWH. В какой-то момент задумались о том, чтобы оптимизировать прежде всего свою работу в некоторых аспектах. И первым инструментом сделали генерацию бизнес-описания на основе AI. Назвали Datadesc (data + description). Об этом опыте и пойдет речь в этой статье.

https://habr.com/ru/articles/996288/

#dwh #sql #data_catalog #openmetadata #datahub #data_engineering #data_analyst #semantic #arenadata_catalog #ai

Хороший, плохой, злой: База данных, data catalog и AI

Всех приветствую! Меня зовут Павел, работаю в компании Lasmart. Одно из направлений деятельности всегда было внедрение и развитие DWH. В какой-то момент задумались о том, чтобы оптимизировать прежде...

Хабр
1 Jahr #DataHub #Berlin: Fünf zentrale Erkenntnisse
zeigen, wie Berlin Datenarbeit in der Verwaltung
stärker etablieren will - mit 🛠️Tools, Zusammenarbeit 🤝& offenen Komponenten ⚙️für Visualisierung & Nutzung von Daten.
Mehr Infos:👇
https://www.technologiestiftung-berlin.de/profil/blog/1-jahr-data-hub-berlin-wie-wird-berlin-souveraener-in-der-datenarbeit-5-take-aways
1 Jahr Data Hub Berlin: 5 Take-Aways vom Praxisforum Inside the Cube

Wie Visualisierungen Mut machen, Daten Zusammenarbeit stärken und beschleunigte Datenflüsse Verwaltungsprozesse nachhaltig verbessern können.

Technologiestiftung Berlin

DataHub + MCP: подключаем ИИ к управлению метаданными

Чем больше данных в компании, тем критичнее становится понимание того, где именно они хранятся и как изменяются при обновлениях. В «Островке» мы пользуемся дата-каталогами, но в какой-то момент решили пойти чуть дальше: объединили DataHub с генеративным ИИ через Model Context Protocol, чтобы сделать работу с метаданными более интерактивной и быстрой. Теперь сотрудники могут получать развернутые ответы на сложные вопросы о таблицах, lineage и зависимостях данных, не тратя часы на ручной поиск и согласования. Получилась не просто автоматизация рутинных задач, а, по сути, инструмент self-service аналитики. Под катом делимся опытом внедрения связки DataHub + MCP, рассказываем об архитектуре решения и показываем реальные примеры, как ИИ становится практическим помощником в управлении метаданными.

https://habr.com/ru/companies/ostrovok/articles/980210/

#data #datahub #ai #mcp #аналитика #большие_данные #датакаталог #метаданные #llm

DataHub + MCP: подключаем ИИ к управлению метаданными

Чем больше данных в компании, тем критичнее становится понимание того, где именно они хранятся и как изменяются при обновлениях. В «Островке» мы пользуемся дата-каталогами, но в какой-то момент решили...

Хабр
Endlich. Nach jahrelangem Stillstand gibt es endlich einen #DataHub in #Berlin. Grundlage für viele Projekte und #OpenData. Ersten Projekte sind: „Akteure im Sozialraum sichtbar machen“, Dashboard der Stadtbibliothek #Pankow, Digitale Bezirksregionenprofile und bei der Landesgleichstellung. https://www.egovernment.de/data-hub-berlin-prototyp-veroeffentlicht-a-6228caa21feea8c0ba70519582db6679/
Data Hub Berlin: Prototyp veröffentlicht

Mit dem Data Hub Berlin will die Senatsverwaltung ganz neue Möglichkeiten für ein datenbasiertes Verwaltungshandeln schaffen. Der Prototyp wurde jetzt veröffentlicht. Er basiert auf einer offenen, modularen Architektur und Open-Source-Komponenten.

eGovernment
DataPLANT Participating and Presenting at 1st OA Workshop in Göttingen

The BIOIMAGE consortium, a method-centered initiative within the National Research Data Infrastructure (NFDI), held its All Hands Meeting at Heinrich-Heine University Düsseldorf in early February. The three-day event provided a platform for in-depth discussions on collaboration, exchange in ideas on cross-community support, ...

Der Prototyp des #DataHub #Berlin ist online:💡
Eine modulare #Datenplattform auf Open-Source Basis
ermöglicht Verwaltungen in Berlin, #Daten effektiver
zu bündeln und auszuwerten. ⚙️
Mehr Infos dazu hier:👇
https://www.kommune21.de/k21-meldungen/prototyp-des-data-hub-freigeschaltet/

DataHub не заменил наш самописный дата-каталог — и это нормально. Оптимизируем работу с метаданными

В Островке мы строим экосистему вокруг данных — от хранилищ и пайплайнов до систем мониторинга и каталогов. Но когда всё только начиналось, под часть наших процессов просто не существовало готовых решений. Так появился наш собственный дата-каталог DataPortal — лёгкий, быстрый и идеально подходящий для небольшой компании. Со временем всё изменилось: объём данных вырос в десятки раз, появились новые команды, и вместе с этим начали звучать вопросы вроде «где лежат данные для этого дашборда?», «кому писать, если он упал?» и «можно ли этим данным доверять?». Так мы поняли, что пора взрослеть — и искать инструмент, который поможет масштабировать не только инфраструктуру, но и дата-культуру . Мы выбрали DataHub — open-source каталог, обещавший прозрачность, автоматизацию и гибкость. Развернули, подключили источники, построили lineage, и даже порадовались, что всё заработало с первого раза. А потом стало ясно: DataHub не заменил наш DataPortal. Более того, оба инструмента отлично дополнили друг друга — инженерное ядро и удобное окно в данные для бизнеса. Почему два дата-каталога оказались лучше одного, как это повлияло на культуру работы с данными и что нам дал DataHub помимо красивых графов lineage — рассказываем под катом.

https://habr.com/ru/companies/ostrovok/articles/961196/

#датакаталог #datahub #управление_данными #data_quality #метаданные

DataHub не заменил наш самописный дата-каталог — и это нормально. Оптимизируем работу с метаданными

В Островке мы строим экосистему вокруг данных — от хранилищ и пайплайнов до систем мониторинга и каталогов. Но когда всё только начиналось, под часть наших процессов просто не существовало готовых...

Хабр
Google updates Ads Data Hub methodology with expanded metrics scope: Google expands measurement capabilities for advertisers with new metrics and refined traffic classification standards in latest platform documentation. https://ppc.land/google-updates-ads-data-hub-methodology-with-expanded-metrics-scope/ #GoogleAds #DataHub #DigitalMarketing #Analytics #Advertising
Google updates Ads Data Hub methodology with expanded metrics scope

Google expands measurement capabilities for advertisers with new metrics and refined traffic classification standards in latest platform documentation.

PPC Land
#geOcom2025 Laure-Hélène Bruneton de @camptocamp poursuit avec la saisie des métadonnées, accompagnée et simplifiée dans #Datahub #geOrchestra