Show HN: Bundlebase – Docker for Data

Bundlebase는 버전 관리되고 자체 설명이 가능한 데이터 컨테이너를 제공하는 도구로, 서버나 별도의 인프라 없이 Python, SQL, CLI, BI 도구에서 접근할 수 있습니다. 데이터셋의 스키마, 변환 이력, 출처를 포함해 공유하며, 데이터 정제 규칙을 번들에 내장해 반복 작업을 자동화합니다. Apache Arrow, DataFusion, Parquet 등 최신 기술을 활용해 대용량 데이터도 효율적으로 처리하며, LLM 에이전트가 상태를 유지하는 데도 적합합니다. 이는 데이터 파이프라인과 협업을 간소화하는 혁신적 데이터 관리 솔루션입니다.

https://nvoxland.github.io/bundlebase/

#dataengineering #python #sql #apachearrow #dataversioning

Bundlebase — Data Packaging - Bundlebase

Bundlebase packages data into versioned, self-describing containers. Attach CSV, Parquet, or JSON from S3, HTTP, or local files. Query with SQL via Python, CLI, or any BI tool. Share via a path. No database required.

I den här intervjun berättar jag om hur vi på @metasolutions hjälper verksamheter att komma igång med sin resa kring #öppnadata och #deladedata. Det är alltid lika roligt att hjälpa någon komma över tröskeln med publiceringar och vår skattefinansierad information kommer fler till nytta!

https://entryscape.com/sv/2022/01/mjukstart-med-oppna-data-sa-har-gar-ett-projekt-till/

#DataCatalogs #SecureDataSharing #InternalDataManagement #DataVersioning #OpenDataPortals

Mjukstart med öppna data – så här går ett projekt till - entryscape.com

Beslutet är taget, man ska börja publicera öppna data på kommunen, regionen eller myndigheten. Men hur ska det gå till? MetaSolutions Mattias Axell berättar.

entryscape.com