My latest: Dell Technologies jumps into the ring with NetApp and VAST Data, unveiling a new #AI #dataorchestration product built on its Dataloop acquisition, as NVIDIA #STX shakes up the #enterprisedatastorage industry.

Key quote: "The #cuDF and #cuVS integrations quietly showing up inside #Snowflake, #Starburst, #watsonx -- those matter more to an #enterpriseIT leader's next 12 months than anything Jensen [Huang] showed on the big stage."

Find out why that is, as well as how the Dell Data Orchestration Engine stacks up to competitors: https://www.techtarget.com/searchstorage/news/366640330/Dell-Data-Orchestration-Engine-joins-AI-data-pipeline-fray #GTC26 #Nvidia

Prepping for my sci-fi inspired data science projects live stream

We decided on the last call to do img classification #CNN w/ #NVIDIA GPUs and #RAPIDS #opencv #cuml #seaborn #cuDF #cupy and started a PRD. I'll share my finished PRD and get to building live for 2 hours.

Wed, July 23 1:15p ET / 12:15p CT / 5:15p GMT

Feel free to come by & say 'hello'

https://www.youtube.com/live/2IPZ35XpZaY?si=IDqW2EHAGNDed7jZ

Workshop Wednesday: Engineering Star Trek with Data Science

YouTube

Supercharge your data work! Our GPU Time Series Analysis tutorial shows you how to use cuDF & Python for incredible speed. Boost performance now. #GPUDataScience #TimeSeries #cuDF #Python #BigData #DataAnalysis #NVIDIA

https://teguhteja.id/gpu-time-series-analysis-cudf-tutorial/

GPU Time Series Analysis - teguhteja.id

GPU Time Series Analysis: Unlock blazing-fast insights! Learn cuDF for GPU-accelerated time series data. Step-by-step guide.

teguhteja

[Перевод] NVIDIA cuDF и 100-кратное ускорение чтения данных формата JSON Lines в pandas

JSON — это широко распространённый формат, применяемый для хранения информации, основанной на обычном тексте. Он поддерживается самыми разными системами, обеспечивая их взаимодействие. Чаще всего это — веб-приложения и большие языковые модели (Large Language Model, LLM). Хотя JSON-данные удобны для восприятия человеком, их сложно обрабатывать, используя инструменты из сфер Data Science (наука о данных) и Data Engineering (инженерия данных). JSON-данные часто существуют в виде JSON-строк (формат JSON Lines), отделённых друг от друга символами перевода строки (NDJSON, Newline-Delimited JSON). NDJSON используется для представления записей, входящих в состав набора данных. Часто первым этапом обработки данных является чтение файлов формата JSON Lines и преобразование их в объекты DataFrame (датафрейм). В это материале мы сравним производительность и функционал API, доступных в Python и применяемых для преобразования формата JSON Lines в датафреймы.

https://habr.com/ru/companies/wunderfund/articles/895250/

#JSON #NVIDIA #cuDF

NVIDIA cuDF и 100-кратное ускорение чтения данных формата JSON Lines в pandas

JSON — это широко распространённый формат, применяемый для хранения информации, основанной на обычном тексте. Он поддерживается самыми разными системами, обеспечивая их взаимодействие. Чаще всего это...

Хабр

#Nvidia releases **Rapid cuDF** that, through your GPU, allows you to speed up operations of #Pandas up to 150x times!

🔗 https://github.com/rapidsai/cudf

#DataScience #DataAnalysis #DataEngineering #GPUAcceleration #rapid #cuDF #RapidscuDF

GitHub - rapidsai/cudf: cuDF - GPU DataFrame Library

cuDF - GPU DataFrame Library . Contribute to rapidsai/cudf development by creating an account on GitHub.

GitHub