scrapy-contrib-bigexporter 1.1.0 released. Scrape data using Scrapy in parquet,avro,orc or iceberg format. Changes: CI/CD pipeline on Codeberg Actions, Update Actions, Apply strict schema to Arrow table if schema is provided.

https://codeberg.org/ZuInnoTe/scrapy-contrib-bigexporters

#scrapy #python #parquet #iceberg #avro #orc #webscraping

scrapy-contrib-bigexporters

Scrapy exporter for Big Data formats

Codeberg.org
Redirecting...

Released scrapy-contrib-bigexporter 1.0.0 (https://codeberg.org/ZuInnoTe/scrapy-contrib-bigexporters) - additional export formats for the webscraping framework Scrapy.

Migrated parquet export from fastparquet to pyarrow as fastparquet is deprecated (https://docs.dask.org/en/stable/changelog.html#fastparquet-engine-deprecated)

Migrated orc export from pyorc to pyarrow to reduce the number of dependencies

#scrapy #crawling #python #parquet #orc #pyarrow #webcrawling #scraping

scrapy-contrib-bigexporters

Scrapy exporter for Big Data formats

Codeberg.org

scrapy-contrib-bigexporter 0.6.1 released: https://codeberg.org/ZuInnoTe/scrapy-contrib-bigexporters

Added: You can customize Iceberg table location

#scrapy #webscraping #bigdata #iceberg #apacheiceberg #opensource #python

scrapy-contrib-bigexporters

Scrapy exporter for Big Data formats

Codeberg.org

scrapy-contrib-bigexporter 0.6.0 released: https://codeberg.org/ZuInnoTe/scrapy-contrib-bigexporters

New: Export your webscraped items in Scrapy to Apache Iceberg tables with simple configuration

#scrapy #webscraping #bigdata #iceberg #apacheiceberg #opensource #python

scrapy-contrib-bigexporters

Scrapy exporter for Big Data formats

Codeberg.org
Achei que esse ano não ia rolar uma palestra para o Caipyra. Mas no fim aprovaram uma das minhas propostas! Para quem trabalha com raspagem de dados e com Scrapy, bora aprender uns tópicos um pouquinho mais avançados agora em junho, lá em Ribeirão Preto?
https://2025.caipyra.python.org.br/

#Caipyra2025 #Python #Scrapy
Caipyra 2025

🐍 How can you scrape data from webpages using #Python? In this talk, you'll see how this is possible with #scrapy. https://www.youtube.com/watch?v=tdA1cl6LiCw
Scaping the web with Scrapy (Python Frederick)

YouTube

Настраиваем паука для сбора данных: как работает фреймворк Scrapy

В Точке мы обучаем наших AI-ассистентов, а для этого нужно много данных. В статье расскажу, как быстро собрать информацию практически с любого сайта при помощи фреймворка Scrapy.

https://habr.com/ru/companies/tochka/articles/885184/

#scrapy #python #сбор_данных

Настраиваем паука для сбора данных: как работает фреймворк Scrapy

В Точке мы обучаем наших AI-ассистентов, а для этого нужно много данных. В статье расскажу, как быстро собрать информацию практически с любого сайта при помощи фреймворка Scrapy.  Зачем компании...

Хабр
Create your personal web crawler with #scrapy and #raspberrypi. Complete tutorial to scrape your favourite websites with a simple #python script #linux #diy https://peppe8o.com/use-raspberry-pi-as-your-personal-web-crawler-with-python-and-scrapy/
How to use Scrapy on Raspberry PI: Build your Personal Web Crawler

Create and configure a simple spiderbot (crawler) with a tiny computer. I'll use Scrapy in Raspberry PI Zero 2W with Raspberry PI OS Lite

peppe8o

Как парсить данные с Python

Парсинг — это автоматический поиск различных паттернов (на основе заранее определенных конструкций) из текстовых источников данных для извлечения специфической информации. Не смотря на то, что парсинг — широкое понятие, чаще всего под этим термином подразумевают процесс сбора и анализа данных с удаленных веб-ресурсов.

https://habr.com/ru/companies/timeweb/articles/877596/

#timeweb_статьи #html #python #парсинг #ubuntu #xml #вебсайт #JSON #javascript #scrapy

Как парсить данные с Python

Парсинг — это автоматический поиск различных паттернов (на основе заранее определенных конструкций) из текстовых источников данных для извлечения специфической информации. Не смотря на то, что парсинг...

Хабр