@MarCandea @Poslovitch @ache @sarah_trichet_allaire @kfort

Si vous partez sur comment genrer les noms de rues ou d'autres jeux de données, voici un super billet de blog d'une archiviste, @daieuxetdailleurs : https://www.patrimoine-et-numerique.fr/tutoriels/80-41-ou-sont-les-femmes-ou-comment-genrer-nos-donnees-patrimoniales

Elle utilise à la fois #OpenRefine pour remanier les données et #wikidata pour "réconcilier les données", ce qui permet de lever l'ambiguïté sur plein de noms.
On peut aussi en profiter pour enrichir #wikidata avec les données en question.

#archives #opendata

#41 - Où sont les femmes ? ou comment genrer nos données patrimoniales - Patrimoine et numérique

Genrer des données patrimoniales nominatives afin d'améliorer la visibilité (ici des femmes) et la découvrabilité des contenus, avec l'outil OpenRefine

Tipps & Tricks für die erfolgreiche Nutzung von Tools zum Einsatz der #GND im Archiv“ – die neue Handreichung der IG Archiv steht zur Verfügung: https://wiki.dnb.de/x/IwXWGQ

#OpenRefine #lobid #reconciliation #archive

Tools zum Einsatz der GND im Archiv - gnd - Deutsche Nationalbibliothek - Wiki

💡SODa InfoSnack #1: OpenRefine für die Datenbereinigung

Gefangen im Datensturm? Mit Excel fast am kentern? Mit diesem Tool schafft ihr euch Durchblick im Datenmeer:

🛟 OpenRefine ist der Rettungsring nach dem Datenschiffbruch & wir holen euch mit unserem Tutorial auf die MS SODa ⛴️:
Anleitungen & Übungen zu OpenRefine:
https://sammlungen.io/kb/daten-check-mit-openrefine?utm_campaign=coschedule&utm_source=mastodon&utm_medium=SODa%40fedihum.org

Für Fortgeschrittene haben wir ein kleines Cheat Sheet mit GREL Ausdrücken angefügt.

#SODaZentrum #OpenRefine #Daten

cont.:
"Working with collection partners and archives, this requires a working knowledge of #OpenRefine for data transformations and a basic knowledge of HTML, XML, and JSON to enrich existing metadata and fill in gaps where needed. Subject matter expertise in any particular field, as well as primary, secondary, or higher education would be enormously useful, and ideally also a working understanding of WCAG and digital accessibility best practices."
2/3

Need a #free tool to handle messy #data?

@OpenRefine runs locally and is trusted by journalists, researchers, & contributors worldwide.

See how this #opensource tool empowers a global community: https://lpi.org/0f1n

#LPI #FOSS #OpenRefine #opensource #datacleaning #dataprivacy #BSD #Wikidata @wikidata

想了解更多有關 #OpenRefine 的資訊,歡迎報名 9 月 8 - 11 日舉辦的 OpenRefine Barcamp 2025!
更多資訊可參閱:https://liker.social/@wikidatatw/114786927383315668
Wikidata Taiwan 臺灣維基數據社群 (@wikidatatw@liker.social)

Attached: 1 image 在 2025 年 9 月,來自全球的資料愛好者將齊聚 OpenRefine Barcamp 線上社群活動,一同探索資料清理、對齊工作與開放知識的無限可能。 OpenRefine 身為一款強大的開源資料處理工具,讓使用者得以將雜亂無章的表格,轉化為結構化、可視化且具知識鏈結性的資料。透過其內建的 Wikidata 對齊功能,使用者可將表格中的文字自動比對至 Wikidata 項目(item),不僅節省編輯時間,更提升了資料的語意層次與資料品質。 自 3.0 版起,OpenRefine 更提供了直接編輯 Wikidata 的能力。使用者可以將資料轉換為符合 Wikidata 標準的陳述,並選擇直接上傳至 Wikidata 或匯出為 QuickStatements 格式,進一步推動結構化開放知識的落地實踐。這項功能不只促進了編輯流程,也鼓勵更多資料貢獻者參與到 Wikidata 的建構之中。 此外,活動中也將展示許多教學資源與操作範例,新手能在活動中快速上手,老手則能深入挖掘進階技巧。從在 PAWS 雲端平台上執行 OpenRefine 到探索跨域資料的語意鏈結。 無論你是資料工程師、開放知識/開放資料倡議者,或是對 Wikidata 有濃厚興趣的好奇者,OpenRefine Barcamp 2025 都是一個讓人重新理解資料如何成為知識的場合。而透過 OpenRefine 與 Wikidata 的相輔相成,我們將更接近那個資料透明、可查詢、可再利用的理想世界。 活動完整資訊:https://openrefine.org/blog/2025/06/10/OpenRefine-2025-Barcamp #Wikidata #維基資料 #維基數據 #event #活動 #Online #線上活動 #OpenRefine #OpenRefineBarcamp #OpenRefineBarcamp2025

Liker.Social

OpenRefine 原為 #Metaweb 所開發的閉源工具,後來被 #Google 接手逐步轉型為開源專案。隨著 #Freebase 於 2013 年逐步停用並將內容轉入 Wikidata 後,OpenRefine 便轉為與 Wikidata 深度整合,填補了資料上傳基礎建設的空缺,並成為 Wikidata 編輯者不可或缺的利器。

這項整合不僅讓 OpenRefine 獲得新生,也促成了數百萬筆資料的貢獻,涵蓋 Wikidata、 #Wikibase 以及 Wikimedia Commons ( #維基共享資源 ) 等平台。透過 OpenRefine,使用者能夠批次清理、轉換並上傳結構化資料,大幅提升編輯效率與準確性。這種工具與社群的互動,展現了開源協作的力量,也讓更多人得以參與知識建構的過程。

在【OpenRefine: Data Workflow via Open Source Collaboration】中提到蘇格蘭巫術資料庫(Survey of Scottish Witchcraft)在整理歷史資料的同時,製作了一份 OpenRefine 教學,成為推廣 Wikidata 整合的入門資源。使該專案不僅是資料處理的實例,更能文化保存與教育推廣的典範。

OpenRefine 的專案經理 Martin Magdinier 表示,與 Wikimedia 的合作是 OpenRefine 發展歷程中的轉捩點。這段歷程不只是技術上的演進,更是社群參與與開源精神的具體展現。

完整原文:https://www.lpi.org/zh-hant/blog/2025/06/25/openrefine-data-workflow-via-open-source-collaboration/

#Wikidata #維基資料 #維基數據
#OpenRefine

在 2025 年 9 月,來自全球的資料愛好者將齊聚 OpenRefine Barcamp 線上社群活動,一同探索資料清理、對齊工作與開放知識的無限可能。

OpenRefine 身為一款強大的開源資料處理工具,讓使用者得以將雜亂無章的表格,轉化為結構化、可視化且具知識鏈結性的資料。透過其內建的 Wikidata 對齊功能,使用者可將表格中的文字自動比對至 Wikidata 項目(item),不僅節省編輯時間,更提升了資料的語意層次與資料品質。

自 3.0 版起,OpenRefine 更提供了直接編輯 Wikidata 的能力。使用者可以將資料轉換為符合 Wikidata 標準的陳述,並選擇直接上傳至 Wikidata 或匯出為 QuickStatements 格式,進一步推動結構化開放知識的落地實踐。這項功能不只促進了編輯流程,也鼓勵更多資料貢獻者參與到 Wikidata 的建構之中。

此外,活動中也將展示許多教學資源與操作範例,新手能在活動中快速上手,老手則能深入挖掘進階技巧。從在 PAWS 雲端平台上執行 OpenRefine 到探索跨域資料的語意鏈結。

無論你是資料工程師、開放知識/開放資料倡議者,或是對 Wikidata 有濃厚興趣的好奇者,OpenRefine Barcamp 2025 都是一個讓人重新理解資料如何成為知識的場合。而透過 OpenRefine 與 Wikidata 的相輔相成,我們將更接近那個資料透明、可查詢、可再利用的理想世界。

活動完整資訊:https://openrefine.org/blog/2025/06/10/OpenRefine-2025-Barcamp

#Wikidata #維基資料 #維基數據
#event #活動
#Online #線上活動
#OpenRefine #OpenRefineBarcamp #OpenRefineBarcamp2025

#Pattypan n'est pas du tout obsolète. Y'a des doutes sur le futur car les développeurs se sont engueulés suite au financement de l'Abes. Mais le logiciel est très simple, donc il devrait pas avoir besoin de beaucoup de développement dans les prochaines années. Et #OpenRefine pour Commons nécessite un TAS de compétences.