Python Trending (@pythontrending)
Anthropic-Cybersecurity-Skills 데이터셋이 공개되었습니다. AI 에이전트를 위한 754개의 구조화된 사이버보안 스킬을 제공하며, MITRE ATT&CK, NIST CSF 2.0, MITRE ATLAS, D3FEND, NIST AI RMF 등 5개 프레임워크에 매핑되어 있어 보안 에이전트·평가·워크플로 설계에 활용할 수 있습니다.
A Dataset of AI-generated poscasts by @jilltxt
https://dataverse.no/dataset.xhtml?persistentId=doi:10.18710/RNTF9H
Certainly a new way of looking at your digital content -- especially the blank Untitled.pdf ;)
#DH #DigitalHumanities #Dataset #ContentAnalysis #Authenticity #LLM #GenAI #WTFPDF
ICLR 2026 – Institutional Affiliations Dataset and Analysis
ICLR 2026 학회에서 발표된 5,356편의 논문을 대상으로 PDF에서 직접 추출한 저자 소속 기관 데이터를 정제하여 공개하는 오픈소스 파이프라인과 데이터셋이 공개되었다. 이 데이터셋은 OpenReview 프로필 기반 소속 정보의 오류를 방지하며, 기관별 논문 수를 기준으로 한 시각화 차트도 제공한다. 파이프라인은 PDF 파싱, 정규화, 시각화까지 전 과정을 포함하며, 연구자와 AI 엔지니어가 기관별 연구 동향을 분석하는 데 유용하다. 깃허브에서 소스코드와 데이터셋을 확인하고 재현할 수 있다.
https://github.com/DmytroLopushanskyy/iclr2026-affiliations
#dataset #pdfparser #iclr #bibliometrics #machinelearningresearch

PDF-derived institutional affiliations for 5,356 ICLR 2026 accepted papers — full pipeline (scrape → parse → render), clean dataset (CSV + XLSX), and treemap charts. - DmytroLopushanskyy/iclr2026-a...
antirez (@antirez)
imatrix에서 더 많은 tool calls를 반영하는 변경을 병합하고, 데이터셋 확장도 시도한다는 내용입니다. imatrix 생성은 더 느려지지만, 가끔만 수행해도 되는 작업이라 문제없다고 언급해 개발 도구/처리 파이프라인 개선에 해당합니다.

@jedisct1 @StirlingForge @ivanfioravanti Whatever happened, more tool calls in the imatrix is a good idea :) I'm merging the change and also trying to extend the dataset. Generating the imatrix will be slower than ever but it's something we could do only from time to time, so it's fine.
Project Aria @Meta (@meta_aria)
Aria Gen 2 Pilot Dataset(A2PD)가 공개되었습니다. 청소, 요리, 야외 산책 등 인간-환경 상호작용을 폭넓게 담은 데이터셋으로, Aria Gen 2 센서 스위트의 원시 센서 스트림을 포함해 모델 성능 향상과 멀티모달 연구에 활용될 수 있습니다.

Level up your models with the Aria Gen 2 Pilot Dataset. 🚀 The Aria Gen 2 Pilot Dataset (A2PD) provides a holistic view of human-environment interaction, from cleaning and cooking to outdoor walks all on the Aria Gen 2 sensor suite. A2PD includes: 🔹Raw sensor streams