Sample vs Full File Explained
This page explains exactly what the sample file is, how it relates to the full file, and what you should and should not expect.
Sample vs Full File Explained
This page explains exactly what the sample file is, how it relates to the full file, and what you should and should not expect.
TONL là định dạng dữ liệu mới, hứa hẹn giảm tới 50% token so với JSON, tối ưu cho kỷ nguyên AI/LLM. Được Ersin Koç phát triển, TONL giúp tiết kiệm chi phí và tăng hiệu quả xử lý dữ liệu cho các mô hình ngôn ngữ lớn. Dễ đọc, hỗ trợ schema và khả năng truy vấn. Mới ra mắt nhưng rất đáng để tìm hiểu!
#TONL #DataFormat #AI #LLM #TokenEfficiency
#ĐịnhDạngDữLiệu #TríTuệNhânTạo #TiếtKiệmToken
F3: Open-source data file format for the future [pdf]
https://db.cs.cmu.edu/papers/2025/zeng-sigmod2025.pdf
#HackerNews #F3 #Open #Source #Data #Future #PDF #DataFormat #Innovation
F3: Định dạng file dữ liệu nguồn mở cho tương lai. F3 là định dạng file dữ liệu mới được giới thiệu nhằm trở thành tiêu chuẩn cho tương lai. Dự án này hứa hẹn mang lại hiệu suất và tính linh hoạt cao hơn trong việc xử lý dữ liệu. #OpenSource #F3 #DataFormat #ĐịnhDạngNguồnMở #TươngLaiDữLiệu
Gee I hate it when websites offer a download of tabular data in PDF or Word format!!!
I am looking at you Australian Federal Government. Not even offering that data in .xslx format, let alone a simple .CSV???
I want to spend my time analysing the data not getting it into a machine readable format and rectifying errors due to formatting problems.
#DataFormat
I understand that it is alluring to publish a slideshow as HTML file. But if a browser cuts off words at the bottom of slides because I use a different browser (or different default font, or whatever other setting) than expected, the HTML format fails at its main goal: showing the content.
In my experience, PDFs are really a more compatible and appropriate format for publishing slideshows.
CC: @gvwilson
Brief searching hasn’t turned up anything, so I’ll ask here.
Is there a general data format that is
- both human and computer friendly, ideally
- extensible - base file, extended by one or more optional files
- layered - additional data can accurately reference the contents of the base data, or any other layer, to create/add/update/delete, and result in a final merged document
- useful for combining text (instructions, story), as well as automation (scripting)