#HuggingFace Contributes #Safetensors To #PyTorchFoundation To Secure #AI Model Execution
Safetensors is a file format for storing and loading model weights while avoiding the risk of arbitrary code execution and security shortcomings of other formats like Pickle while also offering better performance and robust compatibility.
#PyTorch Foundation, which is an umbrella organization under the #LinuxFoundation for hosting AI initiatives.
https://www.phoronix.com/news/PyTorch-Safetensors
Hugging Face Contributes Safetensors To PyTorch Foundation To Secure AI Model Execution

Announced today from the PyTorch Conference EU in Paris is word that Hugging Face has contributed their Safetensors project to the PyTorch Foundation, which is an umbrella organization under the Linux Foundation for hosting AI initiatives

Реставрация ruGPT-3 XL или как я вернул к жизни забытую русскую языковую модель

Несколько дней к ряду я занимался реставрацией легаси модели ai-forever/rugpt3xl , это классическая языковая модель от SberDevices на 1.3B параметров, крошка по современным меркам, на которой сберовцы обкатывали свои научные наработки аж в далёком 2021м году. Подробнее о ней можно почитать в статье “A family of pretrained transformer language models for Russian” на Google Scholar. Да, она foundation, то есть умеет только продолжать текст, не может выполнять инструкции или работать в режиме чата. Но обучена она на корпусе русского языка и этот самый русский генерит очень бодро. У неё есть две примечательные особенности: её обучали с нуля, архитектура представляет собой глубокую модификацию GPT-2.

https://habr.com/ru/articles/1016148/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1016148

#rugpt3 #реставрация #нейросеть #gguf #safetensors #python #ollama #huggingface #модель #llm

Реставрация ruGPT-3 XL или как я вернул к жизни забытую русскую языковую модель

Несколько дней к ряду я занимался реставрацией легаси модели ai-forever/rugpt3xl , это классическая языковая модель от SberDevices на 1.3B параметров, крошка по современным меркам, на которой сберовцы...

Хабр

Реставрация ruGPT-3 XL или как я вернул к жизни забытую русскую языковую модель

Несколько дней к ряду я занимался реставрацией легаси модели ai-forever/rugpt3xl , это классическая языковая модель от SberDevices на 1.3B параметров, крошка по современным меркам, на которой сберовцы обкатывали свои научные наработки аж в далёком 2021м году. Подробнее о ней можно почитать в статье “A family of pretrained transformer language models for Russian” на Google Scholar. Да, она foundation, то есть умеет только продолжать текст, не может выполнять инструкции или работать в режиме чата. Но обучена она на корпусе русского языка и этот самый русский генерит очень бодро. У неё есть две примечательные особенности: её обучали с нуля, архитектура представляет собой глубокую модификацию GPT-2.

https://habr.com/ru/articles/1016148/

#rugpt3 #реставрация #нейросеть #gguf #safetensors #python #ollama #huggingface #модель #llm

Реставрация ruGPT-3 XL или как я вернул к жизни забытую русскую языковую модель

Несколько дней к ряду я занимался реставрацией легаси модели ai-forever/rugpt3xl , это классическая языковая модель от SberDevices на 1.3B параметров, крошка по современным меркам, на которой сберовцы...

Хабр

Ithaca Pengu (@IthacaNFT)

사용자가 설치 후 첫 실행에서 safetensors 포맷 파일이 27.1GB 크기로 다운로드되고 있음을 보고했습니다. 모델 파일이 큰 경우 초기 다운로드 및 저장공간·로딩 시간 이슈가 발생할 수 있음을 시사합니다(구체적 모델명은 언급 없음).

https://x.com/IthacaNFT/status/2009432543519457459

#safetensors #model #download #filesize

Ithaca Pengu 🐧✳️ (@IthacaNFT) on X

@cocktailpeanut I just installed it and it’s showing 27.1 gb for the safetensors file that it’s downloading on the first run

X (formerly Twitter)
Just merged in metadata override for adding custom authorship information to #gguf metadata in https://github.com/ggerganov/llama.cpp/issues/7165 . If you are a model weight distributor, you may want to note this so that your models are easier to search for in #huggingface
#AI #LLMs #llama_cpp #safetensors
Add metadata override and also generate dynamic default filename when converting gguf · Issue #7165 · ggerganov/llama.cpp

This is a formalized ticket for this PR #4858 so people are aware and can contribute to figuring out if this idea makes sense... and if so then what needs to be done before this can be merged in fr...

GitHub

Proposing adding metadata override and a default naming scheme for generated files when converting #safetensors to #gguf.

Requesting feedback if what I got makes sense for everyone https://github.com/ggerganov/llama.cpp/issues/7165

This is most relevant for model creators
#LLMs #llama_cpp #llamafiles #AI

Add metadata override and also generate dynamic default filename when converting gguf · Issue #7165 · ggerganov/llama.cpp

This is a formalized ticket for this PR #4858 so people are aware and can contribute to figuring out if this idea makes sense... and if so then what needs to be done before this can be merged in fr...

GitHub