Mastodawn

Ожидание: сделать ИИ-примерочную обоев за 2 дня. Реальность: пришлось добучать свою модель на SD

В условиях жесткой конкуренции на рынке отделочных материалов любому магазину жизненно необходимо хоть какое-то осязаемое преимущество. Стандартными каталогами и скидками уже никого не удивить. Так у нас родилась идея: сделать онлайн-примерочную обоев. Кажется, звучит как киллер-фича — дать клиенту возможность до покупки увидеть, как конкретный паттерн будет смотреться в его реальном интерьере. На тот момент на рынке вовсю хайповали генеративные модели (такие как «Nano Banana»). На первый взгляд казалось, что проблема решается в два клика. План был надежен, как швейцарские часы: получить API-ключ, отправить по эндпоинту фотографию интерьера и текстуру обоев, сопроводить это правильным промптом (с указанием учитывать перспективу, освещение и масштаб) и забирать готовый результат. Но на практике оказалось, что задача не просто нетривиальная. Она вскрыла целый пласт проблем, о которых создатели популярных генеративок предпочитают умалчивать.

https://habr.com/ru/articles/1039804/

#computer_vision #stable_diffusion #нейросети #finetuning #ecommerce #визуализация_интерьеров #chatgpt

Ожидание: сделать ИИ-примерочную обоев за 2 дня. Реальность: пришлось добучать свою модель на SD

Хабр

sayzard 23h ago

Eric Building... (@outsource_)

Unsloth의 QLoRA 구현이 단일 GPU에서 27B급 모델 학습을 실제로 가능하게 만든다는 평가입니다. LLM 파인튜닝 실무에서 메모리 효율과 비용 측면의 가치가 큰 도구로 언급됩니다.

https://x.com/outsource_/status/2059043072537731273

#unsloth #qlora #finetuning #llm #gpu

Eric ⚡️ Building... (@outsource_) on X

@TechMDAI yes @UnslothAI Their QLoRA implementation is what makes single-GPU 27B training actually viable:

X (formerly Twitter)

sayzard 3d ago

Customizing an LLM for Enterprise Software Engineering

이 논문은 Google 내부 소프트웨어 엔지니어링 환경에 특화된 LLM인 Gemini for Google(GfG)을 소개합니다. 1조 토큰 규모의 독점 데이터셋으로 미세조정하며, 중간 학습 전략으로 치명적 망각 문제를 완화했습니다. 29,000명 개발자를 대상으로 한 대규모 A/B 테스트에서 Gemini for Google은 반복 횟수를 23% 줄이고 코드 유지율을 17% 향상시켰습니다. 또한, 기업 내 엔지니어링 데이터 활용을 위한 신호 추출, 데이터 준비, 전 과정 모델 튜닝, 하위 응용 배포 등 실무적 가이드라인을 제공합니다. 이는 기업 맞춤형 LLM 개발의 모범 사례로 활용될 수 있습니다.

https://arxiv.org/abs/2605.16517

#llm #enterprise #softwareengineering #finetuning #modeladaptation

Customizing an LLM for Enterprise Software Engineering

Enterprise software development is a continuous evolutionary process, characterized by incremental additions, architectural revisions, production deployments and rigorous maintenance. These activities generate valuable data that modern LLMs could be finetuned on, to unlock additional tool possibilities for enterprise software engineering. While frontier LLMs are already very capable, this form of customization offers a compelling path for enterprise-specific optimization. We introduce Gemini for Google (GfG)}, an adaptation of Gemini specialized for Google's internal software engineering ecosystem. This paper details the model's end-to-end development, from curating a trillion-token proprietary dataset to implementing a mid-training strategy that mitigates catastrophic forgetting. In a large-scale blind A/B study across 29,000 developers, Gemini for Google significantly outperformed baselines: reducing the mean number of iterations per turn by 23\%, and increasing code survival rates by about 17%. Beyond metrics, we provide a comprehensive blueprint for enterprise model adaptation, covering: (1)The extraction of high-value signals from software engineering data, (2)Data preparation strategies, (3)Full-stack model tuning (continued pre-training and post-training), and (4)The deployment of downstream applications. We believe this methodology offers a replicable path for other organizations to unlock the full potential of their internal engineering data.

arXiv.org

Chema Alonso

4d ago

El lado del mal - Cómo optimizar el gasto en IA con arquitecturas clasificadas, orquestadas y/o destilación. El problema de la Predictibilidad de los Costes de la IA https://www.elladodelmal.com/2026/05/como-optimizar-el-gasto-en-ia-con.html #IA #AI #Costes #Presupuesto #Optimización #Prompting #ArquitecturaSW #Destilación #FineTuning #MachineLearning

Cómo optimizar el gasto en IA con arquitecturas clasificadas, orquestadas y/o destilación. El problema de la Predictibilidad de los Costes de la IA

Blog personal de Chema Alonso ( https://MyPublicInbox.com/ChemaAlonso ): Ciberseguridad, IA, Innovación, Tecnología, Cómics & Cosas Personasles.

sayzard 4d ago

Python Trending (@pythontrending)

Meta Segment Anything Model 3(SAM 3)에 대해 추론과 파인튜닝 코드를 제공하는 저장소를 소개한다. 체크포인트 다운로드 링크와 예제 노트북도 포함되어 있어, 세그멘테이션 모델을 실험하거나 재학습하려는 개발자에게 실용적이다.

https://x.com/pythontrending/status/2057784657341464747

#sam3 #meta #segmentation #finetuning #inference

Python Trending 🇺🇦 (@pythontrending) on X

sam3 - The repository provides code for running inference and finetuning with the Meta Segment Anything Model 3 (SAM 3), links for downloading the trained model checkpoints, and example notebooks t... https://t.co/FVZAnT8Oxa

X (formerly Twitter)

sayzard 4d ago

Future Niel (@neil_in_past)

13B 규모의 액티브 모델에 너무 어려운 작업을 맡기지 말고, 작은 하위 작업을 수행하게 한 뒤 프런티어 모델이 전체 작업을 제어하고 검증하는 방식이 더 적합하다는 실무적 조언입니다. 에이전트/오케스트레이션 설계에 참고할 만한 패턴입니다.

https://x.com/neil_in_past/status/2057994819818094877

#llm #agents #orchestration #frontiermodel #finetuning

Future Niel (@neil_in_past) on X

@elok_lam @Hangsiin @deepseek_ai @opencode @Kimi_Moonshot You can't expecting a 13B active model to do somethin hard. Make it do small things and let the frontier model control and verify the work.

X (formerly Twitter)

sayzard 4d ago

beccu (@BeccuStudio)

Krea AI의 K2에서 LoRA를 섞어 사용해보는 짧은 실험 공유입니다. 생성형 이미지 모델을 조합·스타일 혼합하는 실무적 시도로 볼 수 있습니다.

https://x.com/BeccuStudio/status/2057901629496840625

#krea #loras #imagegeneration #finetuning

beccu (@BeccuStudio) on X

mixing loras w K2 @krea_ai

X (formerly Twitter)

sayzard 5d ago

Krea (@krea_ai)

Krea 2에 LoRA 기반 파인튜닝 기능(beta)을 도입. 사용자가 자신의 스타일, 객체, 캐릭터에 맞춰 Krea 2를 정밀하게 학습시킬 수 있는 시스템으로, 이미지 생성/커스텀 모델 워크플로우에서 실무 활용성이 높은 업데이트다.

https://x.com/krea_ai/status/2057468861583347774

#krea #lora #finetuning #generativeai #image

Krea (@krea_ai) on X

introducing LoRAs for Krea 2 (beta). our most powerful fine-tuning system to date; now you can train Krea 2 on a your own specific style, object, or character with incredible precision. learn how it works 👇

X (formerly Twitter)

sayzard May 20

Akshay (@akshay_pachaar)

TransformerLab이 공개되었습니다. 어떤 클라우드의 GPU든 오케스트레이션해 사용자가 정의한 학습·평가 워크플로를 실행할 수 있는 오픈소스 플랫폼으로, LoRA/DPO/GRPO, MMLU, HellaSwag용 템플릿을 제공합니다. GUI, CLI, 에이전트 스킬로 사용할 수 있습니다.

https://x.com/akshay_pachaar/status/2057078059833200912

#transformerlab #llm #finetuning #gpu #opensource

Akshay 🚀 (@akshay_pachaar) on X

The Operating System for Al Research Labs. TransformerLab orchestrates GPUs across any cloud and runs any training or eval workflow you define Pre-built templates for LoRA, DPO, GRPO, MMLU, HellaSwag. Use it from a GUI, CLI, or agent skill. 100% open-source and FREE to use.

X (formerly Twitter)

sayzard May 20

Brie Wensleydale (@SlipperyGem)

Kijai가 LTX 2.3 OmniNFT LoRA의 새 버전을 공개했다는 내용. LoRA 기반 확장 모델 업데이트로 보이며, LTX 계열 워크플로우를 사용하는 생성형 비디오/이미지 실무자들에게 참고할 만한 릴리스다.

https://x.com/SlipperyGem/status/2056900640698142989

#ltx #lora #finetuning #generativeai #modelupdate

Brie Wensleydale🧀🐭 (@SlipperyGem) on X

Kijai's new version of the LTX 2.3 OmniNFT lora.

X (formerly Twitter)