RT @vllm_project: TRANSLASATION: vLLM v0.22.0 ist verfügbar! 459 Commits von 230 Mitwirkenden (63 neue). 🎉

mehr auf Arint.info

#AI #CUDA #DeepSeek #LLM #Rust #vLLM #arint_info

https://x.com/vllm_project/status/2060751889336291535#m

Arint - SEO+KI (@[email protected])

<p>RT @vllm_project: TRANSLASATION: vLLM v0.22.0 ist verfügbar! 459 Commits von 230 Mitwirkenden (63 neue). 🎉</p> <p><a href="https://arint.info/@Arint/116667198311017328">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AI #CUDA #DeepSeek #LLM #Rust #vLLM #arint_info</p> <p><a href="https://x.com/vllm_project/status/2060751889336291535#m">https://x.com/vllm_project/status/2060751889336291535#m</a></p>

Mastodon Glitch Edition

RT @4thinfected: Okay, in letzter Zeit bin ich total in DeepSeek verliebt. Dann bin ich auf CrofAI gestoßen und das ist bisher das günstigste Angebot für DeepSeek V4 Pro, das ich gefunden habe.

mehr auf Arint.info

#AI #DeepSeek #KünstlicheIntelligenz #MachineLearning #OpenSource #Tech #arint_info

https://x.com/4thinfected/status/2060593000149868830#m

Arint - SEO+KI (@[email protected])

<p>RT @4thinfected: Okay, in letzter Zeit bin ich total in DeepSeek verliebt. Dann bin ich auf CrofAI gestoßen und das ist bisher das günstigste Angebot für DeepSeek V4 Pro, das ich gefunden habe.</p> <p><a href="https://arint.info/@Arint/116667196269790123">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AI #DeepSeek #KünstlicheIntelligenz #MachineLearning #OpenSource #Tech #arint_info</p> <p><a href="https://x.com/4thinfected/status/2060593000149868830#m">https://x.com/4thinfected/status/2060593000149868830#m</a></p>

Mastodon Glitch Edition

An investigation by GPTZero revealed that a 2025 cyber security report on loyalty fraud published by EY Canada is heavily filled with AI-hallucinated fake references and inaccurate statistics, and almost all of the provided URLs are broken.

https://gptzero.me/investigations/ey

#news #tech #technology #AI #deepseek #openai #chatgpt #grok #aislop #nvidia

Investigation: Hallucinations in Ernst & Young Report on Loyalty Fraud | GPTZero

An investigation into fabricated citations and broken references in EY's "Points of Attack" cybersecurity report on loyalty system fraud.

#DeepSeek’s radical architecture, particularly its cache-optimised models, is #disrupting the enterprise #AImarket. The company’s 75% price cut on its flagship #V4Pro model, which is 7x cheaper on inputs and 17x cheaper on outputs than comparable Western models, is forcing a reevaluation of the #tokencostcrisis. This #deflationarypressure, coupled with DeepSeek’s open-weight architecture, is leading to a bifurcation of the market. https://venturebeat.com/infrastructure/how-deepseeks-radical-architecture-is-shattering-silicon-valleys-token-moat?AIagents.at #AIagent #AI #ML #NLP #LLM #GenAI

Как заставить ИИ играть по правилам ролевой системы: архитектура авторитарного бэкенда для AI RPG

Сделать текстовую игру на базе LLM легко, если вас устраивает бесконечный неконтролируемый чат, который ломается через 30 ходов из-за модельного дрейфа и амнезии. Сделать полноценную RPG с детерминированными механиками, инвентарём, картой-графом и пермадезом — инженерная задача. Ниже — подробный разбор архитектурных решений, юнит-экономики, борьбы с гонками данных и инфраструктурных грабель, собранных при разработке проекта «Стирая Грань» (Beyond The Verge) — полностью русскоязычной AI RPG на стеке FastAPI + PostgreSQL/pgvector + Flutter Web.

https://habr.com/ru/articles/1041222/

#python #fastapi #pgvector #flutter #искусственный_интеллект #rag #deepseek #embeddings #dnd #разработка_игр

Как заставить ИИ играть по правилам ролевой системы: архитектура авторитарного бэкенда для AI RPG

TL;DR Сделать текстовую игру на базе LLM легко, если вас устраивает бесконечный неконтролируемый чат, который ломается через 30 ходов из-за модельного дрейфа и амнезии. Сделать полноценную RPG с...

Хабр

100% #AI generated #web #arcade games? Here’s a website where you can try some of them:
https://ultimateplay.com/games/geometry-dash

#game #play #fun #platform #racing #beatemup #gpt #claude #mistral #deepseek

UltimatePlay | Upload a self-contained HTML game, discover the best vibe-coded experiments, and play them instantly in the browser.

Upload a self-contained HTML game, discover the best vibe-coded experiments, and play them instantly in the browser.

DeepSeek makes price cuts permanent - Asian Tech Roundup

Welcome to Computing's weekly roundup of tech news in Asia. This time we look at the AI price war, SK Hynix joining the trillion-dollar club ...

Gemini-3.5-flash догнал GPT-5.5 на 97/S и в 2.5× дешевле. Но главное — китайцы выигрывают по цене и качеству

Месяц назад я писал про парадокс DeepSeek V4 Pro — модель проиграла собственному Flash и Qwen 3.6 Plus трёхнедельной давности. Сегодня прогнал свежий battle на пяти моделях — два американских флагмана и три китайских — и расклад снова поменялся. Главное: Gemini-3.5-flash взял 97/S, тот же балл, что у GPT-5.5, и в 2.5 раза дешевле. Google впервые на моём тесте встал рядом с OpenAI на длинном русском контенте. Tencent Hy3-preview даёт A-tier за $0.0017 за вызов — в 134 раза дешевле GPT-5.5. DeepSeek V4 Pro я прогнал третий раз — качество стоит на месте (87), но цена упала в 5.4× и она снова в зоне полезного. Qwen 3.7 Max упорно вставляет китайские иероглифы в русский текст — регрессия относительно собственной 3.6, где этой проблемы не было. По дороге заметил, что наша формула cost_per_call жила полгода с приближением, которое занижало стоимость на 50–140%. Починили — теперь берём реальные токены из OpenRouter response.usage . И отдельно — почему при такой скорости релизов модель в продукте стоит держать заменяемой, а не зашитой в код намертво.

https://habr.com/ru/articles/1040770/

#LLM #Gemini #gpt5 #DeepSeek #Qwen #Tencent #Benchmarks #AI #OpenRouter #Russian_NLP

Gemini-3.5-flash догнал GPT-5.5 на 97/S и в 2.5× дешевле. Но главное — китайцы выигрывают по цене и качеству

Главная новость месяца — китайцы перестали быть «дешёвой альтернативой» и стали реальным конкурентом США по соотношению цена/качество. По чистому качеству американцы пока впереди, но по соотношению...

Хабр

RT @ArtificialAnlys: Artificial Analysis and IBM Research are launching ITBench-AA, the first in a new series of benchmarks evaluating models on agentic enterprise IT tasks, starting with Site Reliability Engineering tasks where frontier models score below 50% ITBench-AA’s SRE tasks benchmark model performance on Kubernetes incident response, where models must diagnose live systems by reading logs, tracing dependencies, and identifying root-cause entities across complex infrastructure. The underlying ITBench dataset has been developed by @IBM's Software Innovation Lab, leveraging IBM’s deep expertise in enterprise IT operations Artificial Analysis has worked closely with IBM over the last 6 months to develop a implementation of the dataset for frontier AI evaluation, beginning with Site Reliability Engineering (SRE) and expanding to Financial Operations (FinOps) and Chief Information Security Officer (CISO) tasks over time ITBench-AA SRE overview: ➤ 59 SRE tasks in total: 40 public tasks and 19 brand new, held-out tasks ➤ Each task provides a Kubernetes incident snapshot containing alerts, events, traces, metrics, logs, and application topology. The model must identify the minimal set of independent root-cause Kubernetes entities responsible for the incident ➤ Faults span typical SRE failure modes including infrastructure, service, application, and chaos-injected incidents, such as resource quota exhaustion, rollout failures, connection pool exhaustion, and network partitions Methodology details: ➤ Agentic harness: each task is solved by the model running in our open-source Stirrup referenc…

mehr auf Arint.info

#Claude #DeepSeek #Gemini #GPT5 #Kubernetes #Qwen37 #arint_info

https://x.com/ArtificialAnlys/status/2059698327235805258#m

Arint - SEO+KI (@[email protected])

<p>RT @ArtificialAnlys: Artificial Analysis and IBM Research are launching ITBench-AA, the first in a new series of benchmarks evaluating models on agentic enterprise IT tasks, starting with Site Reliability Engineering tasks where frontier models score below 50% ITBench-AA’s SRE tasks benchmark model performance on Kubernetes incident response, where models must diagnose live systems by reading logs, tracing dependencies, and identifying root-cause entities across complex infrastructure. The underlying ITBench dataset has been developed by @IBM's Software Innovation Lab, leveraging IBM’s deep expertise in enterprise IT operations Artificial Analysis has worked closely with IBM over the last 6 months to develop a implementation of the dataset for frontier AI evaluation, beginning with Site Reliability Engineering (SRE) and expanding to Financial Operations (FinOps) and Chief Information Security Officer (CISO) tasks over time ITBench-AA SRE overview: ➤ 59 SRE tasks in total: 40 public tasks and 19 brand new, held-out tasks ➤ Each task provides a Kubernetes incident snapshot containing alerts, events, traces, metrics, logs, and application topology. The model must identify the minimal set of independent root-cause Kubernetes entities responsible for the incident ➤ Faults span typical SRE failure modes including infrastructure, service, application, and chaos-injected incidents, such as resource quota exhaustion, rollout failures, connection pool exhaustion, and network partitions Methodology details: ➤ Agentic harness: each task is solved by the model running in our open-source Stirrup referenc…</p> <p><a href="https://arint.info/@Arint/116651621088095495">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#Claude #DeepSeek #Gemini #GPT5 #Kubernetes #Qwen37 #arint_info</p> <p><a href="https://x.com/ArtificialAnlys/status/2059698327235805258#m">https://x.com/ArtificialAnlys/status/2059698327235805258#m</a></p>

Mastodon Glitch Edition