https://winbuzzer.com/2026/06/25/openai-and-broadcom-unveil-jalapeo-ai-inference-chip-xcxwbn/

OpenAI and Broadcom have unveiled Jalapeño, a custom AI inference chip for OpenAI workloads, with late-2026 deployment planned and benchmarks still pending.

#AI #Jalapeno #Broadcom #OpenAI #AIInference #AIChips #AIInfrastructure #AICompute

#Baseten, a San Francisco-based company, is raising $1.5bn in a dual-tiered #funding round valuing it at up to $13bn. The company provides software and computing capacity for businesses to run #AIinference, primarily using cheaper #opensource models. This funding round comes amid a surge in demand for AI inference infrastructure and a price war in the open-source model market. https://thenextweb.com/news/baseten-1-5bn-round-13bn-valuation-ai-inference?eicker.news #tech #media #news
Baseten is raising $1.5bn at up to $13bn, betting AI’s profits lie in cheap inference

Baseten is finalising a $1.5bn funding round that values the company at up to $13bn. The structure is almost as notable as the size. The round is dual-tiered, with some investors buying in at an $11bn valuation and others at $13bn, according to the company via the Wall Street Journal. It is a tactic a […]

The Next Web

https://winbuzzer.com/2026/06/19/microsoft-expands-y-combinator-ai-startup-access-xcxwbn/

Microsoft and Y Combinator have expanded Azure, Foundry, GPU, credit, and sales-channel access for AI founders facing production infrastructure demands.

#AI #MicrosoftFoundry #YCombinator #AIStartups #Microsoft #MicrosoftAzure #AzureAI #AICompute #AIInference

Baseten, a startup helping companies run AI models efficiently, is about to secure a massive $1.5 billion investment at a $13 billion valuation. This comes only five months after it raised $300 million at a $5 billion valuation. The jump in valuation is staggering, but there’s...

#AI #AIFunding #AIInference #Baseten #TechStartups

https://code-n-clarity.blogspot.com/2026/06/baseten-nears-15-billion-funding-round.html

Baseten nears $1.5 billion funding round just months after its last one

Latest tech news, AI breakthroughs, and big product launches—fast, sharp, and straight to the point. Stay ahead of what’s shaping tech.

Trained a model in PyTorch or TensorFlow and now dreading the production deployment gap? OpenVINO converts it to an optimized IR and runs it on Intel CPUs, GPUs, or NPUs with INT8 quantization and LLM compression built in. Full specs in the next tweet. #AIInference

https://winbuzzer.com/2026/06/07/ai-water-demand-could-match-13-billion-people-by-2030-xcxwbn/

UN researchers estimate AI data centers could use water equal to 1.3 billion people's annual needs by 2030 as electricity and land pressures grow.

#AI #AIInfrastructure #DataCenters #AICompute #AIInference #Environment #CarbonFootprint #CarbonEmissions

RT @Bassmaster187: Ich habe mich doch entschlossen, die Intel Arc Pro B70 32GB zurückzugeben und für ein paar Euro mehr die AMD R9700 zu nehmen. An vielen Stellen ist die Intel abgestürzt und bei komplexen Kontexten extrem langsam geworden. Die R9700 ist teilweise beim Prompt-Processing und der Token-Generierung 10-mal schneller und vor allem scheint sie extrem stabil zu sein. Die speziellen HIP (ROCm)-Treiber scheinen nicht schneller zu sein als die Standard-Vulkan-Treiber, sodass ich sogar noch Hoffnung habe, dass sich das in Zukunft noch verbessert. Laut Logfiles habe ich letzten Monat ca. 150 € als Sonnet-4.6-Äquivalent gespart, sodass sich die Investition recht schnell auszahlt. Vielleicht werde ich unvernünftig und kaufe noch eine zweite... Bei Standard-Aufgaben geht Qwen3.6 35B mit Q5-Quantisierung teilweise schneller und besser als Sonnet 4.6. Schade, die Intel wäre echt cool gewesen, aber die Treiber und Software sind sehr schlecht.

mehr auf Arint.info

#AIInference #AMDRyzen #GPUHardware #HardwareComparison #IntelArc #TechReview #arint_info

https://x.com/Bassmaster187/status/2062955535775715641#m

Arint - SEO+KI (@[email protected])

<p>RT @Bassmaster187: Ich habe mich doch entschlossen, die Intel Arc Pro B70 32GB zurückzugeben und für ein paar Euro mehr die AMD R9700 zu nehmen. An vielen Stellen ist die Intel abgestürzt und bei komplexen Kontexten extrem langsam geworden. Die R9700 ist teilweise beim Prompt-Processing und der Token-Generierung 10-mal schneller und vor allem scheint sie extrem stabil zu sein. Die speziellen HIP (ROCm)-Treiber scheinen nicht schneller zu sein als die Standard-Vulkan-Treiber, sodass ich sogar noch Hoffnung habe, dass sich das in Zukunft noch verbessert. Laut Logfiles habe ich letzten Monat ca. 150 € als Sonnet-4.6-Äquivalent gespart, sodass sich die Investition recht schnell auszahlt. Vielleicht werde ich unvernünftig und kaufe noch eine zweite... Bei Standard-Aufgaben geht Qwen3.6 35B mit Q5-Quantisierung teilweise schneller und besser als Sonnet 4.6. Schade, die Intel wäre echt cool gewesen, aber die Treiber und Software sind sehr schlecht.</p> <p><a href="https://arint.info/@Arint/116708245308721547">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AIInference #AMDRyzen #GPUHardware #HardwareComparison #IntelArc #TechReview #arint_info</p> <p><a href="https://x.com/Bassmaster187/status/2062955535775715641#m">https://x.com/Bassmaster187/status/2062955535775715641#m</a></p>

Mastodon Glitch Edition

https://winbuzzer.com/2026/06/03/perplexity-tests-ai-pc-privacy-with-local-cloud-router-xcxwbn/

Perplexity's new local-cloud AI router decides when work stays on a PC or moves to cloud models, making task classification the launch's privacy test.

#AI #PerplexityAI #AIInference #OnDeviceAI #AIAgents #AgenticAI #AICompute #AIPrivacy #HybridCloud