Adria Blancafort (@adriablancafort)

주말 동안 LLM을 처음부터 직접 학습했고, 8xH100 노드를 4시간 임대하는 데 $100만 사용했음에도 결과가 놀랍다고 보고했습니다. Karpathy의 nanochat에서 영감을 받았으며 더 상세한 기사와 소스 코드를 댓글에 공개할 예정이라고 알렸습니다.

https://x.com/adriablancafort/status/2008946484281070004

#llm #gpu #h100 #training #opensource

Adria Blancafort (@adriablancafort) on X

This weekend I trained an LLM from scratch Considering I only spent $100 in renting a 8xH100 node for 4 hours, the results were surprisingly good! (inspired by @karpathy's nanochat) More in depth article and source code in comments 👇

X (formerly Twitter)

xAI just raised $20 bn to supercharge Grok. The funding will fuel massive compute clusters – Colossus I & II packed with Nvidia H100 GPUs – and push reinforcement‑learning research, new Grok Voice features, and tighter Tesla integration. Curious how this will reshape AI? Read on for the details. #xAI #Grok #H100 #reinforcementlearning

🔗 https://aidailypost.com/news/xai-secures-usd-20-bn-boost-grok-training-expand-data-centres-compute

CNBC:走私集團試圖將逾50億元輝達晶片輸中,美政府臥底直擊秘密倉庫

中央通訊社 2026-01-02 10:07:00 CST美國當局揭露一走私網絡,其利用空殼公司與秘密倉庫,企圖規避出口管制,將價值逾50億元之 Nvidia 高階 GPU 輸往中國。聯邦探員經臥底行動已查扣該批貨物,阻止其出口。
https://www.thenewslens.com/article/263131
#NVIDIA #H200 #臥底 #中國 #王韋傑 #科技 #新美國安全中心 #Sandkayan #紐澤西州 #德州 #AI晶片 #Operation Gatekeeper #人工智慧 #走私 #H100 #美國 #輝達 #秘密倉庫 #國家安全 #GPU #CNBC

CNBC:走私集團試圖將逾50億元輝達晶片輸中,美政府臥底直擊秘密倉庫 - TNL The News Lens 關鍵評論網

美國當局揭露一走私網絡,其利用空殼公司與秘密倉庫,企圖規避出口管制,將價值逾50億元之 Nvidia 高階 GPU 輸往中國。聯邦探員經臥底行動已查扣該批貨物,阻止其出口。

TNL The News Lens 關鍵評論網

Huấn luyện mô hình 8B để điều phối GPT-5 đòi hỏi 16 GPU H100 vì sử dụng GRPO thay PPO, giảm bộ nhớ nhưng cần batch lớn hơn. Băng thông NVLink thành điểm nghẽn do đồng bộ gradient trong FSDP. Đóng gói chuỗi (sequence packing) giúp tiết kiệm 90% tài nguyên khi xử lý hành trình agent từ 500 đến 12K token. #AI #LLM #DeepLearning #GRPO #H100 #NVIDIA #TríTuệNhânTạo #HọcSâu #MạngNeural

https://www.reddit.com/r/LocalLLaMA/comments/1pzqcuh/why_training_an_8b_orchestrator_needs_16_h100s/

200$ nên làm gì với H100s? Azure cung cấp: 🔥 1x H100: 1.46$/h (eastus2) | 🔥 2x H100: 3.10$/h (northcentralus) | 🔥 8x H100: 16.35$/h (westus3). Hỗ trợ yêu cầu, tinh chỉnh mô hình. #Azure #H100 #AI #LocalLLaMA #MáyHọc #TinhChỉnhMôHình

https://www.reddit.com/r/LocalLLaMA/comments/1pqxw37/what_do_i_do_with_200_for_some_h100s/

Ein #Schnäppchen der besonderen Art: Ein Software-Entwickler hat einen #KI-Server mit zwei #Nvidia #H100 GPUs und knapp einem Terabyte #RAM im Wert von 70.000 Euro für einen lächerlichen Preis ergattert. https://winfuture.de/news,155567.html?utm_source=Mastodon&utm_medium=ManualStatus&utm_campaign=SocialMedia
Irre: Entwickler staubt 70.000-€-Server zu lächerlichem Spottpreis ab

Ein Entwickler machte auf Reddit den Fund seines Lebens: Ein Nvidia-KI-Server für einen Bruchteil des Marktwertes. Doch hinter dem vermeintlichen Schnäppchen steckte ein riskantes Bastelprojekt, das allerdings zu einem erfolgreichen Abschluss kam.

WinFuture.de
Làm sao dùng GPU H100 dưới 2 USD/giờ? Giá H100 chênh lệch do chọn sai nền tảng hoặc để GPU không hoạt động. Giải pháp: (1) Dùng công cụ tìm kiếm đa nhà cung cấp như Aquanode để chọn giá thấp nhất; (2) Áp dụng huấn luyện "checkpoint first" – lưu tiến trình thường xuyên, tắt GPU khi idle; (3) Di chuyển giữa các máy dễ dàng nhờ checkpoint PyTorch, DeepSpeed, Hugging Face. Ví dụ thực tế tiết kiệm trên 40% chi phí. #AI #GPU #H100 #MachineLearning #HọcMáy #TríTuệNhânTạo #CloudComputing #DeepLearning
#Nvidia backed startup #Starcloud trained an #AImodel in #space for the first time, using a #satellite equipped with an Nvidia #H100 #GPU. This achievement demonstrates the potential of #orbitaldatacentres to alleviate Earth’s digital infrastructure crisis by utilising #solarenergy and offering lower #energycosts. https://www.cnbc.com/2025/12/10/nvidia-backed-starcloud-trains-first-ai-model-in-space-orbital-data-centers.html?eicker.news #tech #media #news