hui, ministral-3 mit kontext 32k füllt mein vRAM bis auf 100MB (12GB RTX 3060) 🙃

hat aber mein (eher einfaches) bullshitbingo php projekt 1a analysiert
#KI #homelab #nanocoder #ollama #ministral

Hab auf #ollama das laut ollama.com 2 Monate alte Ministral3 installiert und laufen lassen. Das Modell ist auf dem Stand von Oktober 2023. Leider kann man der offiziellen Seite nur entnehmen, seit wann das Modell zur Verfügung steht und nicht auf welchem Stand es ist.
#raspberrypi #ki #llm #ministral

I've added an interactive client script today. Makes it easier to play around and discover all the ways to break our little assistant:

#GISChat #QGIS #FastMCP #ministral

yes - habs mit #opencoder endlich geschafft dass #ministral 8B #code für mich schreibt...
... also tatsächlich in eine datei schreibt

jetzt muss ich nur noch gucken ob das mit #nanocoder auch funktioniert
#KI #homelab

exllamav3 đã cập nhật, bổ sung hỗ trợ cho các mô hình AI mới như GLM 4.7, GLM 4.6V, Ministral và OLMO 3. Đây là tin tức tuyệt vời cho cộng đồng AI địa phương!
#exllamav3 #AI #LLM #GLM #Ministral #OLMO3 #LocalAI #MôHìnhAI #TríTuệNhânTạo #HỗTrợAI

https://www.reddit.com/r/LocalLLaMA/comments/1ptom2s/exllamav3_adds_support_for_glm_47_and_46v/

Anyone who wants Edge LLM on their iPhone but has an iPhone < 15 Pro like me: you can run #Ministral 3B through Locally AI app, which is quite good and even has vision capabilities. Offline summarization, data extraction, image description etc.! Also, it was created by an EU company 🇪🇺

Mit dem aktuellen Update der #LMStudio #MLX Runtime (0.36.1) laufen seit heute auch die Ministral- und Devstral-Modelle im entsprechenden Format.

ministral-3-14b-reasoning liefert dabei auf meinem 2022er MacBook Pro M1 brauchbare 16tok/sec - dem #LLM beim "Denken" zuzugucken ist dabei recht amüsant: Im Vergleich zu anderen Reasoning-Modellen finde ich es irgendwie sympathisch "verkopft" und unentschlossen.

#ministral #devstral

#Qwen3 原版的 Q4KM 和 #Unsolth 的Q4 UD版體積只差一點點,但 #Ministral 3 3B則差了大概1G
試用了一下 #Ministral 3 3B 對比 #Qwen3 4b 2507,Qwen3的中文寫作能力要好一點。還測試了 #Unsolth 的Q4 UD版,使用上沒感覺到任何區別,但它的Q4體積會大一點,在我的8G A2000顯卡上運行有點壓力