Mastodawn

코드 수정 없이 AI 에이전트를 강화학습으로 훈련: Microsoft Agent Lightning

Microsoft Agent Lightning으로 기존 AI 에이전트를 코드 수정 없이 강화학습으로 훈련하는 방법. LangChain, AutoGen 등 모든 프레임워크 지원, SQL 에이전트 정확도 73%→80% 향상 사례 포함

https://aisparkup.com/posts/5942

Brandon H

Aug 14

via @dotnet : Announcing the NuGet MCP Server Preview

https://ift.tt/QbdgEc8
#NuGet #MCPServer #DotNet #AI #PackageManagement #RealTimeIntegration #DevelopmentTools #DependencyManagement #OpenStandard #MicrosoftResearch #PreviewRelease #Feedback #CodingAgent #Vi…

Announcing the NuGet MCP Server Preview - .NET Blog

We've released a preview of the NuGet MCP Server, which extends Copilot by providing realtime information about packages and adds advanced functionality around updating packages.

.NET Blog

Freie Universität Berlin Jul 11

🚀 Durchbruch in der Proteinmodellierung!

Mit #BioEmu hat ein Team der #FUBerlin & #MicrosoftResearch AI for Science unter der Leitung von Prof. Frank Noé ein #KI-System vorgestellt, das Proteinbewegungen so genau simuliert wie nie zuvor.

Was #BioEmu für das Wirkstoffdesign bedeuten könnte?

Mehr dazu hier ➡️ https://www.fu-berlin.de/presse/informationen/fup/2025/fup_25_120-proteinmodellierung-bioemu-noe/index.html

Hacker News Jul 5

Build Systems à la Carte (2018) [pdf]

https://www.microsoft.com/en-us/research/wp-content/uploads/2018/03/build-systems.pdf

#HackerNews #BuildSystems #à #laCarte #2018 #pdf #MicrosoftResearch

Hacker News May 2

RustAssistant: Using LLMs to Fix Compilation Errors in Rust Code

https://www.microsoft.com/en-us/research/publication/rustassistant-using-llms-to-fix-compilation-errors-in-rust-code/

#HackerNews #RustAssistant #LLMs #RustCode #CompilationErrors #MicrosoftResearch

RustAssistant: Using LLMs to Fix Compilation Errors in Rust Code - Microsoft Research

The Rust programming language, with its safety guarantees, has established itself as a viable choice for low-level systems programming language over the traditional, unsafe alternatives like C/C++. These guarantees come from a strong ownership-based type system, as well as primitive support for features like closures, pattern matching, etc., that make the code more concise and […]

Microsoft Research

Tecnoblog • tecnologia que interessa Apr 14

Microsoft Research: modelos de IA ainda não são bons em corrigir bugs

https://fed.brid.gy/r/https://tecnoblog.net/noticias/estudo-mostra-que-modelos-de-ia-ainda-nao-sao-bons-em-corrigir-bugs/

Microsoft Research: modelos de IA ainda não são bons em corrigir bugs • Tecnoblog

Experimento conduzido por pesquisadores da Microsoft Research mostra que Claude 3.7 Sonnet teve o resultado "menos pior", com 48,4% de sucesso.

Tecnoblog

Agnieszka Serafinowicz Apr 14

Programiści jeszcze nie tak szybko będą zastąpieni przez AI: z jednym sztuczna inteligencja sobie nie radzi

W branży mediów technologicznych nie brakuje głosów, które ferują już dziś wyroki na programistów, że ich praca będzie niepotrzebna w przeciągu kilku miesięcy, przyczyną ma być oczywiście AI, ale nowe badania pokazują, że z pewnymi aspektami pracy programisty sztuczna inteligencja radzi sobie wciąż słabo.

Najnowsze badania opublikowane przez Microsoft Research, dział badawczy giganta z Redmond, rzuca nowe światło na ograniczenia sztucznej inteligencji w jednym z kluczowych obszarów programowania – debugowaniu kodu. Choć duże modele językowe, takie jak te napędzające zaawansowane systemy AI, imponują zdolnością do generowania kodu, ich skuteczność w wykrywaniu i naprawianiu błędów pozostawia wiele do życzenia.

Microsoft rozbudowuje usługę Copilot o agentów AI

Wyniki badań wskazują, że obecne technologie AI są dalekie od dorównania umiejętnościom programistów-ludzi, choć zespoły badawcze intensywnie pracują nad poprawą tych niedociągnięć.

Cisco: prywatność danych kluczowym wyzwaniem w erze AI

Testy przeprowadzone przez naukowców obejmowały popularne języki programowania, takie jak Python, JavaScript czy C++. Wyniki były jednoznaczne: w zadaniach debugowania AI osiągała skuteczność na poziomie zaledwie 20-30%. To wręcz fatalny wynik. Modele AI często błędnie identyfikowały przyczyny problemów, proponowały nietrafione poprawki lub wprowadzały nowe błędy, komplikując kod jeszcze bardziej i w efekcie go zaśmiecając zamiast naprawiać.

Na przykład w jednym z testów AI próbowała „naprawić” poprawnie działający fragment kodu, co prowadziło do jego awarii. Takie wyniki podkreślają, że obecne modele AI, choć zaawansowane w generowaniu treści, mają trudności z rozumieniem złożonych zależności w strukturze kodu i logice programowania.

Przyczyny tych ograniczeń leżą w sposobie trenowania modeli AI. Duże modele językowe uczą się na ogromnych zbiorach danych, które obejmują zarówno poprawny, jak i błędny kod. Jednak dane te rzadko zawierają szczegółowe konteksty debugowania, takie jak kroki prowadzące do identyfikacji błędu czy strategie naprawy. W efekcie AI często działa na zasadzie „zgadywania” zamiast dogłębnej analizy.

Co więcej, modele te nie radzą sobie dobrze z nietypowymi błędami lub specyficznymi przypadkami, które wymagają kreatywnego myślenia i doświadczenia – cech, w których ludzie wciąż mają przewagę.

Mimo tych wyzwań naukowcy pozostają optymistyczni i aktywnie poszukują rozwiązań. Jednym z obiecujących kierunków jest tworzenie bardziej wyspecjalizowanych zestawów danych, które skupiają się na rzeczywistych scenariuszach debugowania. Takie dane mogłyby obejmować przykłady błędów, ich przyczyny oraz poprawne poprawki, co pozwoliłoby modelom lepiej rozumieć proces naprawy kodu. Innym podejściem jest łączenie AI z tradycyjnymi narzędziami analitycznymi, takimi jak statyczne analizatory kodu, które mogą precyzyjnie wskazywać potencjalne problemy. Hybrydowe systemy mogłyby wykorzystać siłę AI do generowania sugestii, podczas gdy narzędzia analityczne zapewniłyby dokładność i kontekst.

Perspektywy na przyszłość są obiecujące, choć droga do stworzenia AI zdolnej do niezawodnego debugowania jest jeszcze długa. Badacze podkreślają, że sukces zależy od interdyscyplinarnego podejścia, łączącego postępy w uczeniu maszynowym, inżynierii oprogramowania i projektowaniu danych. Na razie programiści mogą spać spokojnie, wiedząc, że ich umiejętności są niezastąpione. Jednak błędem byłoby głoszenie tez, jakoby ich praca niebawem stanie się niepotrzebna. Nawet, gdy uda się wyszkolić modele w fazie debugowania, AI może znacząco ułatwić pracę programistów, ale nie wyeliminuje ich. Wręcz przeciwnie: poprawi wydajność. Każdy programista z pewnością wolałby się skupić na kreatywnej części pracy, a nie na mozolnym poprawianiu błędów.

Gemini wprowadza Canvas i podsumowania audio – Google z nowymi narzędziami do współpracy i kreatywności

#AI #debugowanie #MicrosoftResearch #news #programowanie #sztucznaInteligencja