Mastodawn

fly51fly (@fly51fly)

대규모 언어모델(LLM)의 Best-of-N 샘플링 상황에서 발생하는 적대적 리스크(adversarial risk)를 통계적으로 추정하는 방법을 제안한 연구가 arXiv에 공개되었습니다. Microsoft Research 연구진이 제출한 논문으로, 샘플링 기반 생성 과정에서의 취약성 평가와 리스크 추정 기법을 소개하고 실험으로 유효성을 보였습니다.

https://x.com/fly51fly/status/2018441692735746503

#adversarialrobustness #llm #bestofn #sampling

fly51fly (@fly51fly) on X

[LG] Statistical Estimation of Adversarial Risk in Large Language Models under Best-of-N Sampling M Feng, X Liu, W Yang, C Xu... [Microsoft Research] (2026) https://t.co/5mtrb5hW99

X (formerly Twitter)