fly51fly (@fly51fly)

숨겨진 신호를 더 강하게 인코딩하는 Subliminal Steering 연구입니다. 모델 내부에 은밀한 제어 신호를 심는 방식과 관련된 내용으로, 모델 조작·안전성·해석 가능성 측면에서 중요한 시사점을 주는 최신 논문입니다.

https://x.com/fly51fly/status/2051050163553399079

#modelsecurity #aisafety #interpretability #research #steering

fly51fly (@fly51fly) on X

[CL] Subliminal Steering: Stronger Encoding of Hidden Signals G Morgulis, J Hewitt [Columbia University] (2026) https://t.co/vKRPcsb6bX

X (formerly Twitter)

What you have to do when you're playing multiplayer farm-simulator solo:

✅ Draft animal furrower hitched to tractor
✅ Cable drum zip-tied to steering wheel
✅ Three turns of rope around drum
✅ Steering while walking behind tractor by pulling left/right rope and controlling the furrower

#Rigging #Homestead #Tractor #Steering #Furrower

Ford Motor Company may introduce steer-by-wire technology in a future Ford F‑150, possibly around 2028. The system replaces the mechanical steering link with electronic controls and backup power from supercapacitors. The goal is sharper maneuverability and improved trailer assistance, though some traditional truck buyers may question the reliability of a fully electronic setup. 🚚⚡

🚗 https://auto.ae

#autoae #ford #f150 #steering #tech

Poppin

YouTube
Handheld Steering Wheel Controller Gets Force-Feedback

For a full-fledged, bells-and-whistles driving simulator a number of unique human interface devices are needed, from pedals and shifters to the steering wheel. These steering wheels often have forc…

Hackaday

Как «думает» ИИ: гроккаем разреженные автоэнкодеры (SAE)

В этой статье разберём исследование от компании Anthropic, которое демонстрирует практическую возможность вскрытия «черного ящика» больших языковых моделей для обеспечения их контролируемости и безопасности с помощью разреженных автоэнкодеров (SAE - Sparse AutoEncoders). И в конце, попробуем поуправлять поведением модели - заставим думать, что она Санта Клаус 🎅.

https://habr.com/ru/articles/981964/

#Сезон_ИИ_в_разработке #LLM #interpretable_ml #interpretability #interpretable_AI #искусственный_интеллект #ai_security #Steering #SAE #Sparse_AutoEncoder

Как «думает» ИИ: гроккаем разреженные автоэнкодеры (SAE)

Всем привет, продолжаю погружаться в область AI-security, в прошлой статье разбирались в исследовании Strong Reject и поняли, что не все джейлбрейки одинаково полезны. Сегодня разберём исследование от...

Хабр

Đã phát hành mã nguồn cho bài báo “refusal steering” dùng LLM‑Refusal‑Evaluation. Tính năng: điểm xét duyệt dữ liệu huấn luyện, phân tích tương quan tự động chọn lớp, vector điều khiển trọng số độ tin cậy (WRMD), tối ưu alpha tự động với early stopping, có thể hợp nhất vào trọng số. Yêu cầu pipeline đa giai đoạn và khung đánh giá nhưng cung cấp xác thực thống kê thay vì đoán. Mong nhận phản hồi! #AI #LLM #Steering #TríTuệNhânTạo #HọcMáy #ĐiềuKhiển

https://www.reddit.com/r/LocalLLaMA/comments/1p

OnlineFirst - "Steering FinTech: Techno-industrial policy for the data-driven economy in China’s Greater Bay Area" by Dimitar Anguelov:

#technoindustrialpolicy #steering #data #digitaleconomy #FinTech

https://journals.sagepub.com/doi/full/10.1177/0308518X251394557