Apple Intelligence trafia do narzędzi dostępności – wózki inwalidzkie sterowane oczami

W przeddzień WWDC 2026 (jak co roku) Apple ogłosiło coroczny pakiet nowości dostępnościowych — tym razem z wyraźnym akcentem na Apple Intelligence. Jak podaje centrum prasowe Apple, większość ogłoszonych funkcji trafi na urządzenia jeszcze w tym roku. To między innymi: naturalna mowa w Voice Control, szczegółowe opisy w VoiceOver i Magnifier, automatyczne napisy dla wideo oraz sterowanie wózkiem inwalidzkim oczami przez Vision Pro.

VoiceOver i Magnifier z Apple Intelligence

Dla użytkowników niewidomych i słabowidzących największą zmianą jest integracja Apple Intelligence z VoiceOver i Magnifier. Nowa funkcja Image Explorer w VoiceOver będzie generować znacznie bardziej szczegółowe opisy obrazów — zdjęć, skanów rachunków czy dokumentów — niż dotychczas. Ulepszony Live Recognition pozwoli nacisnąć przycisk Action i zapytać głosowo o to, co widzi kamera, a następnie zadawać pytania uzupełniające w naturalnym języku. Magnifier otrzyma identyczne możliwości w swoim interfejsie wysokiego kontrastu, do tego z obsługą poleceń głosowych takich jak „przybliż” czy „włącz latarkę”.

Voice Control mówi to, co widzisz

Duża zmiana dotyczy też Voice Control — funkcji nawigowania iPhone’em i iPadem wyłącznie głosem. Do tej pory użytkownicy musieli znać dokładne etykiety przycisków lub numery elementów ekranu. Apple Intelligence zmienia to, wprowadzając tryb „say what you see”: zamiast wywoływać element po numerze, można powiedzieć po prostu „naciśnij fioletowy folder” lub „naciśnij przewodnik o najlepszych restauracjach” – to jest absolutna rewolucja na rynku urządzeń wspierających osoby z niepełnosprawnościami, a przecież tutaj mówimy o całym ekosystemie urządzeń.

Niestety, funkcja ta dostępna będzie na razie tylko po angielsku w USA, Kanadzie, Wielkiej Brytanii i Australii.

Automatyczne napisy dla każdego wideo

Nowość, która wykracza poza grupę użytkowników z niepełnosprawnościami — automatycznie generowane napisy dla filmów bez istniejących napisów. System będzie działał lokalnie, na urządzeniu (bez wysyłania audio do chmury), i automatycznie wyświetlał transkrypcję mówionego dialogu w filmach nagranych iPhone’em, otrzymanych od znajomych lub streamowanych online. Funkcja obejmie iPhone’a, iPada, Maca, Apple TV i Apple Vision Pro.

Ponownie, na starcie dostępna będzie w języku angielskim w USA i Kanadzie.

Vision Pro steruje wózkiem inwalidzkim

Najbardziej spektakularną nowością jest sterowanie elektrycznym wózkiem inwalidzkim oczami — przez komputer przestrzenny Apple Vision Pro. System precyzyjnego śledzenia wzroku w headset pozwala użytkownikom, dla których tradycyjny joystick nie jest opcją, poruszać się za pomocą alternatywnych systemów napędowych. Funkcja startuje ze wsparciem dla systemów Tolt i LUCI w USA, przez Bluetooth i przewodowo. Apple zapowiedziało rozszerzanie kompatybilności z kolejnymi systemami wózków. Jak komentuje Jason Snell z Six Colors, to jeden z tych momentów, które przypominają, dlaczego Apple Intelligence — wbrew powszechnemu postrzeganiu — jest czymś więcej niż generowaniem grafik i streszczaniem e-maili.

Pozostałe nowości

W pakiecie znalazły się też: Vehicle Motion Cues dla visionOS (dla osób podatnych na chorobę lokomocyjną) – sam korzystam z tej funkcji na iPhonie i iPadzie non stop, gdy się przemieszczam, obsługa gestów twarzy w Vision Pro, Name Recognition w ponad 50 językach (powiadomienie dla niesłyszących, gdy ktoś wymówi ich imię), Larger Text dla tvOS, nowe API do dodawania tłumacza języka migowego do rozmów FaceTime oraz obsługa kontrolera Sony Access jako pada do gier na iOS, iPadOS i macOS.

Hikawa Grip & Stand w nowych kolorach

Przy okazji Apple udostępniło globalnie w Apple Store nową wersję Hikawa Grip & Stand for iPhone — adaptacyjnego uchwytu MagSafe zaprojektowanego przez Bailey Hikawa we współpracy z osobami z niepełnosprawnościami ograniczającymi chwyt i mobilność. Akcesoria dostępne są teraz w trzech nowych kolorach, po raz pierwszy na całym świecie, we współpracy z PopSockets.

Produkt nie jest dostępny w Polsce.

Więcej o przydatnych funkcjach dostępności posłuchasz w jednym z odcinków mojego podcastu.

Dwie funkcje iOS 27, które przydadzą się każdemu

Omówione wyżej ogłoszenie Apple dotyczące nowych funkcji dostępności – bezpośrednio rzutuje na to, co zobaczymy w iOS 27 (i pozostałych systemach z tej rodziny) — choć oficjalnie skierowane do użytkowników z niepełnosprawnościami — w praktyce mogą okazać się przydatne dla niemal każdego.

Napisy do wszystkiego

Generated Subtitles to automatyczne generowanie napisów dla filmów, które nie mają własnych napisów — i to dosłownie wszędzie w systemie. Jak zauważa 9to5Mac, funkcja obejmie filmy w mediach społecznościowych, klipy w aplikacji Zdjęcia, wideo w Wiadomościach i każde inne treści wideo odtwarzane na iPhonie, iPadzie, Macu, Apple TV i Vision Pro. Transkrypcja generowana będzie lokalnie, na urządzeniu, bez wysyłania audio do chmury. Wygląd napisów będzie konfigurowalny w ustawieniach lub bezpośrednio w odtwarzaczu.

Scenariusz, w którym ta funkcja naprawdę błyszczy, jest trywialny: publiczne miejsce, wyciszony telefon, film bez napisów. Do tej pory byłeś zdany na łaskę twórcy lub platformy. Od iOS 27 napisy będą zawsze — niezależnie od źródła wideo. Polscy użytkownicy będą musieli poczekać na rozszerzenie wsparcia językowego.

Voice Control i zapowiedź agentycznej Siri

Drugi wątek jest głębszy. Ulepszony Voice Control w iOS 27 pozwoli nawigować telefonem, mówiąc po prostu to, co się widzi na ekranie — „naciśnij fioletowy folder”, „otwórz przewodnik o restauracjach” — zamiast wywoływać elementy po numerach czy dokładnych etykietach. Jak zauważa 9to5Mac, Mark Gurman potwierdził na X, że te same agentyczne możliwości leżące u podstaw nowego Voice Control są wbudowane w Siri w iOS 27.

To ważny sygnał. W 2024 roku Apple zapowiedziało, że Siri zyska zdolność do wykonywania akcji w aplikacjach i między nimi oraz świadomość tego, co dzieje się na ekranie — obie funkcje zostały opóźnione i nigdy nie trafiły do użytkowników. Teraz Apple pokazało przy okazji funkcji dostępności, że ta architektura faktycznie istnieje i działa. Jeśli iPhone potrafi rozpoznać elementy interfejsu dowolnej aplikacji i zareagować na polecenie w naturalnym języku dla Voice Control, ta sama infrastruktura może działać agentycznie — wykonując wieloetapowe zadania autonomicznie. Jest niemal pewne, że ta funkcja zostanie wykorzystana w okularach Apple Glasses.

8 czerwca na WWDC dowiemy się, na ile ta obietnica jest tym razem realna.

Apple rozsyła zaproszenia na WWDC 2026

#AccessibilityReader #agentycznaAI #AppleIntelligence #dostępność #GeneratedSubtitles #HikawaGrip #iOS27 #Magnifier #MagSafe #MarkGurman #NameRecognition #napisy #OS27 #Siri #SonyAccess #tvOS #VisionPro #VoiceControl #VoiceOver #watchOS #wózekInwalidzki #WWDC2026

Apple zapowiedziało nową wersję Final Cut Pro, która wprowadzi funkcję „Transkrypcji do napisów”.

Wbudowana opcja transkrypcji głosu na napisy będzie przydatna przy tworzeniu napisów do filmów internetowych.

Nowy Mac mini z M4 i M4 Pro ma wspierać zadania związane z Apple Intelligence, co przyspieszy transkrypcję dzięki wydajności M4.

Najmniejszy Mac mini w historii zaprezentowany!

Final Cut Pro zyska także funkcję Magnetic Mask, która ułatwi tworzenie masek poprzez dopasowanie do kontrastowych obszarów.

Nową wersję Final Cut Pro zaprezentują prawdopodobnie podczas nadchodzącego FCP Creative Summit w Cupertino.

https://imagazine.pl/2024/10/30/apple-zapowiedzialo-nowa-wersje-final-cut-pro/

#AI #aktualizacja #AppleIntelligence #finalCutPro #napisy

Najmniejszy Mac mini w historii zaprezentowany! | iMagazine

Po wczorajszej premierze iMaców z Apple M4, dziś zobaczyliśmy nowego Maca mini – zgodnie z plotkami jest to najmniejszy komputer Mac w historii!

Ostatnio mnie tu mało, bo mam dużo pracy, ale pochwalę się jednym z jej efektów. Od piątku w kinach „My Hero Academia: You’re Next” z moimi napisami. Miłego seansu!

#MyHeroAcademia #Napisy

Na początku tego tygodnia głośno zrobiło się o dochodzeniu, które wykazało, że Apple i inni giganci technologiczni używali napisów YouTube do trenowania swoich modeli sztucznej inteligencji.

Obejmowało to ponad 170 000 filmów twórców takich, jak MKBHD, Mr. Beast oraz innych zasięgowych kanałów. Apple miało wykorzystać ten zestaw danych do trenowania swoich modeli OpenELM o otwartym kodzie źródłowym, które zostały wydane w kwietniu.

Apple publikuje rodzinę wydajnych modeli językowych open source

Apple potwierdziło jednak serwisowi 9to5Mac, że OpenELM nie zasila żadnej z jego funkcji Apple Intelligence ani nie wspiera Machine Learning stosowanego naurządzaniach firmy.

Ta  twierdzi, że stworzyła model OpenELM jako sposób na wniesienie wkładu w społeczność badawczą i rozwój dużych modeli językowych typu open source. W przeszłości badacze Apple opisywali OpenELM jako „najnowocześniejszy otwarty model językowy”.

Według Apple, OpenELM został stworzony wyłącznie do celów badawczych, a nie do wykorzystania w celu zasilania jakichkolwiek funkcji Apple Intelligence. Model został opublikowany jako open-source i jest szeroko dostępny, w tym na stronie Apple Machine Learning Research.

Ponieważ OpenELM nie jest używany jako część Apple Intelligence, oznacza to, że zbiór danych o nazwie „Napisy YouTube” nie jest używany do zasilania Apple Intelligence.

Wreszcie, Apple powiedziało 9to5Mac również, że nie planuje tworzyć żadnych nowych wersji modelu OpenELM.

Jak podał Wired na początku tego tygodnia, firmy takie jak Apple, Anthropic i NVIDIA wykorzystały zestaw danych „Napisy YouTube” do trenowania swoich modeli sztucznej inteligencji. Ten zbiór danych jest częścią większej kolekcji o nazwie „The Pile”, stworzonej przez organizację non-profit EleutherAI.

Sprawa ma być dalej badana.

https://imagazine.pl/2024/07/18/apple-twierdzi-ze-ich-model-openelm-nie-byl-trenowany-na-youtubie/

#AI #AppleIntelligence #generatywnaSztucznaInteligencja #machineLearning #napisy #OpenELM #sztucznaInteligencja #YouTube

Apple publikuje rodzinę wydajnych modeli językowych open source | iMagazine

Tuż przed debiutem iOS 18 na WWDC w czerwcu tego roku, Apple udostępniło rodzinę dużych modeli językowych o otwartym kodzie źródłowym.

o. od kiedy są napisy generowane na żywo? :D #euro2024 #napisy

Ruszyła zbiórka fundacji non-profit @ftdl na dodatkowy sprzęt dla generatora napisów i transkrypcji po polsku 🇵🇱 czyli NapiGen 🚀 oraz kolejnych projektów LLM.

Pomożecie rozwiązać problem braku polskich napisów w większości treści na YouTube i transkrypcji w podkastach?

Można się dołożyć tutaj:
https://ftdl.pl/sprzet-llm-napigen/

Nie zaszkodzi również podbicie 😉

P.S. Wszystko jest lub będzie open-source, we własnej serwerowni fundacji w Krakowie, na własnym sprzęcie, żadnych "wycieków" na zewnątrz czy "darmowego" douczania amerykańskich korpo ejajów.

#NapiGen #LLM #AI #PolskieNapisy #Napisy #Transkrypcje

Sprzęt dla projektów wykorzystujących LLM (“AI”) i NapiGen

Projekt NapiGen się rozwija, korzysta z niego już wiele osób prowadzących kanały na YouTube i PeerTube czy też podkasty. Kolejne projekty oparte o LLM są w trakcie rozwoju. Brakuje nam sprzętu, głównie kart GPU, dodatkowych CPU, pamięci RAM i dysków. Potrzebujemy doposażyć dedykowany serwer. Pomożesz nam w tym? Rozwiązanie problemu braku polskich napisów i transkrypcji...

Fundacja FTdL

W kinach od piątku „Demon Slayer — Kimetsu no Yaiba: To the Hashira Training”. To kompilacja dwóch odcinków anime: ostatniego odcinka trzeciego sezonu i — przedpremierowo — pierwszego odcinka sezonu czwartego. Dla fanów na pewno pozycja obowiązkowa, a dla mnie — po zeszłorocznej kompilacji „Kimetsu” oraz „Suzume” i „Rycerzach Zodiaku” — kolejna przygoda z tłumaczeniem filmów kinowych. Mam nadzieję, że podołałem 😉

#DemonSlayer #KimetsuNoYaiba #MieczZabójcyDemonów #ToTheHashiraTraining #TreningFilarów #Napisy #Tłumaczenie #Kino

Kiedyś na #YouTube była możliwość tworzenia napisów do filmów przez społeczność. Czy jest teraz jakaś strona do tego, ale żeby obsługiwała #PeerTube?

#napisy #dostępność

Jeśli macie luźne 50 minut i chcecie posłuchać co się dzieje w Fundacji @ftdl czy o nowym projekcie Generatora Napisów z materiałów audio/video #NapGenPL to zapraszam do nowego podcastu:

https://podkast.cloud/@FTdL_kurier

Tak, robimy napisy z automatu do podcastów, PeerTube i YouTube by rozwiązać problem dostępu do treści dla osób niesłyszących i niedosłyszących.

Prowadzi @warroza a rozmawiają Gades, Piotr @piotrsikora i Sebastian @sebastian

Podkast z fedi zaobserwujecie tutaj:
@FTdL_kurier @podkast.cloud

#podcast #podkast #WolnyPodkasting #napisy #transkrypcja

Tutaj się jeszcze nie chwaliłem, więc co mi tam — czas na bardzo próżny post 😉

W dzieciństwie zdarzało marzyć mi się o aktorstwie i występowaniu na dużym ekranie — jak pewnie wielu osobom. Skończyło się na udziale w szkolnych przedstawieniach — czyli zamiast ekranu scena, i to raczej niewielka. Ale były to bardzo miłe doświadczenia.

Po studiach dostałem pierwsze napisowe zlecenie — przy filmie dokumentalnym o Nikoli Tesli. W branży pracuję do dziś. Tłumaczyłem naprawdę fajne seriale i filmy dla kilku platform VOD. A mimo to z tyłu głowy wciąż tliło się marzenie o dużym ekranie. Oczywiście już nie w charakterze aktora, tylko tłumacza.

I tu dochodzimy do marca tego roku. Do kin Helios na dwa weekendy (a w pierwotnych planach tylko na jeden, ale zainteresowanie najwidoczniej było znacznie większe, niż zakładano) weszła kompilacja dwóch ostatnich wyemitowanych dotąd odcinków anime „Kimetsu no yaiba” (czyli „Miecz zabójcy demonów” / „Demon Slayer”) oraz pierwszego odcinka nowego sezonu. Zbieg okoliczności i miły kolega po fachu, który akurat nie mógł przyjąć zlecenia, sprawiły, że polski dystrybutor zgłosił się do mnie. Nie mogłem oczywiście odmówić! Zwłaszcza że jestem po studiach japonistycznych, więc mogłem zadbać o porządny, wierny oryginałowi (na ile oczywiście forma napisów pozwala) przekład.

I w ten oto sposób moje nazwisko trafiło na duży ekran. Na kilka zaledwie sekund po napisach końcowych, ale zawsze. I być może nie jest to ostatni raz, ale o tym na razie sza 🤫

#napisy #tłumaczenie #filmy #anime #kino #kimetsunoyaiba #mieczzabojcydemonow #demonslayer