Ruszyła zbiórka fundacji non-profit @ftdl na dodatkowy sprzęt dla generatora napisów i transkrypcji po polsku 🇵🇱 czyli NapiGen 🚀 oraz kolejnych projektów LLM.

Pomożecie rozwiązać problem braku polskich napisów w większości treści na YouTube i transkrypcji w podkastach?

Można się dołożyć tutaj:
https://ftdl.pl/sprzet-llm-napigen/

Nie zaszkodzi również podbicie 😉

P.S. Wszystko jest lub będzie open-source, we własnej serwerowni fundacji w Krakowie, na własnym sprzęcie, żadnych "wycieków" na zewnątrz czy "darmowego" douczania amerykańskich korpo ejajów.

#NapiGen #LLM #AI #PolskieNapisy #Napisy #Transkrypcje

Sprzęt dla projektów wykorzystujących LLM (“AI”) i NapiGen

Projekt NapiGen się rozwija, korzysta z niego już wiele osób prowadzących kanały na YouTube i PeerTube czy też podkasty. Kolejne projekty oparte o LLM są w trakcie rozwoju. Brakuje nam sprzętu, głównie kart GPU, dodatkowych CPU, pamięci RAM i dysków. Potrzebujemy doposażyć dedykowany serwer. Pomożesz nam w tym? Rozwiązanie problemu braku polskich napisów i transkrypcji...

Fundacja FTdL

@karma @smoku @bobiko

Tak, prowadzimy projekt #NapiGen służący generowaniu napisów oraz transkrypcji do materiałów audio i wideo w języku polskim i angielskim. Obsługuje on pliki wideo i audio oraz adresy url do materiałów na YouTube, PeerTube, Vimeo i innych obsługiwanych przez yt-dlp.

Wygenerowane napisy .srt i transkrypcje .txt gotowe do pobrania z systemu po przesłaniu plików / adresów url i przetwarzaniu przez specjalnie zmodyfikowanego Whisper.

Kilka osób i projektów już używa, można sprawdzić m. in. na stronach i podcastach Czaban robi raban, GilotynaTV, Discrust, Warroza czy Myśleć Głębiej.

Zapraszamy do kontaktu tutaj lub e-mailem na [email protected], by uzyskać dostęp. System jest bezpłatny do zastosowań niekomercyjnych, często decydujemy się udzielić bezpłatnego dostępu również projektom komercyjnym, gdy taki dostęp jest ważny ze względów społecznych czy edukacyjnych.

Niebawem projekt zostanie udostępniony jako open-source, ponieważ osiągnął już wg nas odpowiedni etap rozwoju, by się nim podzielić ze społecznością i przyspieszyć wspólnie jego rozwój.

Zapraszamy do kontaktu.

@kolejnylewackipej

Przygotowałem z pomocą #NapiGen od @ftdl napisy srt i transkrypcję do tego wspaniałego materiału.

Jeśli uważasz, że się przydadzą, to zapraszam do skorzystania. Mogą wymagać jakiejś korekty:

https://nch.pl/s/DzHwo8DiogYtSrW

Zdrowie_psychiczne

NCH - a safe home for all your data

NCH

@skolima Jest projekt fundacji @ftdl dający bardzo dobre rezultaty.

Osoby z dostępem early-access chwalą. Wykorzystywany jest na kilku popularnych kanałach do robienia napisów, ale generuje też tekst.

Więcej pod tagami #NapGenPL i #NapiGen

https://zrzutka.pl/generator-napisow

Sprzęt do realizacji projektu generatora polskich napisów (srt, txt), z materiałów wideo w języku polskim. Dla osób niedosłyszących i na potrzeby transkrypcji materiału.

Natrafiasz na ciekawy podcast albo intrygujący filmik na YouTube, po czym od razu klikasz, by zacząć słuchać lub oglądać? Choć wydaje się to tak proste i bezproblemowe, dla niektórych nie jest to oczywiste – osoby niedosłyszące i niesłyszące są zmuszone do czekania na przygotowanie napisów przez au1

@[email protected]
cc @paigesaunders

Great video!

I liked it so much that I prepared subtitles for it, with our automatic generator #NapiGen

If you find them good, please add them to the video, let deaf people see this great video too :)

https://nch.pl/s/oxWBPLZTC2B45XT

PaigeSaunders

NCH - a safe home for all your data

NCH

Jeden z ambasadorów projektu #NapiGen Discrust @lukaso666 napisał kilka słów po testach wczesnej wersji oprogramowania:

https://discrust.diy.net.pl/blog/napigen-automatyczne-generowanie-napisow-do-filmow-fundacja-technologie

Fragment:

"dlaczego warto wesprzeć ekipę FTdL przy pracach nad NapiGen? odpowiedź jest oczywista. to projekt kompletnie oddolny, poza łapskami jakiejś korporacji, dla której jedynym sensownym horyzontem i celem jest zysk i pieniądz. jest to inicjatywa od ludzi, dla ludzi i jej przyszłość zależy od naszego zaangażowania i wsparcia. bezcenną jest natomiast wymierna pomoc dla niesłyszących i niedosłyszących, którzy otrzymują wysokiej jakości napisy, a zatem dostęp do treści, które często były poza ich zasięgiem. możemy więc spokojnie traktować NapiGen, jako element pomocy wzajemnej, gdzie każdy/-a z nas ma realną możliwość przyczynienia się do czegoś dobrego dla innych."

Tutaj link do zbiórki na sprzęt (testy odbywają się na pożyczonym GPU i serwerze przeznaczonym do innych zadań) jeśli chcielibyście wesprzeć ten projekt:
https://zrzutka.pl/generator-napisow/

:: NapiGen - automatyczne generowanie napisów do filmów | Fundacja Technologie...

jakiś czas temu, dzięki uprzejmości Fundacji Technologie dla Ludzi (dalej: FTdL), zostałem ambasadorem projektu automatycznego generowania napisów do filmów. miły gest, aczkolwiek nie o gesty tu idzie, ale o użyteczność i znacz...

📝 discrust | blog

@warroza

Dużo poprawiałeś napisy po #NapiGen-ie?

@archiwum

@PiTau

Jak wygenerujesz sobie napisy do video, to edytura możesz już użyć dowolnego do korekty.
Jeśli szukasz takiego z wyświetlaniem waveforma, to może zainteresuje Cię #SubtitleEdit: https://www.nikse.dk/subtitleedit
Mają też wersję edytora online:
https://www.nikse.dk/subtitleedit/online

Takich narzędzi jest sporo. Kiedyś używałem edytora napisów z Kapwing.

Natomiast na kustomizacje pod głos osoby czy kilka innych ficzerów systemu #NapiGen warto poczekać.

@ftdl

Nikse.dk

@ftdl Do zakończenia zbiórki zostało teoretycznie 11 dni, ale proszę nie obawiać się, wpłacać dotacje, bo projekt już ruszył z kopyta i nie zostanie zatrzymany, nie ma takiej obawy. Zresztą zbiórka na zrzutka.pl była już przedłużana. Z problemami, bo nie udaje się zebrać wymaganej ilości środków, ale kontynuujemy projekt, bo zapotrzebowanie na napisy do materiałów na YouTube jest ogromne. Wiemy, że dla osób niesłyszących to ważne. Możecie już zobaczyć napisy generowane przez #NapiGen na kanałach "Czaban robi raban" Piotra Czabana czy "GilotynaTV" Wojtka "Żubra" Bolińskiego @mr_zvbr

Więc zachęcam do wpłat, cel jest szczytny, efekty znakomite, zakończmy razem problem braku napisów do treści na YT, #PeerTube czy transkrypcji w podkastach.

Link do zbiórki w poście @ftdl wyżej w wątku.

Dzięki za podbicie, to też wsparcie :)

Miło nam poinformować o uruchomieniu testów naszego oprogramowania #NapiGen (wcześniej #napgenpl) na sprzęcie bezpośrednio w naszej serwerowni. Oczywiście na naszym autorskim oprogramowaniu spinającym LLM. Można już wysyłać pliki i generować napisy bez naszego udziału, samodzielnie.

Osoby, które wpłaciły dotację na projekt w wysokości uprawniającej do wczesnego dostępu, prosimy o kontakt w celu wygenerowania kont dostępowych do systemu.

Osoby, które chciałyby wspomóc ten projekt i ewentualnie również uzyskać dostęp early-access zapraszamy na stronę zbiórki:
https://zrzutka.pl/generator-napisow/

Trochę technikaliów:
Wykorzystujemy LLM whisper z Faster-Whisper. Wczesniej whisper.cpp ale miał problemy ze współpracą z GPU.
Głównie large-v2. Nasze oprogramowanie backend napisane jest w pythonie. Serwer uruchomiony w krakowskiej serwerowni, więc nie ma obawy o karmienie obcych llm/ai.
Maszyna to Dell r730 z pożyczonym GPU Geforce GTX 1080 Ti bo zbieramy nadal na swoją.

#FTdLKurier #ŻycieFTdL #wspieramFTdL

Sprzęt do realizacji projektu generatora polskich napisów (srt, txt), z materiałów wideo w języku polskim. Dla osób niedosłyszących i na potrzeby transkrypcji materiału.

Natrafiasz na ciekawy podcast albo intrygujący filmik na YouTube, po czym od razu klikasz, by zacząć słuchać lub oglądać? Choć wydaje się to tak proste i bezproblemowe, dla niektórych nie jest to oczywiste – osoby niedosłyszące i niesłyszące są zmuszone do czekania na przygotowanie napisów przez au1