Miło nam poinformować o uruchomieniu testów naszego oprogramowania #NapiGen (wcześniej #napgenpl) na sprzęcie bezpośrednio w naszej serwerowni. Oczywiście na naszym autorskim oprogramowaniu spinającym LLM. Można już wysyłać pliki i generować napisy bez naszego udziału, samodzielnie.
Osoby, które wpłaciły dotację na projekt w wysokości uprawniającej do wczesnego dostępu, prosimy o kontakt w celu wygenerowania kont dostępowych do systemu.
Osoby, które chciałyby wspomóc ten projekt i ewentualnie również uzyskać dostęp early-access zapraszamy na stronę zbiórki:
https://zrzutka.pl/generator-napisow/
Trochę technikaliów:
Wykorzystujemy LLM whisper z Faster-Whisper. Wczesniej whisper.cpp ale miał problemy ze współpracą z GPU.
Głównie large-v2. Nasze oprogramowanie backend napisane jest w pythonie. Serwer uruchomiony w krakowskiej serwerowni, więc nie ma obawy o karmienie obcych llm/ai.
Maszyna to Dell r730 z pożyczonym GPU Geforce GTX 1080 Ti bo zbieramy nadal na swoją.
Sprzęt do realizacji projektu generatora polskich napisów (srt, txt), z materiałów wideo w języku polskim. Dla osób niedosłyszących i na potrzeby transkrypcji materiału.
Natrafiasz na ciekawy podcast albo intrygujący filmik na YouTube, po czym od razu klikasz, by zacząć słuchać lub oglądać? Choć wydaje się to tak proste i bezproblemowe, dla niektórych nie jest to oczywiste – osoby niedosłyszące i niesłyszące są zmuszone do czekania na przygotowanie napisów przez au1