@hook si slišal za https://malus.sh ?
Slišat je kot zadeva, o kateri boš ti verjetno imel mnenje.
Sicer tukaj potiskajo neko odstrani-GPL perspektivo, samo jaz sem pa prvo pomislil, a bi se lahko takšen sistem uporabil za delat prostokodne verzije proprietary programov?
MALUS - Clean Room as a Service | Liberation from Open Source Attribution

@leon @hook fwiw, spodaj je autocorrect na steroidih. tko da je to imho etični in ekološki no-go. me ta topogledno sploh ne čudi, da pushajo "clean room" reimplementacijo gplane kode. :D

@leon, kolkr sm slišu nej bi Malus bil zajebancija, kar nej bi iz dokumentacije/bloga blo razvidno. Nisem pa še najdu cajta, da bi sam pregledal.

Ampak ja, če bi tak kvazi-clean-room deloval z GPL v MIT, pol bi tud z zaprte v odprto deloval. (V kolikor nimaš drugih problemov s kako si dobil sw oz. kršil EULA/ToS)

Realistično gledan, bo pomojm to sprožil dost panike, da se izjasne kje je meja. Vprašanje kako bo to na klasično/ročno clean-room implementacijo vplival.

cc @jkmcnk

@hook Liberation from open source?! To je eden boljših oksimoronov, kar sem jih videl.

Drugače pa tole ni nič drugega kot "programiranje" z AI. Vsako stvar lahko sprogramiraš na novo. Lahko sam. Lahko z AI. Ali bo zadeva v slednjem primeru delovala, je sicer drugo vprašanje.

Je pa razlika seveda v tem, da odprto kodo lahko vsi vidijo in so jo "prebrali" tudi vsi AI sistemi, do zaprte kode pa načeloma nihče, vključno z AI sistemi, ne more.

@leon @jkmcnk

@casar @hook @leon @jkmcnk Pozabljaš, da AI temelji na masovni intelektualni kraji, tako da ni prav isto.

@mihamarkic Intelektualno krajo se da izvesti tudi "ročno" brez AI, če to že hočeš narediti. Izločitev AI kraj še ne bo preprečila.

@hook @leon @jkmcnk

@casar @hook @leon @jkmcnk Odvisno od licence. Dvomim, da večina (odprtokodnih) projektov dovoli učenje AI, dovolijo pa ljudem. Zaprtokodni pa itak nobenemu.

@mihamarkic, ne vem katera odprtokodna licenca (vsaj med dolgo etabliranimi) prepoveduje učenje AI. Domnevam celo – for better or worse –, da bi to bilo celo v nasprotju z OSD 6 in Freedom 1:

https://opensource.org/osd
https://en.wikipedia.org/wiki/The_Free_Software_Definition

Ja, hecna situacija vseskp.

@casar @leon @jkmcnk

The Open Source Definition - Open Source Initiative

Introduction Open source doesn’t just mean access to the source code. The distribution terms of open source software must comply with the following criteria: 1. Free Redistribution The license shall...

Open Source Initiative
@hook @casar @leon @jkmcnk Predstavljam si, da so odprtokodne licence bile narejene pred AI in niso ustrezno pisane za te primere, ker jih takrat ni bilo. Kar ne pomeni, po moje, da je dovoljen zajem s strani AI in se to izkorišča v komercialne namene. To je vsaj sivo področje. Pri zaprtokodnih pa še ta dilema odpade. 🤷‍♂️

@mihamarkic Po moje kaj takega kot prepoved učenja ne obstaja, niti ne more obstajati. Obstajajo pa prepovedi, česa z naučenim ne smeš početi.

Odprtokodne licence so različne. Nekatere dovoljujejo vse, nekatere ne dovoljujejo komercialnega izkoriščanja, večina pa verjetno komercialno izkoriščanje dovoljuje, dokler nastale produkte vzporedno ponujaš tudi odprtokodno. In ni nič narobe, če komercialni različici dodaš kako ponudbo storitve, podporo, knjige, škatle, medije, ...

@hook @leon @jkmcnk

@casar @mihamarkic @hook @leon imho kot lastnik avtorske pravice lahko prepoveš rabo za učenje ai modelov. drugo vprašanje je, kako boš to enforceal. @hook ?

@jkmcnk, odvisno od jurisdikcije/zakonodaje kaj se da in kako.

Npr. če že zakon dovoljuje rudarjenje kode za AI učit, postane licenca v tem primeru dokaj irelevantna. Npr. Japonska dovoljuje prosto učenje tudi na avtorsko zaščitenih delih.

https://www.deeplearning.ai/the-batch/japan-ai-data-laws-explained/

Ampak, ja, tudi če lahko prepoveš, je vprašanje kako boš izvedel (v obeh pomenih besede).

@casar @mihamarkic @leon @hook

Japan's AI Data Laws, Explained

Amid rising questions about the fairness and legality of using publicly available information to train AI models, Japan affirmed that machine learning...

Japan's AI Data Laws, Explained
@hook @casar @mihamarkic @leon @hook ok, takole, če zakonodaja izrecno ne voida avtorske pravice za trening ai modelov, pol loh to prepoveš. podobno, kot bi lahko prepovedal rabo npr moškim ali pa budistom, če ne bi te sorte diskriminacija bla že itak v nasprotju z npr ustavo oz ostankom zakonodaje?

@jkmcnk, načeloma, ja. Ampak po trenutni definiciji, ne bi stvar bila več FOSS.

Glej npr. OSD5 in OSD6 (link ima razlago, ker je predolga za tut)

> 5. No Discrimination Against Persons or Groups

> 6. No Discrimination Against Fields of Endeavor

https://opensource.org/osd

@casar @mihamarkic @leon @hook

The Open Source Definition - Open Source Initiative

Introduction Open source doesn’t just mean access to the source code. The distribution terms of open source software must comply with the following criteria: 1. Free Redistribution The license shall...

Open Source Initiative

@jkmcnk Bi rekel, da mnogo od zadev, ki ne obstajajo, ne obstaja prav zato, ker ni načina, kako bi jih lahko enforcal.

@mihamarkic @hook @leon @hook

@casar @hook @leon problem, ki ga jst vidm tle je, če je tvoj model pozaugal kodo implementacije opensource reči X in mu ti rečeš, klod, dej mi reimplementirej X, bo to težko "clean room." :D

@jkmcnk, tudi človeška »clean room« reimplementacija ima nekje za input obstoječe avtorsko delo:

https://en.wikipedia.org/wiki/Clean-room_design

@casar @leon

Clean-room design - Wikipedia

@hook @casar @leon ampak njegovo funkcijo, "zunanjost." ne pa copyrightane podrobnosti implementacije: če je nekdo seznanjen z izvirno implementacijo, bo težko reku, da ni infringeal copyrighta, predvsem ker večine reči ne moreš učinkovito narest na dramatično drugačen način. al jst to narobe razumem, ianal? :)

@jkmcnk Tam pri učinkovitosti si zavozil na področje algoritmov. Kolikor vem, algoritmov niti patentirati ni mogoče, kje šele, da bi z avtorskimi pravicami lahko omejeval njihovo uporabo.

@hook @leon

@casar @hook @leon algoritma ne, njegova raba v konkretnem primeru, torej koda, je pa, for better or for worse, avtorsko delo.
@casar @hook @leon še več, ne le konkreyen primer rabe, tud implementacijo loh seveda copyrightaš. ne moreš rečt, jst sm se spomnu b-drevo in noben drug ga ne sme uporabit brez mojega dovoljenja. loh pa rečeš, tle je implementacija b-drevesa v brainfucku in noben je ne sme uporabit, če mi ne pošlje litra deviške krvi.

@jkmcnk, še vedno lahko nekdo XY, iz nule napiše drugo implementacijo b-drevesa v brainfucku, če jo je sam naredil, brez opiranja se na prejšnjo.

@casar @leon

@hook Tako. Pri čemer sploh ni nujno, da ta XY sam algoritem b-drevesa tudi samostojno izumi. Mirno ga lahko pobere iz @jkmcnk implementacije. Seveda ne more trditi, da se ga je on spomnil, a uporablja ga lahko.

@leon

@hook @casar @leon ja, ja, govoril sem o konkretni implementaciji.

@jkmcnk @casar @leon,

BTW, zanimivo branje na to temo (se opravičujem za temporary paywall, bo na voljo 9. aprila javno):
https://lwn.net/Articles/1064541/

@jkmcnk, v osnovi, maš prav, ja.

Kjer rata problem pol in ta nova tehnologija zakomplicira stvari nekje v fundamentu, je dilema:

• avtor je lahko samo človek, torej, to da »AI« »pozna« original bi moralo biti irelevantno za pravnost outputa
• »clean room design« _obramba_ je po eni teoriji slonela na tem, da je bilo veliko truda in dela vloženega v to, da je stvar »clean« – tega truda pri uporabi LLM-ov ni več

@casar @leon

@jkmcnk Itak. Saj tudi zapisi o "čistih poslih" niso namenjeni temu, da bi nam opisali dejansko stanje. Namenjeni so pravnikom kot navodila, da bodo presodili, da je neka stvar čista, ko pa vendar eksplicitno piše, da je čista. In managerjem njihovih strank, da jih odveže krivde pri nakupu njihovih "čistih" storitev.

@hook @leon

V tistem skrajno malo verjetnem scenariju, kjer bi v kakšnem sodnem sporu potegnili kratko, bodo pač firmo s poštnim nabiralnikom dali v stečaj in posle nadaljevali v okviru nove firme. Kupcem ukradene kode bo pa ta ostala, saj oni so vendar pošteno kupili in plačali "čisto" reč.

@jkmcnk @hook @leon

@leon @hook wtf as a service

@gregx @leon @hook

It's the newest EaaS business model - #enshitification as a service.

Joke aside, if this is not a joke as @hook suggests there are 2 angles from which I'd like to look.

1. FOSS' value comes from usage and its extensibility creates community of users and developers around it which creates its own unique dynamics and helps with having software up2date. with this malus.sh I guess you're destined to use it to maintain the software as well.

1/2

@gregx @leon @hook

2. Free Software was conceived in opposition to copyright but uses its legal framework. FSF has probably correctly assessed that opposing the is futile so they used it in an aikido move to use it against itself.Tools as malus might bring us towards that initial goal of #copyleft where the #copyright looses it potency. I'll have to think that through more thoroughly but the AI industry is already violating copyright big time. Maybe we get rid of it (but for the wrong reason).

@gregx @leon @hook

Watching Michiel Leenaars' talk at FOSDEM I want to gather my thoughts around

There is no coding agent,
just other's people code

@len, when I was still young and naïve, I did ask in a group of smart Free Software veterans, if abolition of copyright would make everything Free Software or destroy it. IIRC they did not like the question.

Copyleft maximalists need to be (to some extent) copyright maximalists to achieve their goal.

As a consequence, I think AI-washing has resurfaced the copyleft vs permissive licensing philosophical schism, which some (IMHO too vaguely) call FS vs OSS schism.

@gregx @leon

@len, AFAIK writing software is relatively easy, compared to maintaining and supporting it. And if you don’t understand how the software works, it’s pretty hard to maintain and support.

IMHO, a lot of vibe coded software will end up in trash once it’s time to update it and patch something serious.

And if LLMs were used to help write software that’s not just vibe-coded, then a lot of human work needed to be done already upfront.

@gregx @leon