10. februára 2025 • 1m čítanie

Meta trénovala svoj AI model aj na ukradnutých knihách

Meta trénovala AI modely na ukradnutých dátach.

Nebola by prvá a AI spoločnosti trénujú svoje modely na rôznych dátach, ktoré sa hýbu v akejsi sivej zóne alebo sú úplne za čiarou. Tréning modelu Llama bol založený na 81,7 TB dát z pirátskeho obsahu kníh na internete. Ide o informáciu podľa novej žaloby podanej na okresnom súde v Kalifornii.

Sieť torrent tvorená nezávislými uzlami (počítačmi ľudí) môže obsahovať aj nelegálny obsah. Takýto obsah si zobrala aj Meta a autorsky chránené diela vrátane zdrojov Z-Library a LibGen poslúžili na svoje účely s AI. Vyšetrovanie tohto prípadu potvrdili aj zamestnanci spoločnosti. Žalobu podali autori kníh, ktorí hovoria o nezákonnosti stiahnutia ich diel.

Umelá inteligencia

Nahlásiť chybu

Redaktor

Michal Reiter

Sledujem aktuálne trendy z oblasti technológií, bezpečnosti, súkromia a dôveryhodnosti diania v digitálnej scéne. Mojimi rukami prešlo stovky produktov od notebookov, smartfónov cez slúchadlá až po špecializovaný hardvér. Prinášam zrozumiteľný pohľad na výzvy a problémy, ktoré so sebou prináša digitalizácia a dianie vo svete IT. Hľadaniu odpovedí v tejto oblasti sa venujem už viac ako 20 rokov.