Marile companii de AI și-au antrenat modelele lingvistice cu transcrierile filmărilor de pe YouTube
-
17 Iulie 21:00
Apple, Nvidia și alții au folosi transcrierile clipurilor de YouTube, fără permisiune, pentru a-și antrena sistemele de inteligență artificială, arată o investigație, relatează News.ro.
Conform investigației realizate de Proof News, citate de sursă, mai multe mari companii care dezvoltă tehnologii de inteligență artificială, printre care Apple, Nvidia și Anthropic și-au antrenat modelele lingvistice cu transcrierile filmărilor de pe YouTube.
Acestea au ajuns în posesia datelor prin intermediul unui nonprofit, numit EleutherAI, care a preluat transcrierile a peste 48.000 de canale de YouTube.
Și asta fără a avea vreun fel de permisiune din partea creatorilor de conținut și fără a-i compensa pe aceștia în vreun fel.
Setul de date folosit de aceste companii nu conține imagini sau filmările propriu-zise, dar include transcrierile și subtitrările clipurilor postate de unii dintre cei mai importanți creatori, precum Marques Brownlee și MrBeast.
Companiile de AI evită să fie transparente în privința datelor pe care le folosesc pentru a-și antrena modelele lingvistice. Unele dintre acestea, însă, recunosc tacit că preiau toate textele pe care le găsesc gratuit pe internet.
În același timp, cu excepția câtorva înțelegeri făcute cu unele dintre marile publicații americane, proprietarii textelor nu sunt compensați în niciun fel.