Trendy

Skandální zjištění v AI! Vědci objevili podezřelé materiály

Stanfordští vědci objevili podezřelé obrázky v databázi Laion-5B
Na této databázi je postaven např. Stable Diffusion nebo Imagen
Databáze obsahovala více než 3226 obrázků znázorňujících sexuální zneužívání dětí

Sdílejte:

Zuzana Přibylová

Publikováno: 3.1.2024 22:00

AI Laion

Ohledně tréninkových dat a způsobu, jak se vlastně modely umělé inteligence učí, stále víme velmi málo, regulace teprve přicházejí a první právní spory nastaly pár měsíců zpátky. Stanfordská observatoř však zjistila, že nejznámější databáze obrázků LAION-5B, na které byl trénován například Stable Diffusion, obsahuje více než 3226 obrázků podezřelých z nelegálních aktivit v podobě sexuálního zneužívání dětí.

Modely generativní AI, zejména ty založené na strojovém a hlubokém učení, využívají tréninková data k učení se vzorců, pomocí kterých následně generují odpovědi na vaše otázky. Tento proces sbírání, selekce a zpracování dat je pochopitelně klíčový pro správné a kvalitní fungování. Databáze Laion je obří knihovna, index online obrázků či textů a název je zkratkou pro neziskovou organizaci Large-scale Artificial Intelligence Open Network. Tato rozsáhlá otevřená síť poskytuje až stovky milionů obrázků, díky kterým modely následně mohou generovat až fotorealistické výsledky.

What is wrong not just with LAION, but all the scraping of our images and writings to train AI.

Let’s shut this down.
Because we care. https://t.co/hAMc3cjlMv pic.twitter.com/U65VeQp5zc
— Remmelt Ellen?remmelt@mas.to, remmelt@bsky.social (@RemmeltE) January 2, 2024

Hlídací skupina Stanfordské univerzity ve spolupráci s Kanadským centrem pro ochranu dětí v těchto materiálech identifikovali nezákonný materiál a okamžitě tvůrce této databáze konfrontovali. Jediné vyjádření, kterého jsme se ze strany vývojářů dočkali, mohlo působit jako přiznání viny a samozřejmě že na odstranění škodlivých souborů pracují.

Firma má politiku nulové tolerance pro nelegální obsah. Spolupracujeme s organizacemi, jako je IWF a další, abychom ověřili odkazy v datových sadách pomocí filtrovacích nástrojů vyvinutých naší komunitou a partnerskými organizacemi, abychom zajistili jejich bezpečnost.

LAION has a zero tolerance policy for illegal content. We work with organizations like IWF and others to validate links in the LAION datasets with filtering tools developed by our community and partner organizations to ensure they are safe. https://t.co/SStsqukbFK
— LAION (@laion_ai) December 20, 2023

Jak tento spor dopadne a zda-li bude mít dlouhodobé následky v kontrolování tréninkových dat, je zatím nejisté, avšak tento případ může být prvotním katalyzátorem pro zavádění přísnějších regulací a kontrol v oblasti tréninkových dat podobných modelů. Mnoho aktivistických skupin se také rozhodlo za zrušení podobných databází bojovat a podnikají prvotní kroky v podobě peticí.

Myslíte, že dojde k regulacím tréninkových AI dat?

Zdroj: Cyber.Fsi, Laion

O autorovi

Zuzana Přibylová

Od dětství ji fascinovaly nejnovější technologie, počítače a veškeré druhy herních konzolí. S PlayStationem 1 a později Xboxem 360 začala její vášeň pro herní svět,… Více o autorovi

Sdílejte:

Vložit komentář

Mohlo by vás zajímat

Integrace Google Gemini do Android Auto

Android Auto dostane schopnějšího asistenta! Takto (zhruba) vypadá Gemini v akci

Fotky Google, třídění fotografií

Fotky Google dají uživatelům větší kontrolu, chyby AI půjde opravit

Libor Foltýnek

Samsung Ballie

Roztomilý robůtek od Samsungu zamíří do domácností. Malý AI asistent pomůže zahnat nudu i samotu