Skandální zjištění v AI! Vědci objevili podezřelé materiály
- Stanfordští vědci objevili podezřelé obrázky v databázi Laion-5B
- Na této databázi je postaven např. Stable Diffusion nebo Imagen
- Databáze obsahovala více než 3226 obrázků znázorňujících sexuální zneužívání dětí

Ohledně tréninkových dat a způsobu, jak se vlastně modely umělé inteligence učí, stále víme velmi málo, regulace teprve přicházejí a první právní spory nastaly pár měsíců zpátky. Stanfordská observatoř však zjistila, že nejznámější databáze obrázků LAION-5B, na které byl trénován například Stable Diffusion, obsahuje více než 3226 obrázků podezřelých z nelegálních aktivit v podobě sexuálního zneužívání dětí.
Modely generativní AI, zejména ty založené na strojovém a hlubokém učení, využívají tréninková data k učení se vzorců, pomocí kterých následně generují odpovědi na vaše otázky. Tento proces sbírání, selekce a zpracování dat je pochopitelně klíčový pro správné a kvalitní fungování. Databáze Laion je obří knihovna, index online obrázků či textů a název je zkratkou pro neziskovou organizaci Large-scale Artificial Intelligence Open Network. Tato rozsáhlá otevřená síť poskytuje až stovky milionů obrázků, díky kterým modely následně mohou generovat až fotorealistické výsledky.
Hlídací skupina Stanfordské univerzity ve spolupráci s Kanadským centrem pro ochranu dětí v těchto materiálech identifikovali nezákonný materiál a okamžitě tvůrce této databáze konfrontovali. Jediné vyjádření, kterého jsme se ze strany vývojářů dočkali, mohlo působit jako přiznání viny a samozřejmě že na odstranění škodlivých souborů pracují.
Firma má politiku nulové tolerance pro nelegální obsah. Spolupracujeme s organizacemi, jako je IWF a další, abychom ověřili odkazy v datových sadách pomocí filtrovacích nástrojů vyvinutých naší komunitou a partnerskými organizacemi, abychom zajistili jejich bezpečnost.
LAION has a zero tolerance policy for illegal content. We work with organizations like IWF and others to validate links in the LAION datasets with filtering tools developed by our community and partner organizations to ensure they are safe. https://t.co/SStsqukbFK
— LAION (@laion_ai) December 20, 2023
Jak tento spor dopadne a zda-li bude mít dlouhodobé následky v kontrolování tréninkových dat, je zatím nejisté, avšak tento případ může být prvotním katalyzátorem pro zavádění přísnějších regulací a kontrol v oblasti tréninkových dat podobných modelů. Mnoho aktivistických skupin se také rozhodlo za zrušení podobných databází bojovat a podnikají prvotní kroky v podobě peticí.
Myslíte, že dojde k regulacím tréninkových AI dat?
O autorovi
Zuzana Přibylová
Od dětství ji fascinovaly nejnovější technologie, počítače a veškeré druhy herních konzolí. S PlayStationem 1 a později Xboxem 360 začala její vášeň pro herní svět,… Více o autorovi
Mohlo by vás zajímat

Android Auto dostane schopnějšího asistenta! Takto (zhruba) vypadá Gemini v akci

Fotky Google dají uživatelům větší kontrolu, chyby AI půjde opravit
