Skandální zjištění v AI! Vědci objevili podezřelé materiály
- Zprávičky
- Zuzana Přibylová
- 3.1.2024
- 5
- Stanfordští vědci objevili podezřelé obrázky v databázi Laion-5B
- Na této databázi je postaven např. Stable Diffusion nebo Imagen
- Databáze obsahovala více než 3226 obrázků znázorňujících sexuální zneužívání dětí
Ohledně tréninkových dat a způsobu, jak se vlastně modely umělé inteligence učí, stále víme velmi málo, regulace teprve přicházejí a první právní spory nastaly pár měsíců zpátky. Stanfordská observatoř však zjistila, že nejznámější databáze obrázků LAION-5B, na které byl trénován například Stable Diffusion, obsahuje více než 3226 obrázků podezřelých z nelegálních aktivit v podobě sexuálního zneužívání dětí.
Modely generativní AI, zejména ty založené na strojovém a hlubokém učení, využívají tréninková data k učení se vzorců, pomocí kterých následně generují odpovědi na vaše otázky. Tento proces sbírání, selekce a zpracování dat je pochopitelně klíčový pro správné a kvalitní fungování. Databáze Laion je obří knihovna, index online obrázků či textů a název je zkratkou pro neziskovou organizaci Large-scale Artificial Intelligence Open Network. Tato rozsáhlá otevřená síť poskytuje až stovky milionů obrázků, díky kterým modely následně mohou generovat až fotorealistické výsledky.
What is wrong not just with LAION, but all the scraping of our images and writings to train AI.
Let’s shut this down.
Because we care. https://t.co/hAMc3cjlMv pic.twitter.com/U65VeQp5zc— Remmelt Ellen?remmelt@mas.to, remmelt@bsky.social (@RemmeltE) January 2, 2024
Hlídací skupina Stanfordské univerzity ve spolupráci s Kanadským centrem pro ochranu dětí v těchto materiálech identifikovali nezákonný materiál a okamžitě tvůrce této databáze konfrontovali. Jediné vyjádření, kterého jsme se ze strany vývojářů dočkali, mohlo působit jako přiznání viny a samozřejmě že na odstranění škodlivých souborů pracují.
Firma má politiku nulové tolerance pro nelegální obsah. Spolupracujeme s organizacemi, jako je IWF a další, abychom ověřili odkazy v datových sadách pomocí filtrovacích nástrojů vyvinutých naší komunitou a partnerskými organizacemi, abychom zajistili jejich bezpečnost.
LAION has a zero tolerance policy for illegal content. We work with organizations like IWF and others to validate links in the LAION datasets with filtering tools developed by our community and partner organizations to ensure they are safe. https://t.co/SStsqukbFK
— LAION (@laion_ai) December 20, 2023
Jak tento spor dopadne a zda-li bude mít dlouhodobé následky v kontrolování tréninkových dat, je zatím nejisté, avšak tento případ může být prvotním katalyzátorem pro zavádění přísnějších regulací a kontrol v oblasti tréninkových dat podobných modelů. Mnoho aktivistických skupin se také rozhodlo za zrušení podobných databází bojovat a podnikají prvotní kroky v podobě peticí.
AI Scandal: Child Abuse Images Found in LAION-5B Dataset
Myslíte, že dojde k regulacím tréninkových AI dat?
Od dětství ji fascinovaly nejnovější technologie, počítače a veškeré druhy herních konzolí. S PlayStationem 1 a později Xboxem 360 začala její vášeň pro herní svět,… více o autorovi
Komentáře (5)
Přidat komentář