TOPlist

Skandální zjištění v AI! Vědci objevili podezřelé materiály

AI Laion
  • Stanfordští vědci objevili podezřelé obrázky v databázi Laion-5B
  • Na této databázi je postaven např. Stable Diffusion nebo Imagen
  • Databáze obsahovala více než 3226 obrázků znázorňujících sexuální zneužívání dětí

Ohledně tréninkových dat a způsobu, jak se vlastně modely umělé inteligence učí, stále víme velmi málo, regulace teprve přicházejí a první právní spory nastaly pár měsíců zpátky. Stanfordská observatoř však zjistila, že nejznámější databáze obrázků LAION-5B, na které byl trénován například Stable Diffusion, obsahuje více než 3226 obrázků podezřelých z nelegálních aktivit v podobě sexuálního zneužívání dětí.

Modely generativní AI, zejména ty založené na strojovém a hlubokém učení, využívají tréninková data k učení se vzorců, pomocí kterých následně generují odpovědi na vaše otázky. Tento proces sbírání, selekce a zpracování dat je pochopitelně klíčový pro správné a kvalitní fungování. Databáze Laion je obří knihovna, index online obrázků či textů a název je zkratkou pro neziskovou organizaci Large-scale Artificial Intelligence Open Network. Tato rozsáhlá otevřená síť poskytuje až stovky milionů obrázků, díky kterým modely následně mohou generovat až fotorealistické výsledky.

Hlídací skupina Stanfordské univerzity ve spolupráci s Kanadským centrem pro ochranu dětí v těchto materiálech identifikovali nezákonný materiál a okamžitě tvůrce této databáze konfrontovali. Jediné vyjádření, kterého jsme se ze strany vývojářů dočkali, mohlo působit jako přiznání viny a samozřejmě že na odstranění škodlivých souborů pracují.

Firma má politiku nulové tolerance pro nelegální obsah. Spolupracujeme s organizacemi, jako je IWF a další, abychom ověřili odkazy v datových sadách pomocí filtrovacích nástrojů vyvinutých naší komunitou a partnerskými organizacemi, abychom zajistili jejich bezpečnost.

Jak tento spor dopadne a zda-li bude mít dlouhodobé následky v kontrolování tréninkových dat, je zatím nejisté, avšak tento případ může být prvotním katalyzátorem pro zavádění přísnějších regulací a kontrol v oblasti tréninkových dat podobných modelů. Mnoho aktivistických skupin se také rozhodlo za zrušení podobných databází bojovat a podnikají prvotní kroky v podobě peticí.

AI Scandal: Child Abuse Images Found in LAION-5B Dataset

AI Scandal: Child Abuse Images Found in LAION-5B Dataset

Myslíte, že dojde k regulacím tréninkových AI dat?

Zdroj: Cyber.Fsi, Laion

Zuzana Přibylová
O Autorovi - Zuzana Přibylová

Od dětství ji fascinovaly nejnovější technologie, počítače a veškeré druhy herních konzolí. S PlayStationem 1 a později Xboxem 360 začala její vášeň pro herní svět,… více o autorovi

Mohlo by vás zajímat

Komentáře (5)