TOPlist

Skandální zjištění v AI! Vědci objevili podezřelé materiály

Sdílejte:
Zuzana Přibylová
Zuzana Přibylová
3.1.2024 22:00
Ikona komentáře 5
AI Laion
Reklama

  • Stanfordští vědci objevili podezřelé obrázky v databázi Laion-5B
  • Na této databázi je postaven např. Stable Diffusion nebo Imagen
  • Databáze obsahovala více než 3226 obrázků znázorňujících sexuální zneužívání dětí
Ohledně tréninkových dat a způsobu, jak se vlastně modely umělé inteligence učí, stále víme velmi málo, regulace teprve přicházejí a první právní spory nastaly pár měsíců zpátky. Stanfordská observatoř však zjistila, že nejznámější databáze obrázků LAION-5B, na které byl trénován například Stable Diffusion, obsahuje více než 3226 obrázků podezřelých z nelegálních aktivit v podobě sexuálního zneužívání dětí. Modely generativní AI, zejména ty založené na strojovém a hlubokém učení, využívají tréninková data k učení se vzorců, pomocí kterých následně generují odpovědi na vaše otázky. Tento proces sbírání, selekce a zpracování dat je pochopitelně klíčový pro správné a kvalitní fungování. Databáze Laion je obří knihovna, index online obrázků či textů a název je zkratkou pro neziskovou organizaci Large-scale Artificial Intelligence Open Network. Tato rozsáhlá otevřená síť poskytuje až stovky milionů obrázků, díky kterým modely následně mohou generovat až fotorealistické výsledky. Hlídací skupina Stanfordské univerzity ve spolupráci s Kanadským centrem pro ochranu dětí v těchto materiálech identifikovali nezákonný materiál a okamžitě tvůrce této databáze konfrontovali. Jediné vyjádření, kterého jsme se ze strany vývojářů dočkali, mohlo působit jako přiznání viny a samozřejmě že na odstranění škodlivých souborů pracují.
Firma má politiku nulové tolerance pro nelegální obsah. Spolupracujeme s organizacemi, jako je IWF a další, abychom ověřili odkazy v datových sadách pomocí filtrovacích nástrojů vyvinutých naší komunitou a partnerskými organizacemi, abychom zajistili jejich bezpečnost.
Jak tento spor dopadne a zda-li bude mít dlouhodobé následky v kontrolování tréninkových dat, je zatím nejisté, avšak tento případ může být prvotním katalyzátorem pro zavádění přísnějších regulací a kontrol v oblasti tréninkových dat podobných modelů. Mnoho aktivistických skupin se také rozhodlo za zrušení podobných databází bojovat a podnikají prvotní kroky v podobě peticí.

Myslíte, že dojde k regulacím tréninkových AI dat?

Zdroj: Cyber.Fsi, Laion

O autorovi

Zuzana Přibylová

Od dětství ji fascinovaly nejnovější technologie, počítače a veškeré druhy herních konzolí. S PlayStationem 1 a později Xboxem 360 začala její vášeň pro herní svět,… Více o autorovi

Zuzana Přibylová
Sdílejte: