https://images.unsplash.com/photo-1522125670776-3c7abb882bc2?ixlib=rb-1.2.1&ixid=MnwxMjA3fDB8MHxwaG90by1wYWdlfHx8fGVufDB8fHx8&auto=format&fit=crop&w=1170&q=80

Google může nově používat veřejně dostupná data k trénování svých AI modelů

Společnost Google aktualizovala své zásady ochrany osobních údajů a uvedla, že může používat veřejně dostupná data, která jí pomáhají trénovat modely umělé inteligence. Technologický gigant o víkendu změnil znění svých zásad a zaměnil „modely umělé inteligence“ za „jazykové modely“. Uvedl také, že může veřejně dostupné informace používat nejen k vytváření funkcí, ale i plnohodnotných produktů, jako jsou Překladač Google, Bard a funkce Cloud AI. Aktualizací svých zásad dává uživatelům najevo, že cokoli, co zveřejní online, může být použito k tréninku Barda, jeho budoucích verzí a jakéhokoli dalšího generativního AI produktu, který Google vyvíjí.

Google není jedinou velkou společností, která využívá informace zveřejněné online k trénování svých jazykových modelů pro projekty generativní umělé inteligence. Nedávno byla podána hromadná žaloba proti společnosti OpenAI, která ji obviňuje z toho, že bez předchozího souhlasu shromažďuje obrovské množství osobních údajů z internetu (včetně soukromých informací) k trénování svých modelů GPT. Jak poznamenává Search Engine Journal, v budoucnu se pravděpodobně dočkáme mnoha podobných žalob, protože stále více společností vyvíjí vlastní produkty generativní umělé inteligence a potřebuje data, na nichž je bude trénovat.

Někteří majitelé velkých platforem již podnikli kroky, aby boomu generativní AI buď zabránili, nebo z něj profitovali. Reddit začal zpoplatňovat přístup ke svému API, což vedlo k tomu, že klienti třetích stran o víkendu ukončili svou činnost. A například Twitter zavedl omezení počtu tweetů, které uživatel za den uvidí (podle vyjádření Elona Muska právě kvůli omezení sběru dat třetími stranami).

Zdroj: engadget.com