Advokátní kancelář Jansa, Mokrý, Otevřel & partneři - specialisté na problematiku IT práva

ChatGPT a autorská práva

Autor: Mgr. Petr Otevřel | Vloženo: 30. 3. 2023 11:14 | Přečteno: 2060X

ChatGPT je dnes již velmi známý jazykový model vytvořený společností OpenAI L.L.C. (dále „OpenAI“). Používá jej stále větší množství lidí, a to i ve svém podnikání nebo zaměstnání. S tím se objevují nové výzvy a otázky, a jednou z nich je právní povaha výstupů generovaných prostřednictvím ChatGPT, včetně rizika neoprávněného zásahu do autorských práv.  

ChatGPT je jazykový model, který dokáže zodpovědět v podstatě jakoukoliv otázku, a to v reálném čase a bezvadnou češtinou, případně v jiném jazyce. ChatGPT je založen na neuronových sítích a je trénován na obrovském množstvím textových dat, což mu umožňuje určit pravděpodobnost výskytu dalšího slova v kontextu dané věty. Navzdory tomu, že to asi zní trochu zvláštně, výsledky jsou pozoruhodné.

V tomto článku se pokusím zodpovědět následující autorskoprávní otázky:

  1. Podléhají texty vygenerované ze strany ChatGPT autorskoprávní ochraně?
  2. Mohou texty vygenerované ze strany ChatGPT představovat neoprávněný zásah do autorských práv třetí osoby, tj. autora nebo jiného držitele autorských práv? Kdo nese odpovědnost za neoprávněný zásah?
  3. Jak je to s užíváním autorských děl v rámci tréninku ChatGPT a jiných AI modelů?

Podmínky užívání OpenAI

Podmínky užívání – Terms of use (dále „Podmínky“) rozlišují v článku 3 odst. a) mezi vstupními údaji a výstupními údaji. Vstupní údaje vkládají prostřednictvím tzv. promptů (prompts) sami uživatelé. Výstupní údaje generuje samotný ChatGPT. S ohledem na skutečnost, že jednotlivé odpovědi a reakce ChatGPT v sobě zahrnují také vstupní údaje, jsou vstupy a výstupy společně označovány jako obsah.  

OpenAI ve zmíněném článku 3 odst. a) postupuje uživateli veškerá svá práva, vlastnické právo a podíl na výstupu, pokud uživatel „dodržuje Podmínky“. Podmínky výslovně uvádí, že uživatel může generovaný obsah používat k jakémukoli účelu, včetně komerčních účelů, jako je prodej nebo zveřejnění.

Článek 3 odst. b) Podmínek obsahuje upozornění na to, že generovaný obsah nemusí být u různých uživatelů jedinečný, ale naopak může být podobný. Zajímavý je také článek 2 odst. c) bod (v) Podmínek, podle kterého uživatel nesmí vydávat výstup za výsledek činnosti člověka, když tomu tak není.

Podmínky nám tedy žádnou výslovnou odpověď na shora uvedené autorskoprávní otázky nedávají.

Podléhá obsah generovaný ze strany ChatGPT autorskoprávní ochraně?

Na první pohled je odpověď jednoduchá: Ne, nepodléhá. Autorský zákon (dále „AZ“) totiž definuje autorské dílo jako literární nebo jiné dílo, které je „jedinečným výsledkem tvůrčí činnosti autora.“ (§ 2 odst. 1 AZ). Autorem je „fyzická osoba, která dílo vytvořila.“ (§ 5 odst. 1 AZ). ChatGPT nebo AI sama o sobě nemůže vytvořit autorské dílo, bez ohledu na to, jak jedinečné by bylo.

Ale jak bylo uvedeno výše, ChatGPT generuje své odpovědi – výstupy na základě vstupů konkrétního uživatele.

Pokud uživatel v rámci svého promptu pouze zadává pokyn k tomu, aby ChatGPT něco vygeneroval, mohou nastat tyto situace:

  1. Uživatel následně publikuje Obsah vygenerovaný ChatGPT a přizná, že byl vytvořen prostřednictvím ChatGPT. Autorskoprávní ochrana k takovému Obsahu nikdy nevznikla, protože tvůrcem Obsahu není autor  ve smyslu AZ, tedy člověk.
  2. Uživatel bude Obsah generovaný prostřednictvím ChatGPT prezentovat jako vlastní autorské dílo. V takovém případě poruší čl. 2 odst. c) bod (v) Podmínek, který zakazuje tvrdit, že výstup ze služeb ChatGPT (popř. OpenAI) byl vytvořen člověkem, i když tomu tak není. V ten okamžik ovšem uživatel pozbývá i nevýhradní právo užívat výstup (Obsah) ve smyslu čl. 3 odst. a) Podmínek (nejedná se o nevýhradní licenci dle AZ, pouze smluvní právo užívat vygenerovaný Obsah).
  3. Uživatel upraví (zpracuje) výstup ChatGPT a teprve takto upravený jej použije a bude vydávat za vlastní autorské dílo. K takovým úpravám má uživatel dle čl. 3 odst. a) Podmínek právo a pokud dojde k "tvůrčímu zpracování", vzniknou uživateli k jeho tzv. odvozenému autorskému dílu autorská práva. A i kdyby úpravy uživatele nebyly dostatečně "tvůrčí", pravděpodobně toto nebude nikdy předmětem přezkumu a dokazování.  

Shora uvedené platí při promptu ve smyslu „vytvoř mi dětskou říkanku, ve které budou zvířátka ze statku“. A mimochodem, zmíněné zadání opravdu nedoporučuji, výsledek byl úplně „ulítlý": [Ovce blejí, kozy skákají, prasátka se válejí v blátě, kohout kokrhá, slepice snáší, psi štěkají a koně vrží.]. Říkanka však nebyla vytvořena prostřednictvím nejnovějšího GPT-4, který je údajně mnohem lepší. :-) A můj prompt byl hodně slabý, to přiznávám.

Zajímavější je situace, kdy uživatel zadá v rámci svého promptu text, který už naplňuje znaky literárního autorského díla, a poté vyzve ChatGPT, ať tento text upraví nebo doplní. Pak se jedná o zpracování autorského díla - pokud by je takto tvůrčím způsobem zpracoval člověk, vznikla by mu autorská práva k tzv. odvozenému autorskému dílu ve smyslu § 2 odst. 4 AZ. ChatGPT ovšem nemůže být autorem ve smyslu AZ a tedy ani "tvůrčím zpracovatelem". Zde může být výklad poněkud nejasný. Vychází mi z toho dvě možnosti:

  1. Uživateli jako autorovi původního autorského díla jeho práva k původnímu dílu nezanikají. Současně je na základě čl. 3 odst. a) Podmínek oprávněn užívat Obsah vygenerovaný prostřednictvím ChatGPT. A i když příliš nemohl ovlivnit výslednou podobu odvozeného díla, které vytvořil ChatGPT, má autorská práva minimálně ke svému původnímu autorskému dílu, a zejména v případě drobných úprav ze strany ChatGPT také k Obsahu, který vzniknul "s pomocí" ChatGPT. Situace v tomto případě nemusí být vždy jasná.
  2. Uživatel upraví (zpracuje) výstup ChatGPT a teprve takto upravený jej použije a bude vydávat za vlastní autorské dílo. K takovým úpravám má uživatel dle čl. 3 odst. a) Podmínek právo. Pokud uživatel vytvoří text naplňující znaky autorského díla, který nechá prostřednictvím ChatGPT upravit (tím vznikne odvozené dílo č. 1) a následně toto odvozené dílo č. 1 sám znovu upraví (tím vznikne odvozené dílo č. 2), vznikají mu k odvozenému autorskému dílu č. 2 autorská práva a může se vydávat za jeho autora ve smyslu AZ.

V případech zpracování autorského díla prostřednictvím ChatGPT by podle mého názoru měl být výklad takový, že používání technických prostředků by nemělo být autorovi na škodu, pokud je jeho vstupem v promptu jedinečné autorské dílo. Ostatně např. čl. 9 odst. 3 britského autorského zákona uvádí, že "za autora díla bude považována osoba, která vytvořila podmínky nezbytné pro vznik díla." A tím byl v tomto případě jednoznačně uživatel jako autor původního autorského díla.

Je otázkou, zda výklad "AI jako pouhý nástroj" převáží a nakolik bude extenzivní. Pokud bych shora uvedenou říkanku o zvířátkách upravoval pouze ve formě dalších a dalších pokynů v promptech, je možné, že bych se stal nakonec autorem ve smyslu AZ, i když bych nenapsal ani jedinou větu z výsledného textu? Dle mého názoru nikoliv, z mé strany by šlo spíše o námět, který není chráněn autorským právem.

Může při využívání Obsahu generovaného ChatGPT dojít k neoprávněnému zásahu do autorských práv?

Samozřejmě ano, byť bude ve většině případů riziko velmi malé. Co na to říká ChatGPT?

Z odpovědi vyplývá, že v rámci tréninku strojového modelu jsou ze strany OpenAI „činěna opatření k minimalizaci rizika takových neoprávněných zásahů do autorských práv“. Jako příklady jsou uvedeny vynechání datasetů, u nichž není jasné, zda je možné je použít, popř. využívání různých technik, jako jsou anonymizace a zkreslování dat. Ale protože je ChatGPT chytrý/á, pochopitelně nevylučuje případný neoprávněný zásah na 100%.

S ohledem na to, jakou technikou jsou odpovědi generovány, je riziko úplné reprodukce nějakého autorského díla, navíc podléhající ochraně, v podstatě naprosto zanedbatelné.

Větší riziko představuje spíše samotný uživatel, než ChatGPT. Pokud totiž uživatel ve svém promptu zadá cizí autorské dílo bez toho, aby disponoval zákonnou nebo smluvní licencí k tomuto autorskému dílu, bude i výstup představovat neoprávněné zpracování autorského díla. Např. pokud by uživatel vzal povídku, a v rámci svého promptu uložil ChatGPT, aby ji jazykově upravil, jednalo by se o zpracování autorského díla – takové zpracování, stejně jako jiné nakládání s nově vzniklým odvozeným autorským dílem (např. jeho rozmnožování, rozšiřování, sdělování veřejnosti) je možné pouze se souhlasem autora původního autorského díla.  

Na to ostatně upozorňuje i ChatGPT, pokud se jej tedy zeptáte. Viz odpověď níže:

Programujeme s GhatGPT

Je důležité zmínit, že ChatGPT se začíná využívat také při programování. Datasety, na kterých ChatGPT trénuje, totiž obsahují také počítačové programy, které jsou nejčastěji distribuovány pod licencemi free software nebo open source software. Nejčastější využívané open source licence jsou v případě ChatGPT například GNU General Public License (GPL), MIT License, Apache License, BSD License a Mozilla Public License. V důsledku toho umí ChatGPT vytvořit "správný" kód, který splní účel dle zadání uživatele.

V rámci užívání ChatGPT pro programování ovšem může časem vzniknout zdrojový kód, který podléhá alespoň zčásti tzv. silně copyleftovým open source licencím. A to může být problematické. Silně copyleftové licence totiž každému, kdo použije open source dílo pod touto licencí, ukládají povinnost zpřístupnit zdarma své zdrojové kódy nově vytvořeného odvozeného díla, které obsahuje alespoň část open source díla. Mezi silně copyleftové licence patří například GNU GPL. V okamžiku, kdy bude např. startup chtít najít investory, může toto snížit hodnotu celého startupu.

Dnes jsou v obchodních i pracovních smlouvách běžné doložky, které vymezují, zda lze při tvorbě počítačového programu nebo jeho úpravách využívat počítačové programy distribuované pod open source licencemi, případně jsou ve smlouvách taxativně vymezeny ty, které využívat lze. Nyní je načase doplnit tato ustanovení také o regulaci užívání AI při programování. 

Lze v rámci tréninku AI užívat autorská díla třetích stran?

Toto už jsme nepřímo řešili. Samozřejmě, že datasety ChatGPT a ostatních modelů obsahují autorská díla, přičemž se snaží minimalizovat riziko, že by šlo o neoprávněné užití autorských děl.

K tomu je třeba dodat, že poslední novela autorského zákona zakotvila v § 39c AZ mj. zákonnou licenci „k rozmnožování díla pro účely automatizované analýzy textů nebo dat“ – pod tímto krkolomným názvem se skrývá oprávnění provádět tzv. data mining. Ten může provádět kdokoliv, včetně soukromých osob, EU se tímto snaží podpořit výzkum a vývoj nových technologií. Jedná se o implementaci směrnice č. 2019/790 o autorském právu na jednotném digitálním trhu, která namísto pojmu „automatizovaná analýza“ používá výstižnějšího termínu „vytěžování“. Nutno ovšem dodat, že rozmnoženinu autorského díla zhotovenou v rámci automatizované analýzy může oprávněný subjekt „uchovat pouze po dobu nezbytnou pro účely této automatizované analýzy textů nebo dat“. Uvedenou zákonnou licenci tedy nelze vykládat tak, že by oprávněný subjekt získal v rámci data miningu autorská práva k předmětnému dílu natrvalo.

Autor nebo držitel autorských práv je dle § 39c odst. 2 AZ oprávněn dát proti automatizované analýze výhradu, ovšem toto musí učinit „vhodným způsobem“. V některých případech bude takovým vhodným způsobem ujednání ve smlouvě, ale u on-line dostupných autorských děl je třeba výhrady provedené pomocí strojově čitelných prostředků, včetně metadat. Tedy strukturováním metadat do formátu, který jsou automatizované nástroje pro data mining schopny přečíst. Naopak obecná výhrada někde v podmínkách užívání webových stránek dostatečnou výhradou není.

Závěr

Ohlasy na ChatGPT jsou převážně pozitivní, místy až nadšené. Přesto by při aplikaci ChatGPT zejména do firemní praxe neměla být opomíjena možná právní rizika. Vedle autorských práv je důležité vzít v úvahu také nakládání s  osobními údaji, obchodním tajemstvím nebo zákonnou povinnost mlčenlivosti vybraných profesí, včetně advokátů. Společnost OpenAI se v Podmínkách užívání zříká veškeré odpovědnosti, což by měli uživatelé vzít na vědomí. Snažit se zamezit využívání AI technologií určitě není správný přístup. Na druhou stranu by měli uživatelé zejména z řad podnikatelů a veřejné správy pečlivě zanalyzovat případná rizika s tím spojená a následně o nich informovat své zaměstnance a  nastavit pravidla využívání těchto technologií. V blízké budoucnosti lze očekávat vznik nových interních předpisů, které se budou těmito tématy zabývat.

Autor: Mgr. Petr Otevřelotevrel@lawyer.cz | LinkedIN

Autor působí v advokátní kanceláři Jansa, Mokrý, Otevřel & partneři s.r.o., kde se zabývá zejména smluvní úpravou v oblasti informačních technologií, autorským a obchodním právem.