TDM výjimka a výhrada z ní ve světle trénování jazykových modelů generativní umělé inteligence – část II.
Autor: JUDr. Jiří Čermák | Vloženo: 25. 8. 2025 10:08 | Přečteno: 96XV tomto díle se zaměřím na otázku, zda lze výjimku pro text a data mining (TDM) uplatnit i na obsah, který je na internetu zpřístupněn bez souhlasu nositele práv. Jde totiž o oblast, kterou právo EU výslovně neupravuje a jejíž řešení závisí na výkladu jak samotné směrnice DSM, tak i jejích národních implementací.
4.2 Lze TDM výjimku uplatnit na obsah, který byl na internetu zpřístupněn neoprávněně?
DSM směrnice používá pojem „zákonný přístup“ (lawful access) [1] jako podmínku pro použití TDM výjimky, přičemž tento pojem nevymezuje – pouze v recitálu č. 14 uvádí, že zákonný přístup by měl zahrnovat také přístup k obsahu, který je volně dostupný online. Český autorský zákon tuto otázku vůbec neupravuje.
Na požadavek „zákonného přístupu“ pak lze nahlížet dvěma způsoby.
První výklad je založen na tom, že pokud je obsah volně přístupný bez technických omezení (např. nejde o placený obsah s omezeným přístupem za tzv. paywall), uživatel splňuje požadavek zákonného přístupu – i když byl obsah zveřejněn na internetu nezákonně (bez souhlasu nositele práv, tj. nezákonný obsah).
Tento výklad je podpořen i tím, že v praxi často není možné (ani pro automatizované systémy, ani pro člověka) poznat, zda daný obsah byl na internet umístěn oprávněně či nikoliv. Vyloučení veškerého „nelegálního“ obsahu by značně omezilo účel a efektivitu TDM výjimky.
Existuje i určitá analogie s omezenou odpovědností poskytovatele služeb hostingu podle nařízení DSA[2] (a dříve směrnice o elektronickém obchodu[3]), kdy poskytovatel služeb hostingu obecně nenese odpovědnost za nezákonný obsah poskytnutý třetí stranou, dokud se o nezákonné povaze takového obsahu nedoví[4].
V neposlední řadě je z jazykového hlediska rozdíl mezi pojmem „nezákonný obsah“ (illegal content) a nedostatek „zákonného přístupu“ (lawful access), přičemž pokud by zákonodárce měl v úmyslu vyloučit z TDM výjimky obsah zpřístupněný neoprávněně, pravděpodobně by použil již zavedený pojem „nezákonný obsah“.
Opačný výklad připomíná, že „zákonný přístup“ znamená nejen technicky volný přístup, ale především, že obsah je přístupný se souhlasem nositele práv nebo na základě zákonné výjimky. Neboť smyslem TDM výjimky není vytvořit z přístupu k nezákonnému obsahu „legální“ užití v rámci TDM. Výjimka podle tohoto názoru byla přijata s předpokladem existence legálně zpřístupněného obsahu.
Ten je podpořen argumentem, že pouze na oprávněně (legálně) zpřístupněný obsah mohou nositelé práv efektivně uplatnit výhradu z TDM výjimky (opt-out). U nezákonnému obsahu (nelegálně zveřejněných děl) tato možnost v praxi mizí, protož nositel nemá takový obsah pod kontrolou a často o něm ani neví.
Tento výklad je podpořen i třístupňovým testem, který (zjednodušeně řečeno) znamená, že výjimky (včetně TDM výjimky) je třeba vykládat v případě pochybností restriktivně.
Tato otázka zůstává tedy stále otevřená, nicméně z převažujícího evropského přístupu a výkladu pojmu „zákonný přístup“ plyne závěr, že TDM výjimku lze využít pouze u oprávněně zpřístupněného obsahu (tj. pokud je obsah zveřejněn s vědomím a svolením nositele práv nebo spadá pod jinou zákonnou výjimku). K tomuto závěru se kloním i já.
Pro úplnost uveďme i nedávné rozhodnutí kalifornského federálního soudu[5] ve věci Bartz vs. Anthropic[6], které vyvolalo živý zájem odborné veřejnosti zejména tím, že soud rozhodl, že samotný proces strojového učení AI, při kterém jsou užita autorská díla zejména jejich rozmnožováním, spadá pod výjimku tzv. fair use[7] z US Copyright Act. To znamená, že při samotném učení AI jazykových modelů nedohází k zásahu do autorských práv k použitému obsahu (chráněným dílům), i když k takovému jednání nebyla udělena licence. Jde o zlomové rozhodnutí, které však přesahuje rozsah a téma tohoto článku.
Soud nicméně odmítl argumentaci společnosti Anthropic (žalovaného), že trénování AI je transformativní[8] natolik, že by mohlo ospravedlnit i užití nelegálního obsahu. Výslovně zdůraznil, že existuje „zásadní rozdíl mezi daty, která byla získána legálně, a těmi, která byla získána protiprávně“. Legalita získání dat je tedy důležitá i v posuzování případné výjimky fair use při strojovém učení, tedy v podstatě i v rámci TDM. Jinými slovy – stanovisko soudu jasně směřuje k tomu, že strojové učení na nelegálně získaných dílech je v rozporu s autorským právem a nemůže být legitimizováno samotným charakterem trénování AI.
Pokud toto stanovisko převedeme do evropského právního prostředí, a to zejména ve vztahu k TDM výjimce, podporuje závěr, že TDM výjimku (analogicky k americké výjimce fair use) je možné aplikovat jen na takový obsah, který byl zpřístupněn oprávněně.
Autor: JUDr. Jiří Čermák, cermak@lawyer.cz | LinkedIn
Jiří je advokátem v advokátní kanceláři Jansa, Mokrý, Otevřel & partneři s.r.o., kde se specializuje na právo informačních technologií (především na počítačové a softwarové právo, internetové právo a outsourcing informačních technologií) a právo duševního vlastnictví (zejména právo ochranných známek, autorské právo a mediální právo) a na související spory. Působil více než 21 let jako advokát a partner v mezinárodní advokátní kanceláři Baker McKenzie v Praze, kde vedl oddělení pro právo duševního vlastnictví a technologie.
___________________
[1] čl. 3 a 4 DSM
[2] Nařízení Evropského parlamentu a Rady (EU) 2022/2065 ze dne 19. října 2022 o jednotném trhu digitálních služeb a o změně směrnice 2000/31/ES (nařízení o digitálních službách, DSA)
[3] Směrnice Evropského parlamentu a Rady 2000/31/ES ze dne 8. června 2000 o některých právních aspektech služeb informační společnosti, zejména elektronického obchodu, na vnitřním trhu (směrnice o elektronickém obchodu)
[4] Článek 6 nařízení DSA
[5] Jde o tzv. summary judgement- Order on Fair Use ze dne 23. června 2025, dostupné online https://admin.bakerlaw.com/wp-content/uploads/2025/07/ECF-231-Order-on-Fair-Use.pdf (navštíveno 4. 7. 2025)
[6] Andrea Bartz, et al. v. Anthropic PBC, Case No. 24-CV-05417-WHA
[7] Fair use je obecná výjimka (či omezení) autorského práva podle amerického právního řádu. Umožňuje za určitých okolností použít chráněné autorské dílo bez svolení držitele práv. Tato doktrína je zakotvena v § 107 amerického US Copyright Act. Soudy posuzují, zda konkrétní užití spadá pod fair use, podle těchto čtyř faktorů:
1.Účel a povaha užití (např. komerční vs. nekomerční, transformativní užití, vzdělávací účel apod.),
2.Povaha autorského díla (např. beletrie vs. fakta, publikované vs. nepublikované),
3.Množství a podstatnost použité části (kolik z celku bylo převzato a jak zásadní je to část),
4.Dopad na potenciální trh nebo hodnotu díla (zda užití nahrazuje dílo na trhu nebo jinak poškozuje nositele práv).
Ani jeden faktor není sám o sobě rozhodující – jde vždy o posouzení všech okolností.
[8] Jedna z forem užití, která odůvodňuje aplikaci výjimky fair use