Voor wie eigen modellen traint is auteursrecht een directe compliance-vraag. EU heeft TDM-uitzondering die training onder voorwaarden toestaat, maar met opt-out-mogelijkheid voor rightsholders.
TDM-uitzondering art. 3 en 4 DSM-richtlijn
Art. 3: text and data mining voor wetenschappelijk onderzoek door onderzoeksinstellingen, geen opt-out mogelijk. Art. 4: voor commercieel gebruik, met opt-out-mogelijkheid voor rightsholders. Voor ondernemingen geldt art. 4.
Opt-out detecteren en respecteren
Hoe weet u welke werken zijn opt-out? Robots.txt-extensions, Yota's metadata-protocol, of expliciete claims in metadata. Een training-pipeline die opt-outs negeert heeft IP-risico. Wij implementeren opt-out-detectie als deel van data-prep.
AI Act-vereisten erbij
GPAI-providers moeten een copyright-policy publiceren plus dataset-summary. Voor downstream-providers die fine-tunen op een open-source-base: u erft de copyright-positie van de base, plus uw eigen fine-tune-data. Beide documenteren.
Risico-mitigatie
Synthetische data, gelicenseerde datasets, openbaar domein-content, en eigen organisatie-data zijn lager-risico. Web scraping-data hoger-risico. Per training afwegen welke balance past binnen risk-appetite.
Verwant: Freelance AI consultant inhuren, GPAI verplichtingen.