Voor wie eigen modellen traint is auteursrecht een directe compliance-vraag. EU heeft TDM-uitzondering die training onder voorwaarden toestaat, maar met opt-out-mogelijkheid voor rightsholders.

TDM-uitzondering art. 3 en 4 DSM-richtlijn

Art. 3: text and data mining voor wetenschappelijk onderzoek door onderzoeksinstellingen, geen opt-out mogelijk. Art. 4: voor commercieel gebruik, met opt-out-mogelijkheid voor rightsholders. Voor ondernemingen geldt art. 4.

Opt-out detecteren en respecteren

Hoe weet u welke werken zijn opt-out? Robots.txt-extensions, Yota's metadata-protocol, of expliciete claims in metadata. Een training-pipeline die opt-outs negeert heeft IP-risico. Wij implementeren opt-out-detectie als deel van data-prep.

AI Act-vereisten erbij

GPAI-providers moeten een copyright-policy publiceren plus dataset-summary. Voor downstream-providers die fine-tunen op een open-source-base: u erft de copyright-positie van de base, plus uw eigen fine-tune-data. Beide documenteren.

Risico-mitigatie

Synthetische data, gelicenseerde datasets, openbaar domein-content, en eigen organisatie-data zijn lager-risico. Web scraping-data hoger-risico. Per training afwegen welke balance past binnen risk-appetite.

Verwant: Freelance AI consultant inhuren, GPAI verplichtingen.