Het zou je maar gebeuren: je ontdekt dat jouw blog content overgenomen is op een andere website. Met alles erop en eraan, zonder jouw toestemming. In dat geval ben je waarschijnlijk een slachtoffer van blog content scraping. Niet fijn, maar je kan er wel actie tegen proberen te ondernemen. In dit artikel lees je wat je kan doen.
Wat is scraping?
Eerst en vooral: scraping kan zowel goedaardig als kwaadaardig worden ingezet. Dit is een digitale techniek die al zo oud is als het internet zelf. Hierbij wordt software ingezet om het internet af te struinen naar waardevolle informatie, deze te onttrekken aan de bron en deze data eventueel te analyseren.
Is scraping legaal?
De website Skyscanner doet dit bijvoorbeeld op een goedaardige en legale manier: het verzamelt vliegtarieven van verschillende luchtvaartmaatschappijen en heeft met hen akkoorden gesloten om hun data te gebruiken. Verder zijn zoekmachines als Google ook scrapers: zij zoeken het hele internet af om jou de nodige informatie te kunnen verschaffen.
Maar wanneer er zonder toestemming een complete blog integraal wordt overgenomen op een andere website, dan hebben we het over een illegale vorm van scraping. Het is mij het afgelopen halfjaar al twee keer overkomen. En ik kon hier in de eerste instantie niet bepaald om lachen.
Wil je meer weten over een wettelijk kader rond scraping? Lees hier een interessant artikel uit 2018 van De Tijd.
Hoe weet ik of ik slachtoffer van scraping ben?
Persoonlijk kwam ik hierachter toen ik mezelf opzocht via Google. Ik doe dat namelijk regelmatig. De partijen die aan scraping deden, haalde ik er direct uit: een volstrekt onbekende URL gebruikte mijn naam en mijn blogtitels. Toen ik erop klikte, zag ik tot overmaat van ramp dat software mijn artikels inclusief mijn ondernemingsnummer en afbeeldingen hadden gedupliceerd!
Wil je het uitzoeken? Google dan naar je eigen naam of naar de titels van je blogs.
Waarom doen mensen aan blog content scraping?
Goede vraag. Blogs die als betrouwbaar en waardevol worden gezien door Google, maken het meeste kans om gedupliceerd te worden door scraping software. Mensen die hierachter zitten, hebben doorgaans nood aan websitebezoekers die hun inkomsten doen genereren. En als je zelf niet goed over iets kan schrijven, kan je het natuurlijk heel gemakkelijk aanpakken. Gewoon lekker illegaal content kopiëren. Echt, hoe stom kun je zijn!
Het is doorgaans geen persoon die de scraping actie onderneemt: dat doet gewoon de software. Jan en alleman kunnen een domeinnaam en WordPress hosting kopen en daar een scraping pakket opzetten voor een paar honderd euro. En voilà, zo komen kwaadwillende lieden aan een illegaal passief verdienmodel.
Wil je weten of data scrapen mag? Dit advocatenbureau geeft in een artikel de nodige juridische achtergrond.
Help, mijn blog is gedupliceerd! Wat moet ik doen?
Haal in de eerste plaats even rustig adem. Er zijn namelijk verschillende manieren om hiermee om te gaan. Volgende manieren kan je toepassen:
1. Neem contact op met de eigenaar van de website
Een beetje vriendelijke scraper zet contactgegevens in zijn of haar footer of over mij pagina. De eerste keer zag ik een e-mailadres staan waarnaar ik direct een bericht stuurde met daarin de vraag om deze content te verwijderen omdat ik deze actie als illegaal beschouwde. Nog geen halfuur later werd deze verwijderd en kreeg ik een vriendelijk mailtje – uiteraard zonder excuses – terug.
Andere scrapers kunnen het je moeilijker maken. De tweede keer dat mij dit overkwam, kon ik een e-mailadres van een scraper achterhalen via diens social media. Wederom stuurde ik een bericht, maar ik wacht nog altijd op een reactie en uiteraard verwijdering van de illegaal gekopieerde content. Vind je helemaal geen e-mailadres? Ga even naar whois.com en zoek in hun database naar het e-mailadres van de rechtmatige eigenaar.
2. Negeer het en ga eens goed lachen
Nadat het mij de tweede keer niet lukte, ben ik mij verder in scraping gaan verdiepen. Hoe meer ik er over te weten kwam, hoe grappiger ik het begon te vinden. Eén: de dader begaat een fout die juridische consequenties kan hebben. Twee: die persoon weet mogelijk niks van het onderwerp af. Drie: hij of zij kan waarschijnlijk zelf niet eens goed schrijven.
Het feit dat jouw blog illegaal gedupliceerd is op andermans website kun je ook als een compliment beschouwen: jij weet hoe je fantastische content moet schrijven, jij weet verdomd veel van jouw onderwerp af en jij weet ook nog eens hoe je hoog in Google moet komen!
3. Maak het de scrapers moeilijk
Naar het schijnt houdt scraping software enorm veel van externe links. Dat zijn links die naar andere pagina’s buiten jouw website gaan. Dat komt omdat scraping software van affiliate links houdt. Dat zijn links die inkomsten genereren omdat de rechtmatige auteur een samenwerking met een ander bedrijf heeft. En menig scraper wil daar natuurlijk een graantje van meepikken.
Stop zeker niet met externe link building, maar probeer dit te minimaliseren. Door eerder interne links op te bouwen, zou je minder snel interessant zijn voor scraping software. Ook kun je ervoor zorgen dat je, via een blog wat illegaal gekopieerd is, nieuwe bezoekers op je eigen website krijgt! Zo zou je ze misschien wel te slim af kunnen zijn!
Er bestaan nog meer acties om te ondernemen. In dit artikel van wpbeginner vind je heel wat andere acties die je tegen scrapers kan ondernemen.
Conclusie en nawoord
Blog content scraping is dus doorgaans een hartstikke illegale actie. Je kan er even flink boos om zijn en onderneem daarna wel of geen actie. Belangrijkst is om de scraping software gewoon te slim af te zijn!
Verder is dit artikel SEO (zoekmachineoptimalisatie) proof en bevat het externe links. Ik ben namelijk benieuwd of dit artikel over scraping opgepikt gaat worden door… Een scraper! Zie je dat de URL van dit artikel niet begint met jochemoomen.com, dan ben je namelijk op een scrape versie van deze blog gekomen! Informeer me in dat geval even via info@jochemoomen.com om mij eens goed te laten lachen!
Wil je zelf een geweldige blog maken? Lees hier hoe je een blog in Divi maakt!