Strava Metro loop- en fietsdata (blogdeel 1)

Data uit beweeg-apps; in vele ruimtelijke- en mobiliteitsvisies werd en wordt dit type bron als veelbelovende toepassing genoemd. Maar zo eenvoudig als het is om de kans te benoemen, zo niet-vanzelfsprekend (b)lijkt het te zijn om (a) te herkennen welke bronnen er zijn (b) uiteen te leggen welke typen gebruikers dit wel en niet vertegenwoordigt (representativiteit) en (c) hoe je data vertaalt naar kennis, die kennis vertaalt naar inzichten, en die inzichten vertaalt naar ruimtelijke ontwikkelkansen.


Voor ons (Mart Reiling en Thijs Dolders, TRACK-landscapes) is dit de afgelopen vijf jaar één van de belangrijkste onderzoeksmethodes geweest om zicht te krijgen op het gebruik van stad en landschap. Wij beschouwen de beweging van mensen als een manier van ‘spreken met de voeten’. Spreken over onze beweegredenen, onze ruimtelijke beleving en voorkeur. Kennis en begrip daarvan is in onze optiek onmisbaar bij ruimtelijke opgaves.

De afgelopen jaren zagen we een komen en gaan van mogelijkheden. Data van de fietstelweek, human.co, Endomondo, Runkeeper, Strava en meer. Diverse mogelijkheden ‘gingen’; de markt van beweegapps verandert snel en de strengere AGV-privacywetten deden diverse open-databronnen sluiten.


Maar tegen die stroom in kwam één van Nederlands meestgebruikte activity tracking apps ‘Strava’ afgelopen winter met interessant nieuws. Waar de afgelopen jaren de gegevens van Strava alleen tegen betaling toegankelijk waren (a 1 dollar per gebruiker per jaar), biedt Strava nu gratis toegang tot de (geanonimiseerde en geaggregeerde) ruimtelijke routegegevens die hun fietsende en lopende gebruikers genereren. Overheden kunnen daarbij toegang krijgen tot de gegevens van hun district/gemeente. Commerciële instellingen en onderzoeksinstellingen kunnen die toegang ook krijgen indien ze in opdracht/samenwerkingen werken met die overheid.


Maar wat weten we nu van deze bron van gegevens? Welke typen fietsers en lopers representeert dit wel en niet? Welke mogelijkheden bieden de aangeboden datastructuren? En voor welke toepassingen kan dit nu en in de toekomst waardevol zijn? Wij zien veel mogelijkheden en waarde in deze datasets, en tegelijkertijd ook nog uitdagingen, en mogelijkheden om de datasets te verrijken. In deze vierdelige blogreeks geven we hier inzicht in.


In deel één beschouwen we (sportief) recreatief fietsen, deel twee utilitair fietsen, en in deel 3 (hard)lopen.


Deel 1: Wat is Strava (Metro)? De analysemogelijkheden uitgelegd


Strava mogelijkheden Track-Landscapes
Strava mogelijkheden Track-Landscapes

Strava bestaat sinds 2009 en is inmiddels gebaseerd in California, US. Met inmiddels meer dan 80 miljoen gebruikers wereldwijd is het één van de grootste ‘activity-tracking apps’ ter wereld. Strava groeide in 2020/2021 met ruim 2 miljoen nieuwe gebruikers per maand. Strava is vooral bekend om het fanatiek-sportieve karakter. Strava biedt fietsers en hardlopers de mogelijkheid om persoonlijke snelheden op ‘segmenten’ (door gebruikers gedefinieerde stukken weg) te vergelijken met andere Strava gebruikers. In de eerste jaren trok vooral fanatieke wielrenners en hardlopers, waaronder bekende gebruikers als Lance Armstrong en Laurens ten Dam. Maar de laatste jaren wordt het gebruik van Strava in Nederland steeds meer mainstream. Met mogelijkheden om activiteiten met foto’s op je timeline te plaatsen, is Strava steeds sterker een sportieve/actieve vorm van social media aan het worden waarbinnen vrienden en familie elkaars actieve belevenissen kunnen volgen. En dat wordt ook steeds sterker zichtbaar in de activiteiten die met Strava worden opgenomen. Er zijn tientallen ‘activity types’ binnen strava, maar m.b.t. het analyseren van ruimtegebruik zijn er op dit moment drie interessante groepen te onderscheiden:


1. Sportief-recreatief fietsen: Recreatief fietsen (fietsen als vrijetijdsbesteding) met een sportieve aard/motivatie. De meeste Strava recreatieve fietsritten hebben een sportieve aard (vandaar dat we deze term kiezen), maar niet allemaal. Een klein deel is alleen ‘recreatief fietsen’.

2. Utilitair fietsen: Fietsactiviteiten met hoofdzakelijk een transport/verplaatsingsmotief. Strava zelf spreekt van ‘bike commutes’, echter wordt met ‘commute’ normaal gesproken alleen woon-werk fietsritten bedoeld. Maar de Strava ‘bike commutes’ bevat alle soorten utilitaire fietsritten, ook bijvoorbeeld naar een winkelcentrum, vriend of sportclub.

3. (Hard)lopen: Binnen Strava zijn hardloopactiviteiten en recreatieve wandelactiviteiten samengevoegd onder één noemer; ‘foot’. Het zijn echter vooral hardloopactiviteiten, het aandeel recreatieve wandelactiviteiten is relatief klein.


Data structuren Strava Metro

Alvorens we de verschillende typen gebruikersgroepen apart bezien, tonen we eerst welke gegevens, in welke structuren te verkrijgen zijn. Deze datastructuren zijn namelijk voor de verschillende groepen gelijk.


Uiteraard kan en wil Strava geen persoonsgebonden gegevens delen, daarom zijn gegevens geaggregeerd tot straatniveau. In de tabellen die via Strava Metro te downloaden zijn, is van elke straat, weg of pad in de OpenStreetMap, inzichtelijk hoe vaak deze gepasseerd is door iemand die zijn rit/loopje opnam met Strava.


Strava maakt daarbij eerst een opdeling in ‘foot’ en ‘bike’. Binnen deze twee activiteiten kan vervolgens gekozen worden of je een data-tabel van alleen ‘commute’, ‘leisure’, of beide (bij elkaar opgeteld) wilt downloaden. Bij ‘bike’ is dit een zeer zinvolle opdeling, bij ‘foot’ is het aandeel commute zo laag dat de analytische mogelijkheden te klein zijn (in Amsersfoort 2% van alle ‘foot’ activiteiten).


De tabel die gedownload kan worden, bestaat uit duizenden rijen en ruim 30 kolommen. De rijen bestaan uit de OSM-straatsegmenten, de zogenaamd ‘Egde _UID’. Voor elk straatsegment zijn nog diverse ‘subsets’ (kolommen) gemaakt. Alle hieronder benoemde kolommen bestaan in tweevoud, beide rijrichtingen hebben één kolom. In sommige kolommen is daarbij het aantal gepasseerde trips geteld:


- Total trips count

- Morning / Evening trip count.

- Leisure / commute trip count.


Bij andere kolommen is niet het aantal gepasseerde trips, maar het aantal gepasseerde people (unieke personen) geteld:


- Male / Female

- Age 13-19 / age 20-34 / age 35-54 / age 55-64 / age 65+


Behalve deze onderverdelingen is er nog een andere subsets/kolommen:


- Avg Speed; gemiddelde snelheid op het straatsegment





Vervolgens kunnen nog keuzes gemaakt worden voor verschillende tijdsframes waarvan je de gegevens wilt downloaden. De bovengenoemde kolommen zijn voor de tabellen van deze tijdsframes gelijk, verschillen zitten in de rijen. Strava geeft vier keuzes:


- Yearly. De optelsom van passages over een volledig jaar. Je kunt kiezen voor alle afzonderlijke jaren van ‘2016’ t/m ‘2020’. 2021 is, als onvolledig jaar, nog niet beschikbaar.

- Monthly. De optelsom van passages over een maand. Er zijn maximaal twaalf maanden te selecteren, elke van deze maanden krijgt per straatsegment één rij.

- Daily.Hierin heeft binnen het tijdsframe van maximaal drie maanden, elke dag één aparte rij voor elk straatsegment.

- Hourly. Hierin is binnen het tijdsframe van maximaal één maand, voor elke dag van deze maand, voor elk uur één rij voor elk straatsegment. In theorie levert dit dus een enorme aantal rijen op.


Strava Metro datastructuren
Strava Metro datastructuren

Bij de tellingen in de gedownloade tabel, wordt altijd afgerond naar ‘5’. Hiermee wordt nog een soort extra privacylaag toegevoegd, als maar één persoon op een weg is geweest is dit onzichtbaar. Het moeten er minimaal drie zijn (dat wordt afgerond naar 5). Dit resulteert echter wel in een probleem binnen de dataframes ‘daily’ en ‘hourly’. Binnen één dag, passeert op het grootste deel van de straten, geen drie Strava gebruikers. Bijvoorbeeld; in IJsselstein en Amersfoort (waar we de Strava data al toepaste) haalt ~80% van de straten nooit 3 ‘bike_leisure’ trips per dag, en haalt ~95% van straten nooit 3 ‘bike_leisure trips’ per dag. In het dataframe ‘hourly’ is dit aantal straten dat wegvalt, nog groter.

De dataframes ‘hourly’ en ‘daily’ zeggen daarom alleen iets over wegen die zeer veel gepasseerd worden. Van die wegen kunnen wel tijdspatronen geanalyseerd worden. Maar voor analyses van routegebruik bieden deze datasets beperkte mogelijkheden.


Om deze reden zijn de dataframes ‘monthly’ en ‘yearly’ toegevoegd, waarin een optelsom van langere periodes wordt gemaakt. Daarbinnen is deze afronding naar 5 geen probleem meer.


Analysemogelijkheden Strava Metro

Echter bieden de kolommen van deze dataframes weer weinig mogelijkheden om ruimtelijke analyses, tijd-specifiek te maken. Er bestaan in deze dataframes bijvoorbeeld geen kolommen van ‘uren van de dag’, waardoor verschil in routegebruik tijdens daglicht vs. in het donker, niet gemaakt kunnen worden. Ook is er bijvoorbeeld geen verschil tussen ‘week’ en ‘weekend’, wat bij vrijwel elk type activiteit een interessant onderscheid zou zijn.


Maar, er zijn nog steeds diverse interessante analyses te maken met de Strava Metro data, voor zowel sportief-recreatieve fietsers,

- Kaarten van routegebruik (zogenaamde heatmaps).

- Kaarten van routegebruik; veranderingen door de maanden en jaren heen (vanaf 2016)

- Kaarten van routegebruik; vergelijkingen tussen verschillende leeftijdsgroepen en sexen.

- Kaarten van snelheden op routes.

- Tijdspatronen van gebruik, van zeer populaire routes.


Strava Metro analyses heatmaps
Strava Metro analyses heatmaps

Benieuwd naar hoe we dit soort analyses doorvertalen naar visies, strategieën en ontwerpvoorstellen? In Amersfoort brachten met data van Strava Metro het gebruik van fietsers, lopers en mountainbikers in kaart, voor een visie op routegebonden recreatie in de regio. In Utrecht brachten we met gegevens van Endomondo de gedeelde belangen van recreatief en utilitair fietsverkeer in kaart, zie bijvoorbeeld de blog mooi-snelfietsroutes. Ook in Brussel, Rotterdam en Amstelveen werd deze dataset, tezamen met gegevens van Runkeeper, ingezet om sportief gebruik van de openbare ruimte te bevorderen.