Strava Metro loop- en fietsdata (2021, blogdeel 1)
- martreiling
- 24 sep 2021
- 6 minuten om te lezen
Bijgewerkt op: 1 mei 2024
Data uit beweeg-apps; in vele ruimtelijke- en mobiliteitsvisies werd en wordt dit type bron als veelbelovende toepassing genoemd. Maar zo eenvoudig als het is om de kans te benoemen, zo niet-vanzelfsprekend (b)lijkt het te zijn om (a) te herkennen welke bronnen er zijn (b) uiteen te leggen welke typen gebruikers dit wel en niet vertegenwoordigt (representativiteit) en (c) hoe je data vertaalt naar kennis, die kennis vertaalt naar inzichten, en die inzichten vertaalt naar ruimtelijke ontwikkelkansen.
Voor ons (Mart Reiling en Thijs Dolders, TRACK-landscapes) is dit de afgelopen vijf jaar ƩƩn van de belangrijkste onderzoeksmethodes geweest om zicht te krijgen op het gebruik van stad en landschap. Wij beschouwen de beweging van mensen als een manier van āspreken met de voetenā. Spreken over onze beweegredenen, onze ruimtelijke beleving en voorkeur. Kennis en begrip daarvan is in onze optiek onmisbaar bij ruimtelijke opgaves.
De afgelopen jaren zagen we een komen en gaan van mogelijkheden. Data van de fietstelweek, human.co, Endomondo, Runkeeper, Strava en meer. Diverse mogelijkheden āgingenā; de markt van beweegapps verandert snel en de strengere AGV-privacywetten deden diverse open-databronnen sluiten.
Maar tegen die stroom in kwam ƩƩn van Nederlands meestgebruikte activity tracking apps āStravaā afgelopen winter met interessant nieuws. Waar de afgelopen jaren de gegevens van Strava alleen tegen betaling toegankelijk waren (a 1 dollar per gebruiker per jaar), biedt Strava nu gratis toegang tot de (geanonimiseerde en geaggregeerde) ruimtelijke routegegevens die hun fietsende en lopende gebruikers genereren. Overheden kunnen daarbij toegang krijgen tot de gegevens van hun district/gemeente. CommerciĆ«le instellingen en onderzoeksinstellingen kunnen die toegang ook krijgen indien ze in opdracht/samenwerkingen werken met die overheid.
Maar wat weten we nu van deze bron van gegevens? Welke typen fietsers en lopers representeert dit wel en niet? Welke mogelijkheden bieden de aangeboden datastructuren? En voor welke toepassingen kan dit nu en in de toekomst waardevol zijn? Wij zien veel mogelijkheden en waarde in deze datasets, en tegelijkertijd ook nog uitdagingen, en mogelijkheden om de datasets te verrijken. In deze vierdelige blogreeks geven we hier inzicht in.
In deel ƩƩn beschouwen we (sportief) recreatief fietsen, deel twee utilitair fietsen, en in deel 3 (hard)lopen.
Deel 1: Wat is Strava (Metro)? De analysemogelijkheden uitgelegd

Strava bestaat sinds 2009 en is inmiddels gebaseerd in California, US. Met inmiddels meer dan 80 miljoen gebruikers wereldwijd is het ƩƩn van de grootste āactivity-tracking appsā ter wereld. Strava groeide in 2020/2021 met ruim 2 miljoen nieuwe gebruikers per maand. Strava is vooral bekend om het fanatiek-sportieve karakter. Strava biedt fietsers en hardlopers de mogelijkheid om persoonlijke snelheden op āsegmentenā (door gebruikers gedefinieerde stukken weg) te vergelijken met andere Strava gebruikers. In de eerste jaren trok vooral fanatieke wielrenners en hardlopers, waaronder bekende gebruikers als Lance Armstrong en Laurens ten Dam. Maar de laatste jaren wordt het gebruik van Strava in Nederland steeds meer mainstream. Met mogelijkheden om activiteiten met fotoās op je timeline te plaatsen, is Strava steeds sterker een sportieve/actieve vorm van social media aan het worden waarbinnen vrienden en familie elkaars actieve belevenissen kunnen volgen. En dat wordt ook steeds sterker zichtbaar in de activiteiten die met Strava worden opgenomen. Er zijn tientallen āactivity typesā binnen strava, maar m.b.t. het analyseren van ruimtegebruik zijn er op dit moment drie interessante groepen te onderscheiden:
1. Sportief-recreatief fietsen: Recreatief fietsen (fietsen als vrijetijdsbesteding) met een sportieve aard/motivatie. De meeste Strava recreatieve fietsritten hebben een sportieve aard (vandaar dat we deze term kiezen), maar niet allemaal. Een klein deel is alleen ārecreatief fietsenā.
2. Utilitair fietsen: Fietsactiviteiten met hoofdzakelijk een transport/verplaatsingsmotief. Strava zelf spreekt van ābike commutesā, echter wordt met ācommuteā normaal gesproken alleen woon-werk fietsritten bedoeld. Maar de Strava ābike commutesā bevat alle soorten utilitaire fietsritten, ook bijvoorbeeld naar een winkelcentrum, vriend of sportclub.
3. (Hard)lopen: Binnen Strava zijn hardloopactiviteiten en recreatieve wandelactiviteiten samengevoegd onder ƩƩn noemer; āfootā. Het zijn echter vooral hardloopactiviteiten, het aandeel recreatieve wandelactiviteiten is relatief klein.
Data structuren Strava Metro
Alvorens we de verschillende typen gebruikersgroepen apart bezien, tonen we eerst welke gegevens, in welke structuren te verkrijgen zijn. Deze datastructuren zijn namelijk voor de verschillende groepen gelijk.
Uiteraard kan en wil Strava geen persoonsgebonden gegevens delen, daarom zijn gegevens geaggregeerd tot straatniveau. In de tabellen die via Strava Metro te downloaden zijn, is van elke straat, weg of pad in de OpenStreetMap, inzichtelijk hoe vaak deze gepasseerd is door iemand die zijn rit/loopje opnam met Strava.
Strava maakt daarbij eerst een opdeling in āfootā en ābikeā. Binnen deze twee activiteiten kan vervolgens gekozen worden of je een data-tabel van alleen ācommuteā, āleisureā, of beide (bij elkaar opgeteld) wilt downloaden. Bij ābikeā is dit een zeer zinvolle opdeling, bij āfootā is het aandeel commute zo laag dat de analytische mogelijkheden te klein zijn (in Amsersfoort 2% van alle āfootā activiteiten).
De tabel die gedownload kan worden, bestaat uit duizenden rijen en ruim 30 kolommen. De rijen bestaan uit de OSM-straatsegmenten, de zogenaamd āEgde _UIDā. Voor elk straatsegment zijn nog diverse āsubsetsā (kolommen) gemaakt. Alle hieronder benoemde kolommen bestaan in tweevoud, beide rijrichtingen hebben ƩƩn kolom. In sommige kolommen is daarbij het aantal gepasseerde trips geteld:
- Total trips count
- Morning / Evening trip count.
- Leisure / commute trip count.
Bij andere kolommen is niet het aantal gepasseerde trips, maar het aantal gepasseerde people (unieke personen) geteld:
- Male / Female
- Age 13-19 / age 20-34 / age 35-54 / age 55-64 / age 65+
Behalve deze onderverdelingen is er nog een andere subsets/kolommen:
- Avg Speed; gemiddelde snelheid op het straatsegment
Vervolgens kunnen nog keuzes gemaakt worden voor verschillende tijdsframes waarvan je de gegevens wilt downloaden. De bovengenoemde kolommen zijn voor de tabellen van deze tijdsframes gelijk, verschillen zitten in de rijen. Strava geeft vier keuzes:
- Yearly. De optelsom van passages over een volledig jaar. Je kunt kiezen voor alle afzonderlijke jaren van ā2016ā t/m ā2020ā. 2021 is, als onvolledig jaar, nog niet beschikbaar.
- Monthly. De optelsom van passages over een maand. Er zijn maximaal twaalf maanden te selecteren, elke van deze maanden krijgt per straatsegment ƩƩn rij.
- Daily.Hierin heeft binnen het tijdsframe van maximaal drie maanden, elke dag ƩƩn aparte rij voor elk straatsegment.
- Hourly. Hierin is binnen het tijdsframe van maximaal ƩƩn maand, voor elke dag van deze maand, voor elk uur ƩƩn rij voor elk straatsegment. In theorie levert dit dus een enorme aantal rijen op.

Bij de tellingen in de gedownloade tabel, wordt altijd afgerond naar ā5ā. Hiermee wordt nog een soort extra privacylaag toegevoegd, als maar ƩƩn persoon op een weg is geweest is dit onzichtbaar. Het moeten er minimaal drie zijn (dat wordt afgerond naar 5). Dit resulteert echter wel in een probleem binnen de dataframes ādailyā en āhourlyā. Binnen ƩƩn dag, passeert op het grootste deel van de straten, geen drie Strava gebruikers. Bijvoorbeeld; in IJsselstein en Amersfoort (waar we de Strava data al toepaste) haalt ~80% van de straten nooit 3 ābike_leisureā trips per dag, en haalt ~95% van straten nooit 3 ābike_leisure tripsā per dag. In het dataframe āhourlyā is dit aantal straten dat wegvalt, nog groter.
De dataframes āhourlyā en ādailyā zeggen daarom alleen iets over wegen die zeer veel gepasseerd worden. Van die wegen kunnen wel tijdspatronen geanalyseerd worden. Maar voor analyses van routegebruik bieden deze datasets beperkte mogelijkheden.
Om deze reden zijn de dataframes āmonthlyā en āyearlyā toegevoegd, waarin een optelsom van langere periodes wordt gemaakt. Daarbinnen is deze afronding naar 5 geen probleem meer.
Analysemogelijkheden Strava Metro
Echter bieden de kolommen van deze dataframes weer weinig mogelijkheden om ruimtelijke analyses, tijd-specifiek te maken. Er bestaan in deze dataframes bijvoorbeeld geen kolommen van āuren van de dagā, waardoor verschil in routegebruik tijdens daglicht vs. in het donker, niet gemaakt kunnen worden. Ook is er bijvoorbeeld geen verschil tussen āweekā en āweekendā, wat bij vrijwel elk type activiteit een interessant onderscheid zou zijn.
Maar, er zijn nog steeds diverse interessante analyses te maken met de Strava Metro data, voor zowel sportief-recreatieve fietsers,
- Kaarten van routegebruik (zogenaamde heatmaps).
- Kaarten van routegebruik; veranderingen door de maanden en jaren heen (vanaf 2016)
- Kaarten van routegebruik; vergelijkingen tussen verschillende leeftijdsgroepen en sexen.
- Kaarten van snelheden op routes.
- Tijdspatronen van gebruik, van zeer populaire routes.

Benieuwd naar hoe we dit soort analyses doorvertalen naar visies, strategieƫn en ontwerpvoorstellen? In Amersfoort brachten met data van Strava Metro het gebruik van fietsers, lopers en mountainbikers in kaart, voor een visie op routegebonden recreatie in de regio. In Utrecht brachten we met gegevens van Endomondo de gedeelde belangen van recreatief en utilitair fietsverkeer in kaart, zie bijvoorbeeld de blog mooi-snelfietsroutes. Ook in Brussel, Rotterdam en Amstelveen werd deze dataset, tezamen met gegevens van Runkeeper, ingezet om sportief gebruik van de openbare ruimte te bevorderen.
Opmerkingen