Strava Metro utilitaire fietsdata (blogdeel 3)

Nederland heeft inmiddels (naar onze schatting) een miljoen Strava-gebruikers. Voor de meeste gebruikers geldt dat wielrennen, mountainbiken of hardlopen hun belangrijkste activiteit is. Maar; eenmaal de app geïnstalleerd worden met Strava ook vele ‘commuting’ ofwel utilitaire fietsritten opgenomen.


Ondanks dat utilitair fietsen binnen Strava niet de vaakst opgenomen activiteit is, is het misschien wel de Strava Metro dataset met de grootste potentie. Want, 96% van Nederlandse fietsritten heeft een (hoofdzakelijk) utilitaire aard (CBS). Als Strava-utilitaire fietsritten representatief zijn voor een kenmerkend deel daarvan, geeft het waardevol inzicht in een belangrijk gebruik van stad en landschap.


Binnen Strava worden activiteiten als utilitair gekenmerkt indien óf de fietser dit zelf aanmerkt (knop ‘commute’ aanvinken), of als een activiteit dezelfde eigenschappen heeft als die groep ‘commuters’. Bijvoorbeeld op basis van begin- en eindpunt van een route kan duidelijk herkend worden of dit een ‘van A naar B’ fietsactiviteit is. Dit wordt gedaan door een algoritme van Strava Metro zelf. Bij Endomondo-data hebben we dergelijk onderscheid zelf ook onderzocht in verschillende steden. Voor meer informatie; zie bijvoorbeeld dit document (p15-20) van Utrecht, maar zo’n onderscheid kan wel degelijk goed gemaakt worden op basis van dergelijke kenmerken van fietsactiviteiten (waaronder ook het tijdstip, de afstand, omrijfactor en snelheid).


Strava gebruik van utilitaire fietsers

In Strava waren in 2018 wereldwijd van de 287 miljoen ‘bike rides’ zo’n 84 miljoen ‘commutes’ (29%). De rest zijn dus ‘leisure rides’. In 2021 Nederland lijkt dit commute-aandeel wat lager te liggen. O.b.v. Amersfoort (waar we toegang hebben tot Strava Metro) kunnen we een indicatie geven. In juni 2021 was in Amersfoort was circa 15% van de Strava fietsactiviteiten utilitair.

Welk aandeel van het totaal aantal Nederlandse fietsritten betreft dit? Bij de app Endomondo, ging 2% van Nederlandse fiets-commutes door Amersfoort. In Nederland zouden (doorgerekend) circa 1,5-2 miljoen commutes per jaar worden opgenomen met Strava. Op 4.4 miljard Nederlandse fietsritten per jaar; zou het erop neerkomen 1 op de ~2000a3000 utilitaire fietsritten met Strava wordt opgenomen. Dat klinkt enerzijds als weinig; maar het zijn per jaar bijvoorbeeld al 4 keer zo veel fietsritten als er in de fietstelweek gemaakt zijn (416.000 in 2016).



Kenmerken van gebruikers

Wederom kunnen we op basis van Strava Metro gegevens in Amersfoort een indicatie geven van hoe utilitaire Strava-fietsritten zich verdelen over verschillende leeftijdscategoriën en mannen/vrouwen. Het is vooral opvallend dat het aandeel vrouwen, in vergelijking met ‘vrijtijdsfietsen’, groter is (20% vs. 29%). Mannen zijn nogsteeds verantwoordelijk voor het grootste aantal ‘commute-tellingen’ (67%).

De leeftijdsverdeling is vrijwel gelijk aan de verdeling binnen Strava ‘vrijetijdsfietsen’. Commuters zijn vooral van middelbare leeftijd.



Representativiteit Strava Metro utilitaire fietsdata


Juist in het activiteitstype ‘bike_commute’ is representativiteit het meest relevant en complex. Om twee reden; (1) omdat Strava bike-commutes slechts een minimaal deel van totale bike commutes vormt (~1 op 3000), en (2) omdat Strava-bike-commutes kenmerkende eigenschappen hebben die afwijken van ‘de gemiddelde’ utilitaire fietsrit’.


De veelgesteld vraag rondom ‘representativiteit’ is in hoeverre de intensiteiten van gebruik, resulterend uit Strava-data, overeenkomen met de ‘werkelijke’ gebruiksintensiteit? Ofwel, fietsen Strava-utilitaire fietsers naar verhouding dezelfde routes als ‘de gemiddelde’ utilitaire fietsers?


Het simpele antwoord op die vraag is: nee. Strava fietsers/fietsritten vormen zeker geen perfecte doorsnede van alle Nederlandse fietsers/fietsritten. Dat doet overigens geen enkele vorm van ‘crowd-sourced’ fietsdata.


Maar in onze optiek is dat niet de meest relevante vraag. Relevanter is voor welke specifiekere typen utilitaire fietsers de data in hogere mate representatief is, en voor welke utilitaire fietsers in mindere mate? Want dat is het mooie van data die gegenereerd is door echte mensen, en niet door verkeersmodellen. Het ís altijd representatief: op z’n minst voor de groep mensen die Strava gebruikt, en het soort activiteiten die ze daarmee opnemen.


En de vervolgvraag is dan: zijn de route-gebruiken van de groep(en) die het ‘goed’ representeert, interessant en relevant?


Afstand

In de afgelopen vijf jaar analyseerden we bij TRACK-landscapes vooral data van de activity tracking app ‘Endomondo’, die net als met Strava ook gebruikt werd voor utilitaire fietsritten.

De belangrijkste factor die zowel de utilitaire fietsactiviteiten van Strava als Endomondo kenmerkt bleek ‘afstand’ te zijn.

Het is een logisch kenmerk, met grote gevolgen voor routegebruik. Wie enkele kilometers gaat fietsen, zal dit zelden met een activity tracker opnemen; het is voor de meesten niet substantieel genoeg als prestatie of beweging. Maar indien de fietsafstand groter is, wordt dit als substantiëlere prestatie/beweging gezien. Utilitaire fietsers zullen zo’n langere fietsrit relatief vaker opnemen met een activity tracking app.


De gemiddelde utilitaire fietsrit in Nederland is 4,1 kilometer (CBS). Bijna 70% van fietsritten, is korter dan 3,7 kilometer (lange fietsritten beinvloeden het gemiddelde relatief sterk). De meeste fietsritten worden dan ook gedaan om boodschappen te doen, te winkelen of uit te gaan.


En dit ligt bij Strava utilitaire fietsritten heel anders: Wereldwijd was de gemiddelde utilitaire Strava fietsrit 15,4 kilometer. In diverse Europese landen (Nederland helaas niet bekend) lag de mediaan-fietsafstand op circa 8 kilometer. Bij de utilitaire fietsdata (2012-2017) van de app Endomondo was die afstand (in de provincie Utrecht) redelijk vergelijkbaar; de mediaan was 10,4 kilometer en de gemiddelde fietsafstand 15,5 kilometer.


En of het nu gaat over wandelen, hardlopen, recreatief fietsen of utilitair fietsen: we hebben in veel verschillende steden gezien dat de af te leggen afstand zeer bepalend is voor welke wegen veel of weinig gebruikt worden. Dat heeft bij die verschillende typen activiteiten wel verschillende redenen.


Lange utilitaire fietsritten (5-30km) zijn in Nederland al gauw inter-stedelijk (ookwel boven-lokaal, regionaal): van de ene werk/woonkern naar de andere werk/woonkern. Het type bestemming zal bijvoorbeeld eerder een werklocatie zijn, of een regionale faciliteit/winkel. Daarbij worden binnenstedelijk vooral de fietsroutes gebruikt die logisch aansluiten op de doorgaande routes tussen verschillende kernen.

Korte utilitaire fietsritten (<5km) zullen worden meestal gedaan om boodschappen te doen, of naar de binnenstad, of naar de sportvereniging te gaan. Die bestemmingen liggen veelal op andere plekken dan de grote werklocaties en regionale faciliteiten; waarmee ook het gebruik van fietsroutes wezenlijk anders wordt.

De Endomondo gegevens lieten dit ook heel sterk zien in de Provincie Utrecht. Het beeld van fietsgebruik van de stad bij fietsritten van 0-5, 5-10 en 10+ kilometer, is zeer verschillend. Lange fietsritten hebben een veel wijds-verspreider beeld van routegebruik.



Vergelijkingen met telpunten (Endomondo)

Je kunt natuurlijk utilitaire fietsdata van activity trackers zoals Strava of Endomondo, vergelijken met lokale fietstellingen. In Utrecht vergeleken we bijvoorbeeld lokale fietstellingen en utilitaire fietsdata uit de app Endomondo.

Als je daarin de totale aantallen passages vergelijkt, is er absoluut geen gelijkenis/verband zichtbaar op de telpunten (R^2=0.385). De meest gepasseerde fietsroutes, zijn vaak niet de meest gepasseerde fietsroutes binnen Endomondo :




Strava Metro vergelijking fietstelling Utrecht
Strava Metro vergelijking fietstelling Utrecht


Maar wat als we binnen de Endomondo dataset, alle utilitaire fietsactiviteiten nemen van minder dan 4 kilometer lang? Die afstand heeft immers het overgrote deel van binnenstedelijke fietsactiviteiten, daar waar deze meetpunten liggen. Dan ineens is de vergelijking ineens aanzienlijk beter (R^2=0.588):






En dit is ook waarom in Vlaams-Brabant (zie blog ‘Strava sportief-recreatief fietsen’) de vergelijking tussen de telpunten en de Endomondo fietsdata een sterk verband liet zien: deze telpunten lagen allemaal buiten stedelijk gebied, inter-stedelijk. Daar kun je niet komen als je slechts enkele kilometers fietst, alleen ‘langere’ fietsactiviteiten passeren er. En dus laat het zich goed vergelijken met utilitaire fietsritten uit activity trackers: ook die bevatten vooral langere fietsritten.


Vergelijkingen met telpunten (Strava)

Zijn die Endomondo-inzichten dan ook op Strava van toepassing? Die conclusie is uiteraard niet zomaar één op één door te trekken, het is denkbaar dat Strava-utilitaire fietsers andere eigenschappen hebben dan Endomondo-utilitaire fietsers. Maar een hele belangrijke eigenschap, het ondernemen van ‘lange’ fietsritten, komt overeen. Ook de leeftijdsverdeling en gender-verdeling van Endomondo en Strava zijn van grote gelijkenis.


Op dit moment kunnen wij wel in IJsselstein (waar we ook toegang hebben tot Strava Metro) een vergelijking maken met lokale fietstellingen. Het interessante van IJsselstein is dat hier fietstellingen rondom de woonkern gedaan zijn, om regionale fietsbewegingen te meten. De lokale-tellingen zijn in mei 2019 gedaan, de grafiek toont de vergelijking met de Strava commute-passages in heel 2019. Het verband komt uit op R^2 van 0,55; er is een verband maar heel sterk is het niet.


Strava Metro vergelijking fietstelling IJsselstein
Strava Metro vergelijking fietstelling IJsselstein

Het lastige van deze vergelijking is echter dat de meeste punten echt buiten stedelijk gebied liggen, maar niet allemaal. Het telpunt ‘Randdijk’ betreft de belangrijkste fietsverbinding naar Nieuwegein Centrum, dat vanuit IJsselstein slechts 3-5 kilometer fietsen is. Op dit fietspad scoort Strava het meest ‘ondermaats’. Maar dat is volkomen logisch als Strava juist lagere fietsritten representeert. Zonder deze Randdijk zou de R^2 op 0,72 uitkomen.


Dit blijft het lastige van dit soort vergelijkingen; om nog beter te weten of Strava_commutes de langere fietsbeweging goed representeert, moet je dat idealiter vergelijken met andere bronnen/onderzoeken/telpunten die ook echt de lange fietsritten laten zien. Maar: die zijn er niet. Althans; voor zover wij kennen; mocht u wél onderzoeken kennen met deze focus, dan horen we dat graag!


Maar, die afwezigheid van specifieke kennis over lange fietsbewegingen is precies wat de Strava Metro data in potentie zo waardevol maakt.


Wetenschappelijke onderzoeken/vergelijkingen (Strava)

Diverse wetenschappelijke instellingen hebben de Strava fietsdata ook onderzocht op representativiteit en bruikbaarheid. Het artikel “Strava Metro data for bicycle monitoring: a literature review” vat wetenschappelijk onderzoek hiernaar samen.


In verschillende (vooral Amerikaanse) studies werd geconcludeerd dat Strava gegevens van toegevoegde waarde kunnen zijn op andere methodes die fiets-intensiteiten inschatten. In sommige studies worden -zoals wij ook al deden- lokale fietstellingen vergeleken met Strava-tellingen. De studies werden ondernomen in Amerika, Canada Australië, Verenigd Koninkrijk, en Duitsland. De R-waardes (drukte sterkte van samenhang uit) waren in 5 van de 9 studies >0.75. Dat is een degelijke correlatie. Maar die R-waardes varieerden ook sterk, tussen 0.3 en 0.5 kwam ook voor.

Dit toont ook de moeilijkheid aan van mondiaal-generaliseren over Strava-data-representativiteit. Fiets-gebruik en ook Strava-gebruik is wereldwijd zó verschillend, dat je conclusies voor het ene land, zeer moeilijk kunt aannemen voor een ander land. En dat geldt zeker voor Nederland; Nederland is zowel in het opzicht van verstedelijking (kleine, uiteengelegde steden), fiets-infrastructuur, als fietsgebruik (vergaand ontwikkeld, maar ook specifieke demografische verschillen) onvergelijkbaar met andere landen. Conclusies over Strava-representativiteit in Nederland, moet je echt baseren op vergelijkingen/onderzoeken in Nederland.

Wel concluderen studies dat de Strava-data technisch gezien op bruikbare manier aangeboden wordt, de nauwkeurigheid van gps-devices en de doorvertaling naar passages van straten/paden/wegen is biedt goede mogelijkheden. Wat daarmee in de review ook aangegeven wordt, is dat Strava Metro bruikbaar is gebleken voor het doen van ingreep-evaluaties. Het bleek bij verschillende studies goed mogelijk om veranderingen in gebruik te zien na het toevoegen of verbeteren van een fietsroute. De algemene vraag m.b.t. representativiteit van Strava-data/ Strava-gebruiker blijft daarbinnen uiteraard van kracht; wie representeert die zichtbare verandering? Geldt deze Strava-verandering in gelijke mate als de lokale fietstellingen? Dit wordt nog beperkt onderzocht.

In algemene zin stipt de review aan dat er een gebrek aan demografische gegevens en fietstrip(aard)-gegevens zoals oorsprong-bestemming relaties, het zicht op representativiteit beperkt. Die beperking herkennen we, tegelijkertijd denken we dat onze inzichten en vergelijkingen hierin van waardevolle toevoeging zijn.


Want opvallend is dat het -wat onze meetervaring betreft- meest bepalende kenmerk van activity tracking data, namelijk de te fietsen afstand, onbenoemd is in al deze onderzoeken. De verschillen in oorsprong-bestemming worden wel genoemd, maar dat dit veroorzaakt wordt door het feit dat activity trackers meestal pas gebruikt worden als fietsenafstanden langer zijn dan enkele kilometers, krijgt geen nadruk. De vraag of Strava-achtige data wél een goede representatie kan vormen voor ‘regionaal’ of ‘lange afstand-fietsgebruik’, wordt daarom ook niet gesteld. En dat is, ons inziens, juist de belangrijkste vraag die bij deze datasets in de gesteld moet worden. In Nederland, maar niet onwaarschijnlijk ook in andere landen.


Conclusies Strava utilitaire fietsdata


Het is wenselijk om op meer plekken (in Nederland) vergelijkingen te maken tussen Strava Metro data en lokale telpunten. Dan kan een nog beter beeld ontstaan van wie en wat de Strava Metro wel en niet laat zien. Je kunt wel al concluderen dat de totale/gemiddelde Strava-utilitaire-fiets-dataset geen goede representatie geeft van het totale/gemiddelde Nederlandse fietsgebruik. Je moet specifieke onderverdelingen in de datasets maken, om het routegebruik van specifieke groepen in redelijke mate te kunnen vertegenwoordigen.


Maar, wie fietsdata wil gebruiken om behoeftes, beweegredenen en routegebruiken van fietsers beter te doorgronden, is het ‘totale fietsgebruik’ of het ‘gemiddelde fietsgebruik’ helemaal niet zo interessant. Juist omdat bijvoorbeeld korte fietsritten een totaal ander beeld van routegebruik geeft dan lange fietsritten (vooral als gevolg van andere bestemming), en die fietsers ook andere voorkeuren en beweegredenen hebben.

‘Totalen fietspassages’ kunnen bijvoorbeeld wel relevant zijn voor pure capaciteits-vraagstukken van fietspaden/wegen, waar fietsdata momenteel ook veel voor ingezet lijkt te worden. Maar wat ons betreft ligt daar niet de grootste potentie van fietsdata. Goed fietsbeleid hoort in essentie juist te draaien om inzicht en begrip in verschillende behoeftes van verschillende fietsers.


En op basis van de diverse vergelijkingen die we totnutoe maakten, ontstaat wel degelijk het beeld dat Strava Metro gegevens een goede representatie kunnen geven van een specifieke groep fietsers/fietsritten, namelijk fietsritten van ‘lange afstand’, regionaal fietsverkeer.


Is die groep fietsactiviteiten interessant en relavant? Wat ons betreft juist! Wat uit divers onderzoek in Nederland blijkt (KiM), is dat de fiets juist in die langere fiets-beweging de potentie heeft om autogebruik te reduceren. Met de opkomst van de elektrische fiets worden deze langere afstanden steeds vaker en makkelijker gemaakt. Om die reden leggen Nederlandse gemeentes en provincies een steeds sterkere nadruk op het verbeteren van regionale fietsroutes, tussen verschillende woonkernen. En voor dat doeleind is het juist heel waardevol om het fietsgebruik van fietsritten over langere afstanden, apart in kaart te brengen. Om beter (be)grip te krijgen op specifieke routevoorkeuren en gebruik(en) van die groep fietsers.


En dat kunnen lokale fietstellingen juist weer niet. Zo heeft elke manier van meten, elke dataset, bepaalde mogelijkheden en beperkingen. Het is vrijwel nooit een kwestie van ‘wel of niet representatief’.

Het is dan ook mooi zijn als in Strava Metro datasets, een onderverdeling gemaakt wordt in ‘afstandscategorieën’ (bijvoorbeeld 1-5km, 5-10km,10-20km, >20km). Het zou ons -op basis van de inzichten uit de Endomondo data- niet verbazen dat Strava-data dan zelfs een behoorlijke representatie kan geven van korteafstands-fietsgebruik.


En om dit alles eindig ik met een oproep: kent u gegevens van lokale fietstellingen, die zowel binnenstedelijk als buiten stedelijk gelegen zijn? Of: onderzoek naar verschillen in routegebruik tussen fietsritten van lange afstand en korte afstand? Dan doen we graag (nog) meer onderzoek om een (nog) beter beeld te kunnen schetsen van de kansen die deze dataset biedt!


Benieuwd naar de manieren waarop we Strava Metro data en andere activity tracking data, inzichten in sportief-recreatief fietsen doorvertalen naar ruimtelijke ontwikkelkansen?

In Utrecht brachten we met gegevens van Endomondo de gedeelde belangen van recreatief en utilitair fietsverkeer in kaart, zie bijvoorbeeld de blog mooi-snelfietsroutes. In de studie ‘Fiets+OV’ brachten we met data van de fietstelweek in kaart welke routes richting stations worden gefietst. Dit vertaalden we door naar ontwikkelkansen voor de stationsomgeving.