Toegankelijkheid, software, digitale infrastructuur en data: De roep om ethiek

De 10de aflevering in de reeks Bouwen aan duurzame steden – De bijdrage van digitale technologie gaat over de betekenis van ethische principes voor vier belangrijke pijlers van digitalisering: toegankelijkheid, programmatuur, infrastructuur en data.

In de vorige aflevering kwam een aantal uitgangspunten (richtlijnen en ethische principes) voor digitale technologie aan de orde. Uit het rapport van het Rathenau Instituut[1] Opwaarderen – Borgen van publieke waarden in de digitale samenleving blijkt dat overheid, bedrijfsleven en samenleving deze nog onvoldoende hanteren. Hieronder sta ik stil wat deze principes en waarden betekenen voor vier fundamentele aspecten van digitalisering: toegankelijkheid, programmatuur, infrastructuur en data.  In de volgende twee afleveringen komen hun implicaties voor een zestal technologieën aan de orde. 

Toegankelijkheid

Toegankelijkheid verwijst naar de beschikbaarheid van snel Internet voor iedereen. Dit gaat verder dan alleen technische toegang.  Het houdt ook in dat een gemeente toeziet op de begrijpelijkheid van de eigen berichtgeving en dat gebruikers de aangeboden opties ook kunnen hanteren. Niet in de laatste plaats zou iedereen moeten beschikken over een werkende computer.

Gratis Internet voor alle inwoners is een waardevolle basisvoorziening, inclusief Wi-Fi in de publieke ruimte, mits goed beveiligd tegen indringers. Overlaten van een Wi-Fi voorziening aan private aanbieders, zoals de LinkNYC reclamezuilen in New York, die ook in andere steden opduiken, is een slechte zaak. Bedrijven als Sidewalk Labs verleiden gemeenten door deze zuilen gratis te plaatsen. Ze zijn uitgerust met sensoren die een enorme hoeveelheid gegevens verzamelen via elk apparaat dat verbinding maakt met hun Wi-Fi-netwerk: Niet alleen de locatie en het besturingssysteem, maar ook het MAC-adres. Met behulp van analysetechnieken kan daarmee het loop-, kijk- en koopgedrag van burgers worden gereconstrueerd. Gecombineerd met andere openbare gegevens van Facebook of Google leveren ze inzicht in persoonlijke interesse, seksuele geaardheid, ras en politieke overtuiging van de betrokkenen.

Het enorme internet dat alles en iedereen verbindt, roept ook schrikbeelden op, die te maken hebben met waarborgen van privacy en in relatie daarmee uiteenlopende vormen van misbruik, tot het hacken van apparatuur die je hartslag regelt toe. Daarom wordt er breed gezocht naar alternatieven.

Wereldwijd komen P2P buurtinitiatieven voor om een besloten eigen netwerk aan te leggen. Veel daarvan maken deel uit van The Things Network[2]. In plaats van Wi-Fi, gebruikt dit netwerk een protocol genaamd LoRaWAN. Door robuuste end-to-end-codering hoeven gebruikers zich geen zorgen te maken over beveiligde draadloze hotspots, mobiele data-abonnementen of haperende Wi-Fi-connectiviteit. Het Things-netwerk beheert duizenden gateways en biedt dekking aan miljoenen mensen en biedt een reeks open tools waarmee burgers en ondernemers IoT-applicaties kunnen bouwen tegen lage kosten, met maximale beveiliging en die makkelijk op te schalen zijn.

Programmatuur

Computerprogramma’s zorgen voor uiteenlopende toepassingen, variërend van tekstverwerking tot managementsystemen. Op zoek naar oplossingen die het best passen bij de richtlijnen en ethische principes uit de vorige aflevering, komen we al snel uit bij open-source software, in tegenstelling tot propriëtaire producten van commerciële aanbieders. Niet dat deze laatste bij voorbaat verwerpelijk zijn of dat ze altijd goedkoper zijn. Het belangrijkste waar je op moet letten is uitwisselbaarheid (interoperabiliteit) met producten van andere aanbieders om te voorkomen dat je er lastig vanaf komt (lock in). 

Open source software kan veel voordelen bieden ten opzichte van prioriëtaire oplossingen, zeker als gemeenten dit stimuleren. Barcelona loopt hierbij voorop[3]. De stad beoogt volledig zelfbeheer van haar ICT-diensten en radicale verbetering van digitale openbare dienstverlening voor de burgers, inclusief ‘privacy by design’ en databescherming dankzij het gebruik van blockchain. Dit resulteert in gegevenssoevereiniteit en in het gebruik van vrije software, open dataformats, open standaarden, interoperabiliteit en herbruikbare applicaties en diensten. 

Wie zich oriënteert op open source software kan niet om de Fiware-gemeenschap[4] heen, qua organisatie vergelijkbaar met Linux en bestaande uit bedrijven, startups en freelance ontwikkelaars en voortgekomen uit een initiatief van de EU. Fiware is een organisatie met als missie bouwen van open, en duurzame software rond publieke, royaltyvrije en implementatie gedreven standaarden

Infrastructuur

Computers zijn inmiddels niet meer de grootste groep onderdelen van de digitale infrastructuur. Hun aantal is overtroffen door zogenaamde ubiquitous sensor networks (USN), zoals slimme meters, CCTV, microfoons en sensoren. Sensornetwerken hebben de meest uiteenlopende taken, ze bewaken de omgeving (luchtkwaliteit, verkeersdichtheid, ongewenste bezoekers) en ze zitten in machines, treinen en auto’s en zelfs mensen en geven informatie over het functioneren van vitale onderdelen door. Mike Matson[5] berekende verder dat er in 2050 een stad van 2 miljoen inwoners wel een miljard sensoren zal zijn. Deze zijn verbonden door miljoenen kilometers glasvezelkabel of via Wi-Fi met elkaar, met datacenters, carrier hotels (dat zijn knooppunten waar particuliere netwerken samenkomen) om uiteindelijk het Internet te vormen.

Deze hiërarchisch georganiseerde verknoping staat op gespannen voet met de richtlijnen en ethische principes uit de vorige post. Internet criminelen krijgen vrij baan, bijvoorbeeld door het veroorzaken van denial of service (DoS) en dataleks kunnen grote gevolgen hebben. Bovendien loopt het energieverbruik gigantisch op, ook zonder blockchain. Het kan ook anders. Met edge computing[6] vindt de bewerking van de gegevens lokaal plaats en alleen resultaten worden op verzoek geüpload. Dit geldt voor sensoren, mobiele telefoons en mogelijk ook voor geautomatiseerde auto’s. Een mooi voorbeeld is het Array of things Initiative[7]. Uiteindelijk gaat dit 500 sensoren omvatten, die in overleg met de bevolking in Chicago worden opgehangen en data gaan verzamelen.  Deze data worden in elke sensor opgeslagen en kunnen indien nodig online worden geraadpleegd, waarbij steeds een aantal sensoren en een deel van de data betrokken is. 

Vergelijkbaar zijn federatieve datasystemen[8]. Hierbij worden data decentraal bewaard, maar geautoriseerde gebruikers kunnen dankzij gebruiksinterfaces wel van alle gegevens gebruik maken.

Data

Het besef dringt door dat het bij data niet alleen om de hoeveel gaat, maar ook om de kwaliteit van zowel de data zelf en de bewerking ervan. Ik stip een aantal aspecten aan

Toegang tot data

Als het om gegevens van personen gaat, dan zou de regel moeten zijn dat privégegevens alleen doorzoekbaar zijn na toestemming van de eigenaar. Om deze data te beschermen stelt het EU-project Decode voor eigenaars hun gegevens via blockchaintechnologie te laten beheren[9]. Veel steden hebben inmiddels privacyrichtlijnen, maar slechts een aantal voert privacy impact assessment uit als onderdeel van het beleid (p.18)[10]

Kwaliteit

Er komen steeds meer aanwijzingen dat veel data die voor kunstmatige intelligentie worden gebruikt als ‘leersets’ ondeugdelijk zijn.  Dat was al pijnlijk duidelijk geworden uit data voor gezichtsherkenning waarin minderheidsgroepen disproportioneel zijn vertegenwoordigd[11]. Nieuw onderzoek laat zien dat dit ook geldt op het gebied van de gezondheidszorg. Er is hier sprake van data cascades, een optelsom van achtereenvolgende fouten, waarvan de gevolgen pas na enige tijd duidelijk worden[12]. Data bleken niet relevant, onvolledig, onvergelijkbaar en zelfs gemanipuleerd[13]

Data commons

Voor wie specifieke data van groot belang zijn, en daarmee ook hun kwaliteit, zal zich extra daarvoor inzetten. Samen kunnen de betrokkenen dan een datacommon vormen. Commons are shared resources managed by empowered communities on the basis of mutually agreed and enforced rules[14]

Een mooi voorbeeld is de Data- en Kennishub Gezond Stedelijk Leven (p.152)[15], waarin overheden, bedrijven, milieugroepen en bewoners kennis verzamelen voor de ontwikkeling van een gezonde leefomgeving, met gebruikmaking van een federatief datasysteem. Het gaat hierbij niet alleen om data, maar ook om de terugkoppeling van het effect van maatregelen. 

Open data

Veel steden hanteren het ‘open by default’ principe en maken de meeste gegevens openbaar, al laat de gebruikersvriendelijkheid en doelmatigheid soms nog te wensen over. Er zijn verschillende datamanagementsystemen als open-source portal beschikbaar. Een van de meest vooraanstaande is CKAN, beheert door de Open Knowledge Foundation[16]. Het bevat middelen voor het beheren, publiceren, vinden, gebruiken en delen van gegevensverzamelingen. Het biedt een uitgebreide zoekfunctie en maakt het mogelijk om gegevens te bekijken in de vorm van kaarten, grafieken en tabellen. Er is een actieve gemeenschap van gebruikers, die het systeem verder ontwikkelt en lokaal aanpast. 

Om de gegevens daadwerkelijk toegankelijk te maken bieden sommige steden ook trainingen en workshops aan. Barcelona’s Open Data Challenge is een initiatief voor leerlingen uit het secundair onderwijs, dat hen wegwijs maakt in de enorme gegevensverzameling van de stad[17].

Veiligheid

Naarmate de omvang van de verzamelde data, de hoeveelheid ‘entry points’ en de verbondenheid op het Internet toeneemt, worden de veiligheidsrisico’s ook groter. Decentralisering, onder andere door middel van edgecomputingen federatieve opslag met blockchaintechnologie dragen zeker bij aan de veiligheid. Er is verder nog een lange weg te gaan. Slechts de helft van de steden heeft een seniorbeleidsmedewerker op dit gebied en technieken voor authenticatie, versleuteling en ondertekening die samen de basis vormen voor attribute-based identity worden lang niet altijd toegepast. Het gaat hierbij om identiteitsbepaling op basis van een aantal kenmerken van een gebruiker, zoals functie, locatie en afdeling[18]

Iets heel anders is Me and my shadow, een project dat gebruikers van het Internet leert hun eigen spoor te minimaliseren en daarmee hun vindbaarheid voor Internetcriminelen[19].

Er is nog een wereld te winnen voordat voldoende is voldaan aan de richtlijnen en ethische principes die in de vorige aflevering werden genoemd.

Het belangrijkste is wellicht een zekere relativering van begrippen als ‘big data’, ‘datagericht beleid’ en de omvang van datasets.

Het is raadzaam zich opnieuw te verdiepen in de grondslagen van wetenschappelijk onderzoek. Hierin staat voorop een goed geformuleerde vraagstelling, vervolgens de keuze van een hierbij passende onderzoeksmethode, bijvoorbeeld de formulering van hypothetische verbanden op basis van materiekennis, de beantwoording van de vraag welke gegevens hiervoor nodig zijn, de verzameling van deze gegevens en hun statistische bewerking om te zien in hoeverre de onderbouwde hypothetische verbanden aangetroffen worden. In de volgende aflevering komt onder andere machine leren aan de orde en dan zal blijken dat het bij de automatische verwerking van grote datasets vooral gaat om de ontdekking van statistische verbanden en dat kan nare consequenties hebben. 

Volg deze link als je snel een van de vorige afleveringen uit deze reeks wil vinden of wilt zien welke de volgende afleveringen zijn. Vol deze link voor de Engelstalige versie


[1] https://www.dropbox.com/s/qom95p4hwph1cie/Rathenau-Opwaarderen.pdf?dl=0

[2] https://www.thethingsnetwork.org/

[3] https://www.barcelona.cat/digitalstandards/

[4] https://www.fiware.org

[5] http://smallwarsjournal.com/jrnl/art/complex-cyber-terrain-in-hyper-connected-urban-areas

[6] https://searchdatacenter.techtarget.com/definition/edge-computing

[7] https://datasmart.ash.harvard.edu/news/article/a-guide-to-chicagos-array-of-things-initiative-1190

[8] https://statetechmagazine.com/article/2021/04/researchers-eye-machine-learning-secure-iot-data

[9] https://www.youtube.com/watch?time_continue=2&v=_-ooCbgIiyo&feature=emb_logo

[10] https://www.weforum.org/whitepapers/governing-smart-cities-policy-benchmarks-for-ethical-and-responsible-smart-city-development

[11] https://www.verdict.co.uk/ethnic-data-bias/

[12] https://storage.googleapis.com/pub-tools-public-publication-data/pdf/0d556e45afc54afeb2eb6b51a9bc1827b9961ff4.pdf

[13] https://www.theverge.com/2021/4/27/22403741/deepfake-geography-satellite-imagery-ai-generated-fakes-threat

[14] https://www.dropbox.com/s/wxf4c6x16hb2xdy/Waag-AMS-Strategy-for-urban-data.pdf?dl=0

[15] https://www.dropbox.com/s/qoqp17grtsfoh9u/future-city-magazine-2020-mr.pdf?dl=0

[16] https://ckan.org

[17] https://opendata-ajuntament.barcelona.cat/en/repte-barcelona-dades-obertes

[18] https://media.erepublic.com/document/CDG21_BRIEF_SailPoint_AWS_V.pdf

[19] https://tacticaltech.org/#/projects/me-and-my-shadow