Qui recull big data i per què?

A la tardor del 2019 va esclatar un escàndol amb el servei Apple Card: en registrar-se, va emetre diferents límits de crèdit per a homes i dones. Fins i tot Steve Wozniak no va tenir sort:

Un any abans, es va revelar que la plataforma Netflix mostra als usuaris diferents pòsters i teasers, en funció del seu gènere, edat i nacionalitat. Per això, el servei va ser acusat de racisme.

Finalment, Mark Zuckerberg és recriminat periòdicament per presumptament recopilar, vendre i manipular les dades dels seus usuaris per part de Facebook. Al llarg dels anys, va ser acusat i fins i tot jutjat per manipulació durant les eleccions nord-americanes, ajudant els serveis especials russos, incitant a l'odi i opinions radicals, publicitat inadequada, filtració de dades dels usuaris, obstaculitzant les investigacions contra pedòfils.

Publicació de Facebook de zuck

Al mateix temps, el servei en línia Pornhub publica anualment informes sobre quin tipus de pornografia busquen persones de diferents nacionalitats, gènere i edat. I per alguna raó això no molesta a ningú. Tot i que totes aquestes històries són semblants: en cadascuna d'elles estem tractant de grans dades, que al segle XIX s'anomena "oli nou".

Què és el big data

El big data (també són big data (eng. Big Data) o metadades) és un conjunt de dades que arriba regularment i en grans volums. Es recullen, processen i analitzen, donant com a resultat models i patrons clars.

Un exemple sorprenent són les dades del Large Hadron Collider, que arriba de forma contínua i en grans quantitats. Amb la seva ajuda, els científics resolen molts problemes.

Però les grans dades a la xarxa no són només estadístiques per a la investigació científica. Es poden utilitzar per fer un seguiment de com es comporten els usuaris de diferents grups i nacionalitats, a què presten atenció i com interactuen amb el contingut. De vegades, per a això, les dades no es recullen d'una font, sinó de diverses, comparant i identificant certs patrons.

Sobre la importància que té el big data a la xarxa, van començar a parlar quan realment n'hi havia molt. A principis de 2020, hi havia 4,5 milions d'usuaris d'Internet al món, dels quals 3,8 milions estaven registrats a les xarxes socials.

Qui té accés a Big Data

Segons les enquestes, més de la meitat dels nostres països creu que les seves dades a la xarxa són utilitzades per tercers. Al mateix temps, molts publiquen informació personal, fotos i fins i tot un número de telèfon a les xarxes socials i aplicacions.

Qui recull big data i per què?
Qui recull big data i per què?
Qui recull big data i per què?
Qui recull big data i per què?

S'ha d'explicar aquí: la primera persona és el mateix usuari, que col·loca les seves dades en qualsevol recurs o aplicació. Al mateix temps, accepta (posa una marca a l'acord) el tractament d'aquestes dades segona part, és a dir, els propietaris del recurs. Un tercer és aquell a qui els propietaris del recurs poden transferir o vendre les dades dels usuaris. Sovint això està escrit a l'acord d'usuari, però no sempre.

El tercer són agències governamentals, pirates informàtics o empreses que compren dades amb finalitats comercials. Els primers poden obtenir dades per decisió d'un tribunal o d'una autoritat superior. Els pirates informàtics, per descomptat, no utilitzen cap permís: simplement pirategen les bases de dades emmagatzemades als servidors. Les empreses (per llei) només poden accedir a les dades si vostè mateix ho ha permès, marcant la casella de l'acord. En cas contrari, és il·legal.

Per què les empreses utilitzen Big Data?

El big data en l'àmbit comercial s'ha utilitzat durant dècades, simplement no era tan intens com ara. Aquests són, per exemple, registres de càmeres de vigilància, dades de navegadors GPS o pagaments en línia. Ara, amb el desenvolupament de les xarxes socials, els serveis en línia i les aplicacions, tot això es pot connectar i obtenir la imatge més completa: on viuen els clients potencials, què els agrada veure, on van de vacances i quina marca de cotxe tenen.

A partir dels exemples anteriors, és evident que amb l'ajuda del big data, les empreses, en primer lloc, volen orientar anuncis. És a dir, oferir productes, serveis o opcions individuals només al públic adequat i fins i tot personalitzar el producte per a un usuari concret. A més, la publicitat a Facebook i altres grans plataformes és cada cop més cara, i mostrar-la a tothom seguit no és gens rendible.

Les companyies d'assegurances, les clíniques privades i els empresaris utilitzen activament la informació sobre clients potencials de fonts obertes. Els primers, per exemple, poden canviar les condicions de l'assegurança si veuen que sovint busqueu informació sobre determinades malalties o medicaments, i els empresaris poden valorar si sou propensos a conflictes i comportaments antisocials.

Però hi ha una altra tasca important que ha estat lluitant els darrers anys: apropar-se al públic més solvent. Això no és tan fàcil de fer, tot i que la tasca es facilita notablement pels serveis de pagament i xecs electrònics a través d'un únic OFD (operador de dades fiscals). Per apropar-se el més possible, les empreses fins i tot intenten localitzar i “nodrir” clients potencials des de la infància.: a través de jocs en línia, joguines interactives i serveis educatius.

Com funciona?

Les oportunitats més grans per a la recollida de dades provenen de les corporacions globals que posseeixen diversos serveis alhora. Facebook té ara més de 2,5 milions d'usuaris actius. Paral·lelament, la companyia també té altres serveis: Instagram –més de 1 milions, WhatsApp– més de 2 milions i altres.

Però Google té encara més influència: Gmail és utilitzat per 1,5 milions de persones al món, 2,5 milions més pel sistema operatiu mòbil Android, més de 2 milions per YouTube. I això sense comptar la cerca de Google i les aplicacions de Google Maps, la botiga de Google Play i el navegador Chrome. Queda per fixar el vostre banc en línia, i Google podrà saber-ho literalment tot sobre vosaltres. Per cert, Yandex ja va un pas endavant en aquest sentit, però només cobreix el públic de parla russa.



👍 En primer lloc, a les empreses els interessa el que publiquem i els agrada a les xarxes socials. Per exemple, si el banc veu que estàs casat i t'agraden les noies de manera activa a Instagram o Tinder, és més probable que aprovis un préstec de consum. I la hipoteca de la família ha desaparegut.

També és important en quins anuncis feu clic, amb quina freqüència i amb quin resultat.

(És a dir El següent pas són els missatges privats: contenen molta més informació. Els missatges es van filtrar a VKontakte, Facebook, WhatsApp i altres missatgers instantanis. Segons ells, per cert, és fàcil fer un seguiment de la geolocalització en el moment d'enviar el missatge. Segur que us n'heu adonat: quan parleu de comprar alguna cosa o simplement demaneu pizza amb algú, de seguida apareix la publicitat rellevant al feed.

🚕 Els serveis de lliurament i taxi utilitzen i "filtran" activament les dades massives. Saben on vius i treballes, què estimes, quins són els teus ingressos aproximats. Uber, per exemple, mostra el preu més alt si aneu conduint a casa des del bar i, òbviament, s'exagera. I quan tinguis un munt d'altres agregadors al teu telèfon, al contrari, t'oferiran de més barats.

(És a dir Hi ha serveis que utilitzen fotos i vídeos per recollir la màxima informació possible. Per exemple, biblioteques de visió per ordinador: Google en té una. T'escanegen a tu i al teu entorn per veure quina mida o alçada tens, quines marques portes, quin cotxe condueixes, si tens nens o mascotes.

(És a dir Els que proporcionen passarel·les d'SMS als bancs per als seus correus poden fer un seguiment de les vostres compres a la targeta – conèixer els últims 4 dígits i un número de telèfon – i després vendre aquestes dades a una altra persona. D'aquí tot aquest spam amb descomptes i pizza de regal.

🤷️️ Finalment, nosaltres mateixos filtrem les nostres dades als serveis i aplicacions de l'esquerra. Recordeu aquell bombo al voltant de Getcontact, quan tothom estava encantat d'omplir el seu número de telèfon per esbrinar com l'havien escrit els altres. I ara trobeu el seu acord i llegiu el que diu sobre la transferència de les vostres dades (spoiler: els propietaris poden cedir-les a tercers segons el seu criteri):

Qui recull big data i per què?

Les corporacions poden recopilar i fins i tot vendre dades d'usuaris amb èxit durant anys, fins que es tracta d'una demanda, com va passar amb el mateix Facebook. I aleshores el paper decisiu el va jugar la violació del GDPR per part de l'empresa, una llei de la UE que restringeix l'ús de dades molt més estrictament que la nord-americana. Un altre exemple recent és l'escàndol d'antivirus Avast: un dels serveis subsidiaris de la companyia va recollir i vendre dades de 100 a 400 milions d'usuaris.

Però tot això té algun avantatge per a nosaltres?

Com ens ajuden a tots el big data?

Sí, també hi ha un costat brillant.

Les grans dades ajuden a atrapar delinqüents i prevenir atacs terroristes, trobar nens desapareguts i protegir-los del perill.

Amb la seva ajuda, nosaltres rebem ofertes interessants de bancs i descomptes personals. Gràcies a ells nosaltres no paguem per molts serveis i xarxes socials que guanyen només amb publicitat. En cas contrari, només Instagram ens costaria diversos milers de dòlars al mes.

Només Facebook té 2,4 milions d'usuaris actius. Al mateix temps, els seus beneficis per al 2019 van ascendir a 18,5 milions de dòlars. Resulta que l'empresa guanya fins a 7,7 dòlars anuals de cada usuari a través de la publicitat.

Finalment, de vegades és convenient: quan els serveis ja saben on ets i què vols, i no has de buscar tu mateix la informació que necessites.

Un altre àmbit prometedor per a l'aplicació del Big Data és l'educació.

En una de les universitats nord-americanes de Virgínia, es va realitzar un estudi per recollir dades sobre estudiants de l'anomenat grup de risc. Són els que estudien malament, perden les classes i estan a punt d'abandonar els estudis. El cas és que als estats cada any es descompten unes 400 persones. Això és dolent tant per a les universitats, que tenen les qualificacions rebaixades i els seus finançaments retallats, com per als mateixos estudiants: molts prenen préstecs per a l'educació que, després de deduir-los, encara s'hauran de retornar. Sense oblidar el temps perdut i les perspectives de carrera. Amb l'ajuda de big data, és possible identificar els endarrerits en el temps i oferir-los un tutor, classes addicionals i altres ajuts específics.

Això, per cert, també és adequat per a les escoles: llavors el sistema avisarà els professors i els pares; diuen, el nen té problemes, ajudem-lo junts. El Big Data també us ajudarà a entendre quins llibres de text funcionen millor i quins professors expliquen el material amb més facilitat.

Un altre exemple positiu és el perfil professional.: és quan s'ajuda als adolescents a decidir sobre la seva futura professió. Aquí, el big data permet recollir informació que no es pot obtenir mitjançant les proves tradicionals: com es comporta l'usuari, a què presta atenció, com interactua amb el contingut.

Als mateixos EUA, hi ha un programa d'orientació professional: SC ACCELERATE. Utilitza, entre altres coses, la tecnologia GPS CareerChoice: analitzen dades sobre la naturalesa dels estudiants, les seves inclinacions per les assignatures, els punts forts i els punts febles. Aleshores, les dades s'utilitzen per ajudar els adolescents a triar les universitats adequades per a ells.


Subscriu-te i segueix-nos a Yandex.Zen: tecnologia, innovació, economia, educació i compartir en un sol canal.

Deixa un comentari