Zakaj je 'Calling Bullshit' pomembno branje v času pranja informacij
Napačne informacije in dezinformacije so postale tako razširjene v svetu, ki temelji na podatkih, da je zdaj dolžnost vsakega državljana, da je skeptičen in to opozori

Ta zanimiva knjiga, ki razkrije novico, da številke ne govorijo same zase, kot so oglaševane, ampak kot so prilagojene, bo izšla prihodnji torek. Toda založniki bi ga morali pohiteti v tisk pred meseci, ko je izbruhnila pandemija, in grafikoni, ki temeljijo na dvomljivih podatkih, ki prikazujejo napredek bolezni, popolno motnjo odziva javnega zdravja, možnosti, da bi se okužili, in majhne podmnožica možnosti, da boste umrli, se je začel vsak dan pojavljati na naslovnicah. Konteksti so se spreminjali, sklepi so bili zanesljivo različni in združeni le v svoji sposobnosti, da vas spodbudijo, da izgubite vero v podatke. West in Bergstrom, ki poučujeta informacijske znanosti na Univerzi v Washingtonu, nas spominjata, da je vera stari klobuk. Če želite vedeti, kaj točno se dogaja, morate biti sposobni sami oceniti podatke in njihovo manipulacijo. To je presenetljivo enostavno.
Ko smo bili v srednji šoli, so statistiko in verjetnost vohali kot nenatančna matematična polja, ki se zanašajo na p-vrednost, standard, s katerim se pogosto manipulira. Če niste želeli študirati ekonomije in videti svet, niste izgubljali časa zanje. Srednja vrednost, mediana, način, standardna deviacija, permutacije in kombinacije, ritualno kimanje Pascalu in šli ste naprej. Na Booleovo algebro, če so te navdušili računalniki, pa na trigonometrijo in račun za vse ostalo. Kdo bi si lahko mislil, da se bo statistika izkazala za najpomembnejšo veščino za razumevanje dogajanja v človeških zadevah?
V dobi velikih podatkov in strojnega učenja se zdi, da je težava še večja zaradi velike velikosti naborov podatkov in nedoumljivosti algoritmov. Gibanje išče preglednost v algoritmih – če vas je računalnik spregledal, bi morali vedeti, zakaj – vendar je cilj lažje določiti kot doseči. Strojno učenje se usposablja na nizih podatkov, ki jih razvrščajo ljudje, in napiše program za kategorizacijo prihodnjih podatkov. Toda tudi avtorji sistema morda ne vedo natančno, kako to deluje. Knjiga se nanaša na sistem ML, ki je zadolžen za ločevanje slik haskijev in volkov. Toda gledal je v ozadje, ne na živali. Umetna inteligenca je spoznala, da medtem ko je huskije mogoče ustreliti v različnih človeških kontekstih, je divje volkove najverjetneje fotografirati na ozadju snega. Šlo je le za pogled v ozadje in lažno, a natančno identificiranje živali.
Poleg tega je večina algov lastniških, z dobrim razlogom. Če bi Google javno objavil svoj algoritem za razvrščanje, bi to sprožilo svetovno oboroževalno tekmo, saj so ga vsi in njihov najstniški nečak poskušali igrati. Toda avtorji nas opozarjajo, da na splošno ni treba plezati v črno skrinjico, v kateri živi algo. Analiza kakovosti vhoda in izhoda zahteva samo preprosto logiko in služi svojemu namenu.
Vrnimo se k koronavirusu ter šibicam in diagramom na prvi strani in v razlagalih, ki prikazujejo njegovo uničujoče potovanje skozi človeško raso. Za divjo nedoslednost razmislite o bizarnem debaklu v zvezi s potrebo po maskah, pri čemer se mnenje, kot pomet brisalca vetrobranskega stekla, giblje med njihovo popolno neuporabnostjo in njihovo ključno vlogo pri zadrževanju. Najbolj nerodno je to, da je SZO, ki je globalno agendo vedno postavljala razumno, spodbudila negotovost in spodkopala zaupanje javnosti v pooblaščeno različico in v zanesljivost znanosti same.
In potem je bil ta farrago (pace Tharoor) grafov, grafikonov in vizualizacij podatkov. Tudi tukaj avtorji ponujajo preprosta preverjanja. Ali se lestvica začne od nič, od izhodiščne točke perspektive ali od poljubne številke, ki priročno prilagaja navidezne rezultate? Ali je lestvica linearna, ali 1 cm najprej predstavlja eno leto in 10 let pozneje, krivulje strmine? Ali je časovna lestvica pomanjšana do te mere, da postanejo kritične spremembe nevidne? Avtorji močno nasprotujejo razvrščanju grafičnih predstavitev, na primer tako, da ponazarjajo zgodbo od kmetije do vilic z uporabo zobcev vilic, ki niso v merilu, za predstavljanje podatkov. Ljudje smo zelo vizualne živali in prilagajanje grafa je najlažji način, da jih zavedete.
V knjigi ločimo starošolski BS, ki le daje vtis, da se nekaj resno dela v zvezi z nečim, kar te resno moti (v 80. letih v Indiji, takojšnja izvedba akcijskega načrta na vojni podlagi, pod neposrednim nadzorom visokih -pooblaščena komisija, ki jo vodi upokojeni sodnik vrhovnega sodišča) in novošolski BS, ki uporablja jezik matematike in naravoslovja ter statistike za ustvarjanje vtisa strogosti in natančnosti. To je tako razširjeno, da mora odgovorno oznanjanje postati javna dolžnost.
Prejemniki propagande verjamejo prvim le, če so politično nagnjeni k temu, a so pred slednjimi nemočni. Vrsta verjame, da je številčno izpodbijana, in se grozno preda, ko se sooči s podatki, ne glede na to, kako očitno so lažni ali zavajajoči. Številke žal niso nikoli govorile same zase. Zdaj so zakrivljeni podatki postali tako razširjeni, da preverjevalci dejstev, neukrotivi Galci informacijske dobe, ne morejo več sami zajeziti plime. Čas je, da se vsi odpravimo na digitalno pisanje.
Delite S Prijatelji: