Story of one picture


This blog is dedicated to reflections on leadership, business, and technology.
Each story is complemented with photographs, which are worth a thousand words.
Enjoy reading and hearing
Podcast available at:

Korelacja

Korelacja

Tuesday, June 17, 2025

by Aleksander Poniewierski, APConsulting

W ostatnich dniach internet zalewają statystyki porównujące GDP per capita naszego kraju oraz potęg gospodarczych, pokazujące, jak w przeciągu kilku dekad dogoniliśmy wielkie gospodarki światowe oraz prognozujące kolejny sukces za kilka lat. I jest to fajne, budujące i sprawiające, że chce się żyć.

Jednak na tej fali pojawia się śmieszna tendencja. Myślę, że ośmiesza ona prezentujących, nawet gdy próbują manipulować danymi. Politycy pokazują, jak to kolejne rządy przyczyniły się do wzrostu gospodarczego, podczas gdy rządy konkurentów cechowały się stagnacją. Oczywiście wykresy są urywane w niewygodnych latach lub nie uwzględniają kryzysów gospodarczych. Inni starają się dorabiać teorie, dokładając kolejne zestawienia pokazujące, że to raz wolność obywatelska jest podstawą wzrostu, a raz demokratyczne rządy.

Błędne korelacje (ang. spurious correlations). Za moich czasów studenckich, gdy dostęp do danych był bardzo ograniczony, były czymś na kształt memów. Korelacje konsumpcji masła w stanie Idaho z pojawianiem się kolejnych filmów Nicolasa Cage’a lub wzrost liczby samobójstw w Australii skorelowany z rekordowym rokiem produkcji oleju słonecznikowego w Europie. W tamtych czasach teorie spiskowe podparte danymi były bardzo popularne. Ale dzisiaj, w świecie wszechobecnej informacji, gdzie wystarczy kliknąć w internet lub zapytać ChataGPT, są po prostu śmieszne.

Nasuwa się pytanie: czy twórcy lub udostępniający takie informacje zakładają, że nikt tego nie sprawdzi? Czy może uważają, że to prawda? Moja teoria jest następująca: chcą prezentować się jako profesjonaliści. No bo nic tak świetnie nie działa jak makroekonomiczne dane podpierające jakąś tezę. Dobry wykres trafia i przekonuje. Wiele lat temu, na szkoleniu z prezentacji, uczono mnie, że aby slajd był dobry, musi mieć cyfry. I bynajmniej nie chodzi o numery stron.

Nie bądźmy naiwni. Kilka fajnych przykładów: https://www.datasciencecentral.com/spurious-correlations-15-examples/

No comments yet
Search