Nowcasting, czyli prognozowanie teraźniejszości

Niniejszy wpis zawiera główne tezy z opracowania: E. Tomczyk, T. Doligalski, Predicting New Car Registrations: Nowcasting with Google Search and Macroeconomic Data, [w:] Sł. Partycki (red.), E-społeczeństwo w Europie Środkowej i Wschodniej. Teraźniejszość i perspektywy rozwoju, Wydawnictwo KUL, Lublin 2015, s. 228-236.

W nowoczesnej gospodarce dostępnych jest wiele źródeł danych opisujących aktualne zjawiska społeczne. Dane te są pomocne przy modelowaniu zachowań różnych podmiotów gospodarczych, takich jak konsumenci lub firmy. Źródłami danych mogą być aukcje internetowe, firmy kurierskie, operatorzy kart płatniczych czy też firmy telekomunikacyjne, gdyż dysponują one precyzyjnymi informacjami na temat transakcji lub zdarzeń w określonych lokalizacjach [2, s.1]. Szczególne znaczenie wśród nich odgrywają wyszukiwarki internetowe posiadające dane na temat treści i częstotliwości zapytań.  Dzięki usłudze Google Trends analizować można liczbę i lokalizacje poszczególnych zapytań kierowanych do wyszukiwarki. Dostępność tego typu danych umożliwia modelowanie zjawisk społecznych zgodnie z zasadami nowcastingu.

Nowcasting to pojęcie będące połączeniem angielskich pojęć now (teraz) i forecasting (prognozowanie). Bańbura i in. podają następującą definicję nowcastingu: „prognozowanie teraźniejszości, bardzo bliskiej przyszłości oraz bardzo niedawnej przeszłości” [1, s. 4]. Powodem dla modelowania aktualnych lub przeszłych zdarzeń są opóźnienia w dostępie do danych, które w nowoczesnych gospodarkach sięgają czasami tygodni lub miesięcy. Innymi czynnikami zwiększającymi zasadność stosowania nowcastingu są makroekonomiczne turbulencje, wysoki poziom niepewności oraz nieprzewidziane szoki. Okoliczności te sprawiają, że wartości z poprzednich okresów tracą swoją moc predykcyjną [4, s. 4]. Nowcasting polega bowiem na wykorzystaniu danych, które publikowane są wcześniej i czasami z większą częstotliwością niż prognozowana wielkość. Celem nowcastingu jest ustalenie „wczesnego oszacowania” prognozowanej wielkości, zanim dane o wielkościach rzeczywistych zostaną podane [1, s. 4]. Zakres zjawisk będących przedmiotem nowcastingu jest szeroki i obejmuje m.in. aktualne zmiany w poziomie bezrobocia, konsumpcji prywatnej  oraz – wykraczając poza obszar zjawisk ekonomicznych – rozwój chorób zakaźnych [2, s. 2]

Wyszukiwarki internetowe stanowią źródło cennych danych o zachowaniach różnych podmiotów (przede wszystkim konsumentów) w nowoczesnej gospodarce. Ich użyteczność wynika z jednej strony z wysokiej popularności użycia, z drugiej –  z rodzaju zbieranych danych. Zapytania do wyszukiwarek internetowych, w przeciwieństwie do badań kwestionariuszowych, nie są bowiem obarczone błędem wynikającym z podawania fałszywych informacji w celu kształtowania pożądanego wizerunku. Poniżej prezentujemy trzy warunki, których spełnienie zwiększa zasadność nowcastingu z wykorzystaniem danych z wyszukiwarki internetowej.

  • Prognozowane zjawisko poprzedzone jest zapytaniami do wyszukiwarki internetowej

Sposób korzystania z wyszukiwarki internetowej zależy w dużym stopniu od rodzaju szukanej informacji. Konsumenci z większym prawdopodobieństwem będą szukali informacji o produktach, z zakupem których związany jest wysoki poziom zaangażowania lub wysoki poziom ryzyka [3, s. 1340]. W odmiennych okolicznościach mogą oni polegać na opinii znajomych i w mniejszym stopniu korzystać z wyszukiwarek internetowych (np. na rynkach lokalnych).

  • Można zidentyfikować zapytania związane z prognozowaną aktywnością

Częstym problemem jest ustalenie zapytań, które nie tylko są związane z prognozowaną aktywnością, ale również ją poprzedzają. Zapytania zawierające nazwę marki lub produktu występują nie tylko na etapie przedzakupowym, ale również na etapie usług posprzedażnych. Dotyczyć one mogę zakupu nie tylko nowych, lecz także używanych produktów. Sama lista wyrażeń związanych jedynie z etapem przedzakupowym może być długa i trudna do ustalenia. Co więcej, frazy te mogą być rzadko wpisywane do wyszukiwarki, w konsekwencji częstotliwość tego typu zapytań może nie być podawana.

  • Zapytania w podobnym stopniu prowadzą do prognozowanej aktywności

Innymi słowy, podmioty dokonujące zapytań charakteryzują się podobnym potencjałem zakupowym. Konsument szukający informacji o filmie wyświetlanym w kinach prawdopodobnie zobaczy ten film raz lub w nie zobaczy go wcale. Inwestor wpisujący do wyszukiwarki oznaczenie spółki notowanej na giełdzie teoretycznie może nabyć lub sprzedać dowolną liczbę akcji spółki. W pierwszym przypadku zapytania do wyszukiwarki będą prawdopodobnie lepszym predyktorem popytu. Prognozowanie popytu z wykorzystaniem danych z Google Trends jest bowiem łatwiejsze na rynku nabywców indywidualnych (B2C), gdyż wielkość transakcji związanych z zapytaniem do wyszukiwarki jest zbliżona. Warto jednakże zauważyć, że niektóre marki mogą przyciągać uwagę konsumentów pomimo braku intencji zakupowych (np. marki prestiżowe, innowacyjne produkty).

 Co ciekawe, Choi i Varian udawadniają, że wykorzystanie bardziej złożonych metod umożliwia przezwyciężenie podanych powyżej ograniczeń [2, s. 2]. Wykorzystując dane z usługi Google Correlate modelują oni indeks zaufania australijskich konsumentów. Dokonują tego dzięki identyfikacji zapytań, których częstotliwość zadawania skorelowana jest z poziomem zaufania konsumentów w przeszłości. Prognozowanie poziomu zaufania konsumentów bazuje wówczas na założeniu, że korelacja między częstotliwością określonych zapytań a poziomem zaufania utrzyma się w przyszłości.

W opracowaniu Predicting New Car Registrations: Nowcasting with Google Search and Macroeconomic Data stosujemy zasady nowcastingu do prognozowania rejestracji samochodów osobowych szesnastu najpopularniejszych marek w Polsce w latach 2011-2014.  Zmiennymi niezależnymi są: liczba rejestracji samochodów poszczególnych marek z poprzedniego miesiąca, liczb zapytań do wyszukiwarki Google zawierających nazwę marki oraz reprezentujący sytuację makroekonomiczną wskaźnik PMI. Dwie ostatnie zmienne dotyczą okresu sprzed dwóch miesięcy w stosunku do prognozowanego miesiąca.

Analiza empiryczna rejestracji samochodów osobowych sugeruje występowanie różnic między producentami  z kategorii mali lub średni a największymi wytwórcami samochodów. W przypadku producentów małych i średnich nie byliśmy w stanie ustalić ekonomicznie poprawnej i jednocześnie statystycznie istotnej relacji między liczbą rejestracji a częstotliwością zapytań i poziomem wskaźnika PMI. Sugerować to może, że na liczbę rejestracji samochodów mniej popularnych marek nie wpływa bezpośrednio sytuacja makroekonomiczna i trudno dopasować model, który spełniałby standardowe kryteria jakości.

W przypadku czterech producentów należących do kategorii największych, tj. Forda, Opla, Skody oraz Toyoty, rejestracje są tłumaczone z wykorzystaniem opóźnionej o jeden okres zmiennej objaśnianej, liczby zapytań do wyszukiwarki sprzed dwóch miesięcy oraz – z wyjątkiem Toyoty – wskaźnika PMI również sprzed dwóch miesięcy. Sugerować to może, że najwięksi producenci samochodów charakteryzują się podobną zależnością między liczbą rejestracji a liczbą zapytań do wyszukiwarki i wskaźnikiem makroekonomicznym. Ciekawa jest również obserwacja, że w przypadku Volkswagena, również należącego do największych producentów, liczba rejestracji zależy jedynie od czynnika autoregresji (tu: liczby zapytań z poprzedniego miesiąca). Sugerować to może, że w przypadku tej marki liczba zapytań do wyszukiwarki nie stanowi istotnego czynnika w tłumaczeniu zmienności zachowań nabywczych.

Rozszerzenie tez opisanych w niniejszym wpisie, w szczególności w zakresie przeglądu literatury, opisu zastosowanej metody badawczej oraz omówienia wyników, znajduje się w opracowaniu:  E. Tomczyk, T. Doligalski, Predicting New Car Registrations: Nowcasting with Google Search and Macroeconomic Data, [w:] Sł. Partycki (red.), E-społeczeństwo w Europie Środkowej i Wschodniej. Teraźniejszość i perspektywy rozwoju, Wydawnictwo KUL, Lublin 2015, s. 228-236.

Przypisy

  1. Bańbura M., Giannone D., Modugno M., Reichlin L. (2013). Now-Casting and the Real-Time Data Flow, Working Papers, European Central Bank, no. 1564.
  2. Choi H., Varian H. (2011). Predicting the Present with Google Trends. Economic Record, 88: 2–9. doi: 10.1111/j.1475-4932.2012.00809.x.
  3. Dholakia U.M. (2001). A motivational process model of product involvement and consumer risk perception, European Journal of Marketing, vol. 35 iss: 11/12, pp.1340 – 1362.
  4. Schmidt T., Vosen S. (2009). Forecasting Private Consumption: Survey-based Indicators vs. Google Trends. Ruhr Economic Papers, 155.