W ostatnich latach coraz więcej urzędów statystycznych w różnych krajach eksperymentuje z użyciem danych internetowych przy opracowywaniu indeksów cen konsumpcyjnych, zwłaszcza w kategorii dotyczącej cen żywności (dalej: inflacja żywności). W Polsce, w przypadku Głównego Urzędu Statystycznego (GUS) dane o produktach żywnościowych są jednak wciąż zbierane w tradycyjny sposób, przez ankieterów regionalnych urzędów statystycznych w wybranych punktach sprzedaży.
Celem projektu jest zaadresowanie kwestii niewystarczającego wykorzystania danych internetowych do pomiaru inflacji żywności w Polsce oraz analiza nowych możliwości badawczych, jakie umożliwia to podejście. Badanie zostanie przeprowadzone z użyciem techniki zautomatyzowanego pobierania danych ze stron internetowych (dalej: webscraping).
Podczas trwania projektu, w częstotliwości dziennej, z użyciem narzędzi pozwalających na webscraping stron sieci supermarketów funkcjonujących w Polsce zbierane będą informacje o oferowanych produktach żywnościowych. Na podstawie zebranych danych zostaną obliczone również indeksy cen żywności w dziennej częstotliwości. Z użyciem analizy statystycznej przetestowane będą także wyprzedzające właściwości dziennego wskaźnika CPI żywności otrzymanego za pomocą danych internetowych w stosunku do miesięcznego wskaźnika inflacji żywności GUS. Używając danych o indywidualnych produktach, porównany zostanie stopień lepkości cen żywności pomiędzy sklepami internetowymi i stacjonarnymi.