Seminar Katedre za verovatnoću i statistiku 17. jun

Naredni sastanak Seminara Katedre za verovatnoću i statistiku će se održati u sredu 17. juna u 14:15 časova, u učionici 843.

Predavač: Luka Perović (Matematički fakultet)

Naslov predavanja: Detekcija promena režima u multinomnim modelima sa primenom na analizu tema u naučnim radovima

Abstrakt:

Detekcija promene režima u nizovima slučajnih veličina predstavlja značajan problem savremene statistike. Među najpoznatijim pristupima izdvaja se detekcija promene srednje vrednosti zasnovana na praćenju kumulativnih suma (CUSUM), koja se tradicionalno primenjuje u okviru modela sa normalno raspodeljenim slučajnim veličinama. Poslednjih godina posebnu pažnju privlače neparametarske metode, koje omogućavaju detekciju promena bez oslanjanja na stroge pretpostavke o raspodeli podataka. U pojedinim primenama javlja se potreba za objedinjavanjem prednosti oba pristupa, što će biti jedna od tema ovog predavanja.

Multinomna raspodela prirodno se nameće kao osnovni statistički model za tekstualne podatke, budući da opisuje učestalosti pojavljivanja reči u dokumentima. Zbog toga se metode za detekciju promene u multinomnom modelu mogu uspešno primeniti u analizi tekstualnih dokumenata. U ovom radu predlažemo modifikaciju test statistike iz rada [1], koja pokazuje veću moć u odnosu na originalnu statistiku pri analizi multinomnih podataka.

Pored toga, razmatramo i empirijski složeniji slučaj podataka generisanih iz Dirihleove raspodele, koja se često koristi kao fleksibilniji i realističniji model za reprezentaciju tekstualnih dokumenata. Postupak zaključivanja zasnovan na predloženoj test statistici dodatno unapređujemo primenom neparametarskog butstrepa, čime se omogućava njena efikasna primena i u ovom modelu.

Posebna pažnja posvećena je situacijama u kojima se frekvencija pristizanja dokumenata menja tokom vremena i pokazuje rastući trend. Pokazujemo da predloženi pristup zadržava svoju primenljivost i u takvim uslovima, što je od naročitog značaja za analizu savremenih tekstualnih podataka.

[1] Preis, A., & Schwaar, S. (2024). Change point detection in text data. Behaviormetrika, 51(1), 477-496.

Predavanje je moguće pratiti i onlajn, putem linka

https://zoom.us/j/96862208366?pwd=MzJkO96zYg7NFwojuS9b4fo6c6BVG4.1

Meeting ID: 968 6220 8366
Passcode: 375663