Seminar za veštačku inteligenciju, 23. decembar 2024.

Naredni sastanak Seminara biće održan onlajn u ponedeljak, 23. decembra 2024. godine, sa početkom u 19 časova.

Predavač: Biljana Stojanović, Matematički institut SANU

Naslov predavanja: TAČNOST KLASIFIKACIONIH MODELA PRI NARUŠENOJ VERODOSTOJNOSTI ULAZNIH PODATAKA

Apstrakt:
U ovom predavanju se prikazuje uticaj verodostojnosti ulaznih podataka na kvalitet i tačnost (engl. accuracy) formiranih klasifikacionih modela. Cilj je da se pokaže u kojim slučajevima i u kom procentu podaci moraju da budu verodostojni i kakvi su gubici ukoliko se radi sa degradiranim podacima (engl. poisoning data), pri čemu stepen degradacije (engl. poisoning attack) može da varira.

Materijal koji se koristi u eksperimentu obuhvata podatke koji karakterišu SARS_CoV_2 koronavirus. Modeli se formiraju na osnovu izračunatih karakterističnih profila (vektora realnih vrednosti) prema upotrebi kodona (engl. Codon Usage Bias) u kodirajućim sekvencama proteina virusa. Istraživanje ima za cilj da utvrdi u kojoj meri verodostojnost podataka za formiranje klasifikacionih modela utiče na tačnost predviđanja tipa proteina virusa prema upotrebi kodona.
Dve osnovne degradacije podataka pri formiranju klasifikacionih modela (engl. poisoning attack on training data) koje se razmatraju su degradacija ulaznih atributa modela i modifikacija labela podataka (atributa klasa modela). Modifikacija ulaznih atributa obuhvata promene nad izabranim podskupom atributa, kao i nad svim atributima. Atributi se postavljaju na slučajno izabrane vrednosti i na izabrane vrednosti prema tipu proteina. Labele podataka se modifikuju slučajnim izborom nove vrednosti ili ciljanom izmenom samo pojedinih labela.

U eksperimentu se za formiranje klasifikacionih modela koristi više algoritama. Za svaki vid modifikacije podataka prikazuje se ukupna tačnost predviđanja modela, kao i tačnost predviđanja pojedinačnih tipova proteina virusa. Zahvaljujući stabilnosti klasifikacionih algoritama (i načinu na koji formiraju model), eksperiment pokazuje da dobijeni modeli imaju visoku tačnost. Bez obzira na to koji algoritam se koristi, dobijaju se vrlo slični rezultati u pogledu odnosa tačnosti predviđanja modela i stepena degradacije ulaznih podataka.

Napomena:
Registraciona forma za učešće i link za aktivno praćenje predavanja za registrovane korisnike (nakon logovanja):
https://miteam.mi.sanu.ac.rs/asset/CW5nJWDSEZDj7p32p

Neregistrovani korisnici mogu da prate predavanja na ovom linku (bez mogućnosti aktivnog učešća):
https://miteam.mi.sanu.ac.rs/call/hR9vL94nD6QE8qQZj/xET9GcPMyR08nqH8lnS3SE7N5Vf00H7Lp9EBhsv6Lti