Семинар за рачунарство и примењену математику, 20. новембар 2018.

Наредни састанак Семинара биће одржан у уторак, 20. новембра 2018. у сали 301ф Математичког института САНУ са почетком у 14:15.

Предавач: Владисав Јелисавчић, Математички институт САНУ

Наслов предавања: СТРУКТУИРАНО УЧЕЊЕ НАД ВЕЛИКИМ ПОДАЦИМА ЗАСНОВАНО НА ВЕРОВАТНОСНИМ ГРАФОВСКИМ МОДЕЛИМА

Апстракт: Вероватносни графовски модели су класа алгоритама за структуирано учење код којих је проблем представљен помоћу случајних променљивих. Марковљева случајна поља су вероватносни графовски модели у којима су променљиве представљене као чворови, док су интеракције између  променљивих представљене као гране неусмереног графа. Циљ истраживања представљеног у овом излагању је проналажење и анализа нових модела за структуирано учење и алгоритама за њихово обучавање. Учење оваквих модела се најчешће обавља проналажењем максималне веродостојности (eng. maximum likelihood), помоћу метода конвексне оптимизације. Ефикасност учења, као и закључивања на основу наученог модела, у  великој мери зависи од особина самог модела и претпоставки над којима је  заснован, као и прилагођености модела проблему. У склопу овог истраживања, најпре је осмишљена  и реализована генерализација једне постојеће GCRF формулације. Затим је извршена експериментална анализа предложеног модела на неколико синтетичких и неколико стварних скупова података из актуелних домена климатологије и здравства, као и анализа сложености алгоритма. Затим је уочен тип проблема који је веома заступљен а није довољно обрађен у литератури, и за који је могуће увести додатне претпоставке за које је показано да могу знатно олакшати проблем учења структуре из многодимензионалних података. Предложена су и реализована два нова GMRF модела заснована на уведеним претпоставкама и L1 регуларизационе норме, и развијени су брзи и скалабилни алгоритми за њихово учење. Показана је предност предложених модела над постојећим решењима у виду брзине и скалабилности. Предложени алгоритми су експериментално потврђени кроз поређење са најбржим постојећим решењима на неколико многодимензионалних синтетичких проблема као и на правим подацима из области експресије гена, DNK метилације и EEG сигнала. Затим је одрађена теоријска анализа сложености алгоритама и експериментално потврђена способност паралелизације. За крај су предложене још две додатне екстензије GCRF модела и постављена је теоријска основа за њихово учење.

 


Нажалост није могуће оставити коментар.

Вести и дешавања


Активности на семинарима

све вести