ПА-4 Машинско учење-алгоритми машинског учења
Машинско учење увод и основни појмови Деф: the desgn and development of algorthms that allow computers to mprove ther performance over tme based on data sensor data or databases; Пројектовање и развој алгоритама у циљу обезбеђивања аутономног понашања интелигентних система у одговарајућем домену; Машинско учење представља програмирање интелигентних система рачунара мобилних робота итд. тако да је систем у стању да самостално донеси одлуке приликом интеракције са окружењем; Машинско учење представља процес обучавања одговарајућег параметарског модела система или процеса сходно усвојеном алгоритму обучавања и критеријуму перформансе. Кључне речи: Desgn пројектовање Development развој Algorthms Computers Improved performance Based on data
Основни видови машинског учења. Надгледано учење под надзором - ученик добија инструкције од стране учитеља шта треба да научи - реализује се у форми увођења функције циља критеријум перформансе која представља учитеља.. Ненадгледано учење без надзора - учитељ није експлицитно одређен - ученик мора сам да донесе закључак о пореклу и припадности података - пример Self Organed Maps SOM Adaptve Resonance Theory ART 3. Машинско учење ојачавањем - машинско учење базирано на емпиријским информацијама из окружења - оцена стања система са становишта успешности понашања 3
Основни видови надгледаног машинског учења. Класификација - издвајање класа из доступних података - технолошко препознавање типске технолошке форме - препознавње карактеристичних обележја окружења - препознавање говора - постављање дијагноза у медицини на основу прикупљених података нпр. рендген ултразвук итд. X A A A A A A A B B B B B B B B X 4
Основни видови надгледаног машинског учења. Регресија - функционална апроксимација - предикција вредности одговарајућих индекса на берзи Линеарна апроксимација: Y Нелинеарна апроксимација: Y Y X Y X X X 5
Надгледано машинско учење Обучавајући скуп: s { y } Улазни подаци Жељени излаз Нпр. класификација електронске поште: S={prmljena pošta spam non-spam poslovna prepska prvatna prepska} Или... Предикција квадратуре стана на основу цене: Цена <50.000 50.000-70.000 70.000-90.000 >00.000 Квадратура ~.000.500 ~.000 >.000 Локација? 6
Пример #: цена половног аутомобила регресија : карактеристике аутомобила y : цена y = g θ g - регресиони модел θ параметри Усвојити критеријум перформансе и одредити регресиони модел 7
Пример #3: препознавање лица Обучавајући скуп: х={dmeđu dva okadmeđu očju ustadužna nosa...} y={petar Petrovć Marko Markovć...} Скуп за верификацију Бајесовско препознавање Вештачке неуронске мреже Статистички алгоритми Примена: Безбедност објеката коцкарнице?! тероризам итд. 8
Критеријум прерформансе основни еталон приликом доношења одлука: J y y... n y n Функција циља Учитељ Вредност вектора х одређујемо на основу итеративног поступка и тражења минимума функције циља: Ј J 0 k J k Идеална ситуација: локални минимум глобални минимум Ако функција циља има један и само један минимум проблем је линеаран х На жалост... 9
Критеријум прерформансе основни еталон приликом доношења одлука: J y y... n y n Функција циља Учитељ Одређивање оног градијента функције циља који једнозначно одређује правац највећег опадања саме функције циља. w w w +w w +w o w 0 w * w n * n Ew w n td od dd SSE SSE SSE SSE W... W W Wm SSE W m 0 Wm
Нема учитеља; Ненадгледано машинско учење Ученик самостално учи; Ученик на основу низа X {... n} који представља скуп прикупљених података треба нешто да закључи; Нема излазних величина нису експлицитно дефинисане;
Пример: ЕМ алгоритам Epectaton-Mamaton }... { n X p p p 0; ; ~ k j j j Multnomal ~ j j N j j p => Улазни скуп Дакле сваки улазни вектор х одређен је случајним избором из скупа { k}. Након тога х је добијено из једне од к нормалних расподела које зависе од промењљиве. m k m p p p L ; ; log ; log
Машинско учење ојачавањем Пример: интелигентни мобилни робот Интелигентни агент-мобилни робот Награда Одлука Технолошко окружење Вектор стања Оцена стања система на основу сензорске информације из окружења Одабир одлуке према одабраном алгоритму нпр. унапред дефинисано кретање унапред сретање... Нумеричка оцена повољности новог стања мобилног робота 3
Q - учење ојачавањем: Машинско учење ојачавањем Вредносна оцена стања се ажурира према: Q ma t s a Q s a r t t t t t t Q s a Q s a a t t t t t t ta Остали алгоритми машинског учења ојачавањем: SARSA Actor- Crtc 4
Хвала на пажњи! Питања? 5