• Joutuaksesi mukaan varmista, että olet CIS:n odotuslistalla. Päivityksiä ilmoitetaan sitä mukaa, kun tietoa on saatavilla. Toistaiseksi kaikki luokkaan 4 tai sitä alempaan luokkaan kuuluvat henkilöt ovat saaneet luvan ilmoittautua. Tässä vaiheessa uskomme, että kaikki jonotuslistalla olevat pääsevät kurssille.

  • Tutustukaa tämän verkkosivuston muihin osiin, erityisesti Policy- ja Syllabus-osioihin. Käyttäkää Piazzaa kysymysten esittämiseen tai laittakaa minulle (@danroth) sähköpostia.

  • Kurssi järjestetään synkronisena luokkana. Muutamaa poikkeusta lukuun ottamatta osallistuminen (ja siten läsnäolo) on pakollista. Keskustele kanssani (@danroth), jos uskot, että tämä on sinulle vaikeaa.

Kurssin kuvaus

Koneoppimisen tavoitteena on rakentaa tietokonejärjestelmiä, jotka pystyvät sopeutumaan ja oppimaan kokemuksistaan. Viime vuosina on nähty runsaasti sovelluksia, joissa hyödynnetään koneoppimisteknologioita, ja voidaankin väittää, että koneoppiminen on ollut olennainen osa monien viimeaikaisten teknologioiden menestystä, luonnollisen kielen teknologioista (Siri, hakuteknologia, automatisoitu mainonta, tekstinkorjaus) tietokonenäköteknologioihin (kuvantunnistussovellukset, autonomiset ajoneuvot), genomiikkaan, lääketieteelliseen diagnostiikkaan, sosiaalisten verkostojen analyysiin ja moneen muuhun.

Kurssilla esitellään eräitä keskeisimpiä koneoppimismenetelmiä, jotka ovat osoittautuneet arvokkaiksi ja menestyksekkäiksi käytännön sovelluksissa. Keskustelemme joistakin koneoppimisen peruskysymyksistä – milloin ja miksi oppiminen toimii – jotta saamme hyvän käsityksen alan peruskysymyksistä, ja esittelemme tärkeimmät paradigmat ja tekniikat, joita tarvitaan menestyksekkään suorituskyvyn saavuttamiseksi sovellusalueilla, kuten luonnollisen kielen ja tekstin ymmärtämisessä, puheentunnistuksessa, tietokonenäkemisessä, tiedonlouhinnassa, adaptiivisissa tietokonejärjestelmissä ja muissa. Kurssin pääosassa käydään läpi useita valvottuja ja (puoli)valvomattomia oppimismenetelmiä. Näihin kuuluvat lineaaristen esitysten oppimismenetelmät, päätöspuu- ja Bayesin menetelmät, kernel-pohjaiset menetelmät ja neuroverkkomenetelmät sekä klusterointi ja dimensionaalisuuden vähentäminen. Keskustelemme myös siitä, miten ongelmia voidaan mallintaa koneoppimisongelmiksi, miten oppimisalgoritmeja voidaan arvioida ja miten käsitellä joitakin reaalimaailman ongelmia, kuten kohinaista dataa ja toimialan mukauttamista.

Edeltävät opinnot

Edellytämme perustuntemusta lineaarialgebrasta (lähinnä merkintätapa ja peruskäsitteet), perustodennäköisyydestä, laskennasta ja tietorakenteesta/algoritmeista CIS 121:n tasolla

Aika ja paikka

Luennot

Mon/Wed 10:30 – 12:00pm
Synkronisesti Zoomin kautta

Kertaukset

Tentatively, Tuesday & Wednesday (Details TBD)

Lisävaatimus CIS 519:lle

Tämän kurssin jatko-opiskelijaversioon (CIS 519) ilmoittautuneilta opiskelijoilta edellytetään lisätehtäviä koko lukukauden ajan. Tähän työhön sisältyy kurssiprojekti ja (mahdollisesti) lisäosia kotitehtäviin ja tentteihin.

Koska näillä kahdella versiolla on erilaiset vaatimukset, et voi suorittaa kurssia CIS 419:nä ja myöhemmin anoa sen muuttamista CIS 519:ksi jatko-opintopisteitä varten; jos harkitset tämän kurssin muuttamista CIS 519:ksi jatko-opintopisteitä varten, ilmoittaudu jatko-opiskelijoille tarkoitetuksi versioksi nyt.

Vertailu CIS 520:een

Vertailu CIS 520:een

Ylitsevuotavan kysynnän vuoksi Penn tarjoaa kahta eri koneoppimiskurssia: CIS 419/519 (Applied Machine Learning) ja CIS 520 (Machine Learning). Tässä osiossa kuvataan lyhyesti näiden kurssien välisiä eroja.

CIS 419/519 Applied Machine Learning (tämä kurssi!) on johdantotason kurssi koneoppimiseen (ML), jossa painotetaan ML-tekniikoiden soveltamista. Kurssi on listattu ristiin perustutkintokurssin (419) ja jatkotutkintokurssin (519) versioiden välillä; jatkotutkintokurssilla 519 on hieman erilaiset vaatimukset, kuten edellä on kuvattu. CIS 419/519 on tarkoitettu opiskelijoille, jotka ovat kiinnostuneita nykyisten koneoppimismenetelmien käytännön soveltamisesta todellisiin ongelmiin eivätkä niinkään ML:n tilastollisista perusteista ja teoriasta, joita käsitellään CIS 520 Machine Learning -kurssissa. CIS 419/519 käsittelee joitakin ML:n perusteita, mutta sen on tarkoitus olla matemaattisesti vähemmän perusteellinen kuin CIS 520; tämä ei välttämättä tarkoita, että se olisi ”helpompi”. Tarkoituksena on, että opiskelijat lähtevät tältä kurssilta niin, että he ymmärtävät hyvin koneoppimisen keskeiset kysymykset ja että heillä on vankka tausta siitä, miten mallintaa ja soveltaa koneoppimista omiin ongelmiinsa.

CIS 519 EI ole CIS 520 -kurssin ennakkoedellytys. Ei ole kuitenkaan järkevää suorittaa CIS 519:ää sen jälkeen, kun on jo suorittanut CIS 520:n. On myös vähän järkevää, mutta mahdollista, ottaa ensin CIS 419/519 ja sitten myöhemmin CIS 520.