8004202  TIEDONLOUHINTA,  syksy 2004,  2 ov

8004202 KNOWLEDGE MINING, Fall 2004, 2cr.

 

 

Professori Ari Visa,  ari.visa@tut.fi

Huone TF309

Room TB309

Puhelin 3115 4388

Phone 3115 4388

===============================================================

Luentoja 28 h.

Lectures 28 h.

 

 

Aika ja -paikka:

Time and Place:                     Seminaarikurssi suoritetaa periodejen S1 ja S2 aikana. Luentoaika ja sali ovat nähtävissä sivun lopussa. Ensimmäinen tapaaminen tiistaina 31 elokuuta kello 14.15 salissa  TB222 .

The Course will be lectured during periods S1 and S2. Schedule is available at the end of this page. The first meeting will take place on the Tuesday, 31st of  August, 14:15 p.m. in the lecture room TB222.

 

Sisältö:

Topics:                                    Internetin ja suurten tietokantojen yleistymisen myötä tiedon etsinnän ja hallinnan tarve on kasvanut. Kurssilla käsitellään tarvittavaa datan esikäsittelyä, päätöspuita, sääntöpohjaista päättelyä, kasautumisanalyysiä, inkrementaalista oppimista sekä näiden sovelluksia. Luentosuunnitelma nähtävissä sivun lopussa. Alkuperäiset luentokalvot ovat saatavissa osoitteessa http://www.cs.sfu.ca/~han/dmbook . Tavoitteena on tutustuttaa kurssilaiset käytettävissä oleviin menetelmiin ja antamaan valmius niiden käyttämiseen ja kehittämiseen.

                                               

                                                By the increasing popularity of the Internet and large databases the need to knowledge retrieval and management is increasing.   On the course the following topics will be treated: data preprocessing, decision trees, rule based reasoning, cluster analysis, incremental learning,  and so on. The lecture plan is available at the end of this page. The original lecture slides are available at the address http://www.cs.sfu.ca/~han/dmbook . The aim is to introduce the main approaches in knowledge mining and to create the capability to use and  to develop the presented methods.

 

Kuulijakunta:

Audience:                               Kurssi on tarkoitettu opintojensa loppuvaiheessa oleville signaalinkäsittelyn, ohjelmisto- ja tietoliikennetekniikan opiskelijoille tai jatko-opintoihin.

                                                The course is intended to students who are close to graduation in the fields of signal processing, computer science or telecommunication. The course is also suitable to post-graduate studies.

 

Tutkintovaatimukset:

Requirements:                       Kurssin suorittamiseksi vaaditaan hyväksyttävästi suoritettu tentti ja tietokoneella tehtävä harjoitustyö. Harjoitustyön suorittamiseen liittyvistä asioista vastaa DI Tomi , Vesanen, 3743 , tomi.vesanen@tut.fi, huone TC415. Ensimmäinen harjoituskerta on torstaina 6.11.2003 klo xx-xx salissa yy. Harjoitustyö on saatavilla osoiteessa http://www.cs.tut.fi/~vesanent/KM.html .

 

                                                The examination is based on the final exam and an exercise work.

                                                M.Sc. Tomi Vesanen takes care of exercise work, phone 3743, room TC415, Email tomi.vesanen@tut.fi . The exercise work is available at the address http://www.cs.tut.fi/~vesanent/KM.html .

 

 

Kirjallisuus:

Literature:                              Data Mining: Concepts and Techniques,  Jiawei Han, Micheline Kamber, Morgan Kaufmann Publisher, 2000.

                                                Principles of Data Mining, David, J., Hand, Heikki Mannila, Padhric Smyth, MIT Press 2000.

 

 

 

Date

Place

Subject

31.8.2004

TB222

Introduction    Chapter 1

7.9.2004

TB222

Data Warehousing and OLAP technology for data mining     Chapter 2

13.9.2004

TB215

Data Preprocessing    Chapter 3

21.9.2004

TB222

Data mining primitives, languages and system architectures    Chapter 4

28.9.2004

TB222

Concept description: Characterization and Comparison    Chapter 5

5.10.2004

TB222

Mining association rules in large databases Chapter 6

14.10.2004

TB223

Classification and prediction     Chapter 7

26.10.2004

TB222

 Clustering analysis       Chapter 8

2.11.2004

TB222

 Mining complex types of data       Chapter 9

9.11.2004

TB222

Data Mining applications and trends in data mining        Chapter 10

30.11.2004

TB222

Models and Patterns HMS       Chapter 6

7.11.2004

TB222

Descriptive Modeling HMS       Chapter 9

7.11.2004

TB222

Predictive Modeling for Classification HMS Chapter 10

8.12.2004 10.00-12.00

TB223

Predictive Modeling for Regression HMS Chapters 11