Accelerating Random Forests in Scikit-Learn Gilles Louppe August 29, 2014 Universit´

Accelerating Random Forests in Scikit-Learn

Gilles Louppe

Universit´e de Li`ege, Belgium

August 29, 2014

1 / 26

Motivation

... and many more applications !

2 / 26

About

Scikit-Learn

•Machine learning library for Python

•Classical and well-established

algorithms

•Emphasis on code quality and usability

Myself

•@glouppe

•PhD student (Li`ege, Belgium)

•Core developer on Scikit-Learn since 2011

Chief tree hugger

scikit

3 / 26

Outline

1Basics

2Scikit-Learn implementation

3Python improvements

4 / 26

Machine Learning 101

•Data comes as...

A set of samples L={(xi,yi)|i= 0,...,N−1}, with

Feature vector x ∈Rp(= input), and

Response y∈R(regression) or y∈ {0,1}(classiﬁcation) (=

output)

•Goal is to...

Find a function ˆy=ϕ(x)

Such that error L(y,ˆy) on new (unseen) xis minimal

5 / 26

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

Accelerating Random Forests in Scikit-Learn Gilles Louppe August 29, 2014 Universit´

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Accelerating Random Forests in Scikit-Learn Gilles Louppe August 29, 2014 Universit´

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib