Méthodes non linéaires pour séries temporelles

Prédiction par double quantification vectorielle et sélection du délai en hautes dimensions
First Edition

De la finance à la climatologie, en passant par les processus industriels, nombreux sont les domaines où on rencontre des séries temporelles. L'analyse, la modélisation et la prédiction de séries temporelles constituent aujourd’hui encore des défis, sur le plan scientifique tout comme dans ces nombreux domaines d’applications. En alternative aux modèles linéaires, les modèles non linéaires sont utilisés ici pour l’analyse, la modélisation et la prédiction de séries temporelles. Les modèles non linéaires sont potentiellement plus performants que les modèles linéaires, mais les questions de sélection de structure de modèle, de prédiction à long terme ou de construction des régresseurs sont plus complexes à résoudre dans le cadre non linéaire. Les paramètres de structure de certains modèles et des méthodes de sélection de structure sont d’abord décrits. La sélection de structure par FastBootrap est complétée par un test statistique qui constitue un argument théorique en faveur de l’approximation par régression linéaire du terme d’optimisme du Bootstrap. La Double Quantification Vectorielle (DQV), modèle de prédiction à long terme de séries temporelles, est introduite. La détermination des paramètres est détaillée, pour des séries scalaires et pour des séries multidimensionnelles auxquelles la DQV peut aisément être appliquée. La stabilité de la DQV en prédiction à long terme est établie théoriquement. Les capacités de la méthode sont illustrées sur divers exemples, en prédiction à court terme, à long terme, en scalaire et en multidimensionnel. La construction du régresseur est abordée lors de l’étude du caractère significatif de l'application des méthodes de clustering à des régresseurs. Une méthodologie de comparaison entre reconstructions de l’espace de phase de séries temporelles est décrite et appliquée sur plusieurs séries. Les résultats obtenus illustrent l’importance du délai dans la construction de régresseurs et permettent de prendre position dans un débat scientifique en cours : l’application des méthodes de clustering à des régresseurs a un sens. La construction du régresseur avec sélection d’un délai unique est alors généralisée au cas de plusieurs délais. Des généralisations des critères d’autocorrélation et d’information mutuelle à plus de deux variables sont proposées. Le critère géométrique de Distance à la Diagonale est également introduit. Tous ces critères de sélection de plusieurs délais sont comparés expérimentalement.


Paperback - In French 15.00 €

InfoFor more information on VAT and other payment methods, see "Payment & VAT".

Specifications


Publisher
Presses universitaires de Louvain
Title Part
Numéro 147
Author
Geoffroy Simon,
Collection
Thèses de l'École polytechnique de Louvain
Language
French
BISAC Subject Heading
TEC000000 TECHNOLOGY & ENGINEERING
Onix Audience Codes
06 Professional and scholarly
CLIL (Version 2013-2019)
3069 TECHNIQUES ET SCIENCES APPLIQUEES
Title First Published
01 January 2007
Type of Work
Thesis

Paperback


Publication Date
01 January 2007
ISBN-13
9782874630736
Extent
Main content page count : 168
Code
75776
Dimensions
15 x 24 x 0.9 cm
Weight
284 grams
List Price
15.00 €
ONIX XML
Version 2.1, Version 3

Google Book Preview


Write a commentary

Contents


1 Introduction `a la pr´ediction de Séries temporelles 1

1.1 D´efinitions, notations et exemples . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 Analyse, mod´elisation et pr´ediction . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Organisation de la th`ese et contributions . . . . . . . . . . . . . . . . . . . . 5

2 Mod`eles, s´election de structure et pr´ediction `a long terme 7

2.1 Mod`eles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.1.1 Comment s’y retrouver parmi les nombreux mod`eles? . . . . . . . . 7

2.1.2 Quantification vectorielle . . . . . . . . . . . . . . . . . . . . . . . . 8

2.1.3 Les cartes auto-organis´ees . . . . . . . . . . . . . . . . . . . . . . . . 10

2.1.4 Les r´eseaux `a fonctions radiales de base . . . . . . . . . . . . . . . . 13

2.2 S´election de structure de mod`eles . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2.1 Crit`eres de mesure de l’erreur de g´en´eralisation . . . . . . . . . . . . 17

2.2.2 M´ethodes de validation et de cross-validation . . . . . . . . . . . . . 18

2.2.3 Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.2.4 Fast-bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.3 Pr´ediction `a long terme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.4 R´esum´e du chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3 Double Quantification Vectorielle 31

3.1 Pr´ediction par Double Quantification Vectorielle . . . . . . . . . . . . . . . 31

3.2 Cartes auto-organis´ees et Séries temporelles . . . . . . . . . . . . . . . . . . 32

3.3 La Double Quantification Vectorielle . . . . . . . . . . . . . . . . . . . . . . 35

3.3.1 Phase d’apprentissage . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.3.2 Phase de pr´ediction . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.3.3 Pr´ediction `a long terme par Double Quantification Vectorielle . . . . 39

3.4 Commentaires sur la Double Quantification Vectorielle . . . . . . . . . . . . 41

3.5 Stabilit´e `a long terme de la Double Quantification Vectorielle . . . . . . . . 42

3.5.1 Rappels sur les chaˆınes deMarkov . . . . . . . . . . . . . . . . . . . 43

3.5.2 Preuve de stabilit´e `a long terme . . . . . . . . . . . . . . . . . . . . 45

3.5.3 Port´ee du r´esultat de stabilit´e . . . . . . . . . . . . . . . . . . . . . . 54

3.6 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

3.6.1 Santa Fe A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

3.6.2 Série polonaise ´electrique . . . . . . . . . . . . . . . . . . . . . . . . 59

3.6.3 CATS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3.7 Pr´ediction r´ecursive, pr´ediction directe : discussion sur les performances `a long terme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

3.8 M´ethodes proches de la Double Quantification Vectorielle . . . . . . . . . . 68

3.8.1 Double Quantification et RBFN locaux . . . . . . . . . . . . . . . . 68

3.8.2 DoubleMatrice des Transitions . . . . . . . . . . . . . . . . . . . . . 69

3.9 R´esum´e du chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

4 L’importance de la s´election du d´elai dans la construction de r´egresseurs 75

4.1 Analyse de Séries temporelles . . . . . . . . . . . . . . . . . . . . . . . . . . 75

4.2 Construction de r´egresseurs et choix du d´elai . . . . . . . . . . . . . . . . . 76

4.3 Le clustering de r´egresseurs est-il significatif? . . . . . . . . . . . . . . . . . 77

4.4 Crit`eres de comparaison pour distributions de prototypes . . . . . . . . . . 79

4.5 Comparaison de distributions de prototypes . . . . . . . . . . . . . . . . . . 81

4.6 Distance `a la Diagonale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

4.7 S´election de d´elai et comparaison de distributions de prototypes . . . . . . . 88

4.8 Caract`ere significatif du clustering : enseignements . . . . . . . . . . . . . . 90

4.9 R´esum´e du chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

5 S´election du d´elai en haute dimension 93

5.1 Reconstruction de l’espace de phase : la th´eorie . . . . . . . . . . . . . . . . 93

5.1.1 D´efinitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

5.1.2 Th´eor`emes fondamentaux . . . . . . . . . . . . . . . . . . . . . . . . 94

5.1.3 M´ethodes d’estimation de la dimension intrins`eque . . . . . . . . . . 95

5.2 S´election du d´elai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

5.2.1 S´election lin´eaire du d´elai par autocorr´elation . . . . . . . . . . . . . 98

5.2.2 S´election non lin´eaire du d´elai par information mutuelle . . . . . . . 99

5.2.3 Vers une g´en´eralisation de l’autocorr´elation et de l’information mutuelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

5.3 Autocorr´elation et information mutuelle `a deux variables : les limites . . . . 102

5.4 D´elai par autocorr´elation d’ordre sup´erieur . . . . . . . . . . . . . . . . . . 105

5.5 D´elai par information mutuelle en haute dimension . . . . . . . . . . . . . . 107

5.6 D´elai par Distance `a la Diagonale . . . . . . . . . . . . . . . . . . . . . . . . 111

5.7 S´election multiple de d´elais . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

5.7.1 Comparaison en termes de d´elais s´electionn´es . . . . . . . . . . . . . 114

5.7.2 Comparaison en termes de pr´ediction . . . . . . . . . . . . . . . . . 120

5.7.3 Analyse des observations . . . . . . . . . . . . . . . . . . . . . . . . . 121

5.7.4 En pratique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

5.8 R´esum´e du chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

6 Conclusion et perspectives 127

A Séries temporelles utilis´ees 131

A.1 Série SunSpot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

A.2 Série Santa Fe A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

A.3 Série Polonaise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

A.4 Série CATS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

A.5 Série Lorenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

A.6 Série MarcheAl´eatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

A.7 Série Rossler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

A.8 Série AR3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

Liste des publications 137

R´ef´erences 140