# Introduction à NumPy

Inspiration prise de :
* https://github.com/SciTools/courses
* https://github.com/paris-saclay-cds/python-workshop/blob/master/Day_1_Scientific_Python/01-numpy-introduction.ipynb

In [4]:
%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

## 1. Créer un Tableau Numpy

Il est facile de créer un tableau Numpy avec la fonction `np.array`.

In [5]:
a = np.array([0,1,2,3])
a

array([0, 1, 2, 3])

Parfois, il est utile que notre tableau soit initialisé d'une manière particulière : seulement des zéros (`np.zeros`), seulement des uns (`np.ones`), à espacement égal (`np.linspace`) ou à espacement logarithmique (`np.logspace`), etc.

### Exercice

A vous de jouer !

* créez un tableau NumPy à partir d'une liste de nombres entiers. Utilisez le constructeur [`np.array()`](https://docs.scipy.org/doc/numpy-1.15.1/reference/generated/numpy.array.html) et passez une liste Python en arguement. Vous pouvez vous référer à l'exemple dans la documentation.

In [None]:
# x =COMPLETE ME

In [None]:
x.dtype

Consultez la documentation des [np.array](https://docs.scipy.org/doc/numpy-1.15.1/reference/generated/numpy.array.html)
Notez la présence d'un paramètre `dtype` (data type) 

Ce paramètre est utilisé pour forcer un certain type au sein d'un Numpy Array

In [None]:
arr = np.ones(4, dtype=np.int64)
arr.dtype

* Créez un tableau NumPy de dimension 3 rempli de zéros ou de uns. Vous pouvez consulter la documentation de [np.zeros](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.zeros.html) et [np.ones](https://docs.scipy.org/doc/numpy/reference/generated/numpy.ones.html).

In [None]:
x = None # COMPLETE ME

In [None]:
x

* Créez un tableau NumPy rempli d'une valeur constante -- qui n'est pas 0 ou 1. 
 
(Indication : ceci peut être réalisé en utilisant le dernier tableau que vous avez créé, ou vous pouvez utiliser [np.empty](https://docs.scipy.org/doc/numpy-1.15.1/reference/generated/numpy.empty.html) et trouver un moyen de remplir le tableau avec une valeur constante),

In [None]:
x = None # COMPLETE ME

* Créez un tableau NumPy de 8 éléments avec une plage de valeurs commençant à 0 et un espacement de 3 entre chaque élément
 
(Indication : documentez vous sur la fonction [np.arange](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.arange.html))

In [None]:
x = None # COMPLETE ME

## 2. Manipulation des tableaux Numpy

### 2.1 Indices

Notez que les tableaux Numpy sont indexés à partir de 0.

In [None]:
data = np.random.randn(10000, 5)
data.shape # shape est un attribut pour l'object tableau Numpy

In [None]:
data[0, 0]

Si l'on veut obtenir l'élément à la troisième colonne de la première ligne, les indices seront 0 et 2 (1-1 et 3-1)

In [None]:
data[0, 2]

Nous pouvons également attribuer une nouvelle valeur à un élément :

In [None]:
data[0, 2] = 100.
print(data[0, 2])

Numpy vérifie que l'indicage correspond aux limites du tableau (comme Python, en général)

In [None]:
print(data.shape)
data[60, 10] # Seulement 5 colonnes pas 11

Enfin, il est possible d'obtenir plusieurs éléments à la fois.

In [None]:
data[0, [0, 3]]

Comme les tableaux Python, l'indicage négatif fonctionne, et ce, de la même manière.

In [None]:
data[-1, -1]

### 2.2 Slicing (Tranches)

Le slicing fonctionne de la même manière que les tableaux Python.

In [None]:
data[0, 0:2]

Notez que le tableau renvoyé ne contient pas la troisième colonne (avec l'index 2).

Vous pouvez ignorer le premier ou le dernier index (ce qui signifie que vous pouvez prendre les valeurs du début ou de la fin) :

In [None]:
data[0, :2]

Si vous omettez les deux indices dans la tranche en ne laissant que les deux points ( :), vous obtiendrez toutes les colonnes de cette ligne :

In [None]:
data[0, :]

### 2.3 Filtrage conditionnel

In [None]:
data

Nous pouvons produire un tableau de booléens lorsque nous utilisons des opérateurs de comparaison.

In [None]:
data > 0

Ce masque est utile pour sélectionner des données qui répondent à une condition

In [None]:
data[data > 0]

Le masque peut être utilisé pour changer certaines données.

In [None]:
data[data > 0] = np.inf
data

### 2.4 Quiz

Petit Quiz !

In [None]:
data = np.random.randn(20, 20)

* Imprimez l'élément dans la première ligne et la dixième colonne du tableau 

In [None]:
# COMPLETEME

* Imprimez les éléments des 3ème et 15ème colonnes de la 3ème ligne.

In [None]:
# COMPLETEME

* Imprimez les éléments de la 3ème à la 15ème colonne (15ème incluse) de la 4ème ligne.

In [None]:
# COMPLETEME

* Même question avec tous les éléments positifs de la 15ème colonne.

In [None]:
# COMPLETEME

## 3. Calcul numérique

La vectorisation du code (une forme de parallélisation) est la clé pour effectuer des calculs numériques efficaces avec Python/Numpy.

Cela signifie qu'un programme doit être formulé autant que possible en termes d'opérations matricielles et vectorielles.

### 3.1 Opérations sur les tableaux scalaires

Nous pouvons utiliser les opérateurs arithmétiques usuels pour multiplier, ajouter, soustraire et diviser des tableaux avec des nombres scalaires.

In [None]:
v1 = np.arange(0, 5)
v1

In [None]:
v1 * 2

In [None]:
v1 + 2

In [None]:
np.sin([1, 2,3 ])  # np.log(A), np.arctan(A),...

### 3.2 Opérations tableau à tableau

Lorsque nous additionnons, soustrayons, multiplions et divisons des tableaux entre eux, le comportement par défaut est celui d'opérations **terme à terme** :

In [None]:
A = np.array([[1, 2], [3, 4]])

In [None]:
A * A  # element-wise multiplication

In [None]:
v1 * v1

Il ne faut pas confondre le produit terme à terme et le produit matriciel.

In [None]:
A @ A, np.matmul(A,A)

In [None]:
v1 @ v1, np.matmul(v1, v1)

In [None]:
np.dot(A,A), np.dot(v1,v1)

### 3.3 Calculs

Il est souvent utile de stocker des datasets dans des tableaux NumPy. 
NumPy fournit un certain nombre de fonctions pour calculer les statistiques des ensembles de données dans les tableaux.

In [None]:
a = np.random.random(40)

Différentes opérations fréquemment utilisées peuvent être effectuées :

In [None]:
print ('Mean value is', np.mean(a), a.mean())
print ('Median value is',  np.median(a),)
print ('Std is', np.std(a), a.std())
print ('Variance is', np.var(a), a.var())
print ('Min is', a.min())
print ('Element of minimum value is', a.argmin())
print ('Max is', a.max())
print ('Sum is', np.sum(a))
print ('Prod', np.prod(a))
print ('Cumsum is', np.cumsum(a)[-1])
print ('CumProd of 5 first elements is', np.cumprod(a)[4])
print ('Unique values in this array are:', np.unique(np.random.randint(1, 6, 10)))
print ('85% Percentile value is: ', np.percentile(a, 85))

In [None]:
a = np.random.random(40)
print(a.argsort())
a.sort() # Tri en place !
print(a.argsort())

#### Cas des données multidimensionneles

Lorsque des fonctions telles que `min`, `max`, etc., sont appliquées à un tableau multidimensionnel (matrice, tenseur etc....), il est parfois utile d'appliquer le calcul à l'ensemble du tableau, et parfois seulement sur une ligne ou une colonne. En utilisant l'argument `axis`, nous pouvons spécifier comment ces fonctions doivent se comporter :

In [None]:
m = np.random.rand(3, 3) # Matrice 3x3
m

In [None]:
# global max
m.max()

In [None]:
# maximum selon les colonnes
m.max(axis=0)

In [None]:
#  maximum selon les lignes
m.max(axis=1)

De nombreuses autres fonctions et méthodes des classes `array` et `matrix` acceptent le même argument (facultatif) du mot-clé `axis`.

## 4. Redimensionnement et fusion

* Comment peut-on changer la forme d'un tableau de 8 éléments que vous avez créé précédemment pour qu'il ait la forme (2, 2, 2) ? 
 
Indication : vous pouvez le faire sans créer un nouveau tableau.

In [None]:
arr = np.arange(8)

In [None]:
# COMPLETEME

* Peut-on remodeler le même tableau de 8 éléments en un vecteur colonne ? 
Même question, pour obtenir un vecteur ligne. Vous pouvez utiliser `np.reshape` ou `np.newaxis`.

In [None]:
# COMPLETEME

* Empilez verticalement deux tableaux NumPy 1D de taille 10. Puis, empilez-les horizontalement. Vous pouvez utiliser les fonctions [np.hstack](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.hstack.html) et [np.vstack](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.vstack.html).

Répétez ces deux opérations en utilisant la fonction [np.concatenate](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.concatenate.html) avec deux tableaux NumPy 2D de taille 5 x 2.

In [None]:
# COMPLETEME

In [None]:
# COMPLETEME