[Fr] Google PageRank et Chaîne de Markov

Avec 1 milliard de sites sur internet, c’est impossible à analyser leurs contenus. Pourtant, l’internet n’est pas une collection de textes indépen- dants mais un immense hypertexte : les pages se citent mutuellement. En considérant le web comme un graphe et en tenant compte les liens entre les pages, on peut faire des choses intéressantes. Les premières personnes qui ont abordé ce point de vue étaient Larry Page et Sergey Brin, fondateurs de Google, avec leur algorithme PageRank.

Depuis sa conception en 1998, Google domine le marché des moteurs de recherche sur internet. 17 ans plus tard, leurs techniques ont déja beaucoup évolué, les résultats de recherche deviennent de plus en plus pertinents, mais l’idée principale est toujours basée sur l’algorithme de classer PageRank. Dans cet article, on va examiner de plus près cet algorithme et le lien avec la chaîne de Markov.

Lire l’article ici: Google PageRank et Chaîne de Markov

[Fr] Programmation Linéaire et Machine Learning

La Recherche Opérationnelle est une domaine qui m’intéresse beaucoup et qui est très proche de celle de la Machine Learning et l’Optimisation. L’idée principale est de trouver le maximum/minimum d’une fonction objectif en prenant compte des contraintes.

Un des algorithmes le plus basique et les plus utilisé en Recherche Opérationnelle est la méthode de Simplexe. Pour plus de détails de ce qui concerne cette méthode, vous pouvez trouver facilement des articles sur Google. Pour ceux qui veulent creuser et comprendre cette belle domaine , je vous encourage à commencer avec ce livre: Operations Research: Applications and Algorithms.

Dans mon article ci-dessous, je discute un cas spécifique qui montre le lien entre la Recherche Opérationnelle et le Machine Learning: la diagnostique du cancer du sein.

Le cancer du sein est une tumeur maligne de la glande mammaire. Son premier indice est une grosseur au sein. Pourtant, la majorité des grosseurs sont bénignes, alors il faut avoir des techniques pour faire la distinction entre les bénignes et les malignes.

Une des techniques les plus utilisées est la biopsie d’aspiration à l’aiguille fine (BAAF). Dans le temps, cette technique avait une degré de variablité assez élevée (de 68% à 98%).

Pour améliorer les résultats de BAAF, les chercheurs ont proposé une méthode utilisant le Machine Learning et la Programmation Linéaire pour classifier automatiquement un nouveau sujet dans un des deux classes (bénignes ou malignes). Chaque sujet qui est déja diagnotiqué (malin ou pas) est représenté sous forme un vecteur de différents “features”. En basant sur ces sujets (ou on les appelle encore “training set” en machine learning), on peut trouver un hyperplan qui va permettre à distinguer entre les deux classes.

Voilà, enjoy : )

Application de la Programmation Linéaire pour la Classification des motifs en Machine Learning