Piotroski F-Score : 9 critères pour distinguer les bonnes actions des mauvaises (backtest)

Cette publication est la partie 3 de 3 dans la série La guerre des ratios.

Troisième épisode de La guerre des ratios. Les deux premiers opposaient des ratios de valorisation : le FCF Yield, dont la supériorité tenait à un détail décisif (le rapporter à la valeur d'entreprise plutôt qu'à la seule capitalisation), puis la Magic Formula de Greenblatt, premier composite de la série, qui mariait cherté et qualité pour finalement décevoir dans sa version pure. Cette fois, changement complet de nature. Le Piotroski F-Score n'est pas un ratio de valorisation : c'est un score de qualité. Neuf critères, une note de 0 à 9, et une logique qui s'intéresse autant à la trajectoire d'une entreprise qu'à son état présent.

Stéthoscope posé sur un bilan comptable illustrant le diagnostic de santé financière du Piotroski F-Score, backtest sur les marchés européens 2004-2026.

La question est différente de celle des deux épisodes précédents. On ne demande plus « à quel prix achète-t-on ? » mais « l'entreprise est-elle financièrement solide, et le devient-elle davantage ? ». Un score de pure qualité, sans la moindre notion de valorisation, peut-il à lui seul battre le marché européen ? Et que devient-il quand on lui adjoint, enfin, un garde-fou sur le prix ? Vingt-deux ans de données vont répondre, et la réponse réserve une leçon que je n'attendais pas tout à fait sous cette forme.

Le Piotroski F-Score expliqué

D'où il vient

En 2000, Joseph Piotroski, alors professeur de comptabilité à l'université de Chicago, publie une étude au titre limpide : Value Investing: The Use of Historical Financial Statement Information to Separate Winners from Losers. Le programme est dans le sous-titre : séparer les gagnants des perdants à partir des seuls états financiers historiques.

Le contexte mérite qu'on s'y arrête, car il éclaire tout le positionnement de la série. Piotroski ne cherchait pas à construire une stratégie de A à Z. Il partait d'un constat connu : les titres à faible ratio cours/valeur comptable (le value au sens le plus classique) surperforment en moyenne, mais ce sont aussi, par construction, des entreprises en difficulté, et beaucoup d'entre elles le méritent. Au sein de ce panier value, une minorité de sociétés solides porte l'essentiel de la performance, tandis qu'une majorité de canards boiteux la plombe. Son idée : un filtre comptable simple pour distinguer, parmi les titres bon marché, ceux dont les fondamentaux s'améliorent de ceux qui s'enfoncent.

Autrement dit, le F-Score est dès l'origine pensé comme un améliorateur de stratégie value. C'est exactement le fil rouge de cette série, et nous y reviendrons. Mais commençons par le tester pour ce qu'il est aussi : un signal de qualité autonome.

Les 9 critères

Le F-Score additionne neuf tests binaires : chaque critère rempli vaut 1 point, chaque critère manqué vaut 0. Le score final va donc de 0 (santé financière déplorable, et qui se dégrade) à 9 (entreprise solide, et qui s'améliore sur tous les fronts). Les neuf critères se répartissent en trois familles.

#	Famille	Critère	Point accordé si…
1	Rentabilité	ROA positif	le résultat net est positif
2	Rentabilité	Cash-flow opérationnel positif	le CFO est positif
3	Rentabilité	ROA en progression	le ROA dépasse celui de l'an passé
4	Rentabilité	Qualité des résultats	le CFO excède le résultat net (peu d'accruals)
5	Structure financière	Désendettement	le ratio de dette long terme baisse
6	Structure financière	Liquidité	le current ratio s'améliore
7	Structure financière	Pas de dilution	aucune émission nette d'actions nouvelles
8	Efficacité	Marge brute en hausse	la marge brute progresse
9	Efficacité	Rotation des actifs en hausse	l'actif tourne plus vite

L'originalité saute aux yeux quand on compare ce score à la qualité « à la Greenblatt » de l'épisode précédent. Le ROIC de la Magic Formula mesure un niveau : l'entreprise est-elle rentable, ici et maintenant ? Cinq des neuf critères de Piotroski mesurent au contraire une évolution : le ROA monte-t-il, la marge s'élargit-elle, le levier recule-t-il, la dilution est-elle évitée ? C'est une autre philosophie de la qualité : non la persistance d'un niveau élevé, mais l'amélioration d'une trajectoire. Là où l'article précédent corrigeait la Magic Formula par un ROIC moyen sur cinq ans (la qualité comme durée), Piotroski capte la qualité comme direction.

Lire le score

La convention de lecture est simple : un score de 0 à 2 signale une entreprise fragile, 3 à 6 une zone neutre, 7 à 9 une santé financière solide et orientée à la hausse. C'est la frontière 7-9 que l'on retient classiquement pour sélectionner, et 0-2 pour éviter. Tout l'enjeu du backtest est de vérifier que cette intuition se traduit en rendement.

Méthodologie du backtest

Univers et période

Le backtest couvre la période du 1ᵉʳ janvier 2004 au 20 juin 2026, soit 22 ans incluant la crise de 2008-2009 et plusieurs corrections majeures. Benchmark : le MSCI Europe. Devise de référence : l'euro, cohérente avec un univers européen. Je reprends l'univers des épisodes précédents (titres cotés sur marché principal, hors penny stocks, liquidité quotidienne minimale, situations particulières nettoyées), aligné géographiquement sur la composition du MSCI Europe.

Un point de méthode mérite toutefois d'être posé franchement, car il distingue cet article du précédent. Le F-Score « académique » s'applique aux sociétés non financières : plusieurs de ses critères (current ratio, marge brute, rotation des actifs) n'ont guère de sens pour une banque ou un assureur, dont la structure de bilan est d'une autre nature. Greenblatt, pour les mêmes raisons, excluait financières et utilities de la Magic Formula. Par cohérence, j'aurais donc pu les écarter ici aussi.

Je ne l'ai pas fait, et c'est un petit enseignement en soi. J'ai testé les deux versions : inclure les financières et les utilities ne dégrade pas le résultat, il l'améliore très légèrement. Le score reste discriminant même là où la théorie le disait inapplicable, sans doute parce que les quatre critères de rentabilité et de financement, eux, gardent tout leur sens pour ces secteurs. J'ai donc conservé l'univers complet. La contrepartie : l'univers de cet épisode diffère marginalement de celui de la Magic Formula (qui, lui, excluait ces secteurs). Comme déjà signalé pour l'écart entre FCF Yield et Magic Formula, cela impose une légère prudence dans la comparaison directe des chiffres d'un article à l'autre, un écart que l'épisode final de la série réglera en re-roulant toutes les stratégies sur une base strictement identique.

Le calcul du score

Pour le classement, j'utilise l'implémentation standard du F-Score de Portfolio123 (documentation du facteur PiotFScore), qui reproduit fidèlement les neuf critères de Piotroski. À noter : Portfolio123 propose aussi un modèle de ranking « All-Stars Piotroski » qui ajoute au score un facteur de valorisation (le price-to-book). Je ne l'ai pas retenu : d'une part parce qu'il dénature le score original en y injectant du value, d'autre part parce que, testé sur cet univers, il donne de moins bons résultats : le P/B traverse une décennie difficile, nous y reviendrons. Ici, le F-Score est donc pris pour ce qu'il est : un score de qualité pure, sans aucune dimension de prix.

Paramètres de simulation

Pour que la seule variable d'un épisode à l'autre soit le critère testé, je reprends à l'identique les paramètres de simulation des articles précédents.

Paramètre	Valeur retenue
Nombre de titres	25
Rebalancement	Annuel (52 semaines)
Commissions	0.15 % du montant
Slippage	Variable selon liquidité
Prix de transaction	(High + Low + 2×Close) / 4
Pondération	Équipondérée
Ranking	Sur l'ensemble de l'univers
Benchmark	MSCI Europe (EUR)

Une particularité tient à la nature du F-Score. Étant un score discret de 0 à 9, comportant de nombreux ex æquo, il se prête mal à un découpage par valeur exacte (effectifs très inégaux, traitement instable des valeurs manquantes). On le teste donc à la manière classique d'un facteur : on classe l'univers par score, puis on le partage en cinq quintiles, du moins au mieux noté. Le découpage n'est pas parfaitement étanche, des sociétés à score identique pouvant tomber de part et d'autre d'une frontière, mais chaque quintile reste dominé par une plage de scores cohérente, et c'est tout ce qui importe ici. Cela tombe à pic pour visualiser la question centrale : les titres les mieux notés rapportent-ils vraiment davantage que les moins bien notés ? Le rebalancement annuel, enfin, est cohérent avec le rythme de publication des comptes sur lesquels reposent les neuf critères.

Le signal du score

Avant de construire un portefeuille investissable, une question préalable : le F-Score discrimine-t-il réellement le rendement futur, sur tout le spectre du score et pas seulement à ses extrêmes ? On classe l'univers en cinq quintiles selon le score, du moins au mieux noté, et on regarde le rendement annualisé de chacun sur les 22 ans.

Histogramme du rendement annualisé par quintile de F-Score, croissant du quintile 1 (1,42 %) au quintile 5 (8,76 %), au-dessus de l'univers (6,02 %)

Le résultat est aussi net qu'on pouvait l'espérer. Le quintile des mieux notés rapporte 8.76 % par an, contre 1.42 % pour les moins bien notés, près de sept points d'écart annualisés sur deux décennies. Et ce n'est pas un simple effet d'extrêmes : la progression est strictement croissante d'un quintile à l'autre, sans le moindre accroc (corrélation de rang de Spearman égale à 1). Le quintile supérieur bat nettement l'univers (6.02 %), tandis que le quintile inférieur s'en éloigne très largement par le bas. Chaque quintile repose sur un effectif solide, de l'ordre de 300 à 600 titres, ce qui écarte tout artefact de petit échantillon.

Une précision importante avant d'aller plus loin : ces quintiles sont larges et équipondérés (plusieurs centaines de titres chacun). Ils mesurent le signal du facteur, pas une stratégie que l'on tiendrait en portefeuille. Pour cela, il faut concentrer.

La stratégie investissable : le top 25

Resserrons donc sur les 25 meilleurs scores de l'univers, équipondérés, rebalancés une fois l'an. Voici ce que donnent 22 ans de marchés européens.

Métrique	Piotroski (top 25)	Benchmark Europe
CAGR annualisé	12.73 %	7.52 %
Rendement total	1 377.06 %	410.55 %
Ratio de Sharpe	0.71	0.49
Ratio de Sortino	0.94	0.64
Max Drawdown	-62.06 %	-58.42 %
Écart-type annualisé	17.06 %	14.04 %
Bêta	1.03	n/a
Alpha annualisé	5.19 %	n/a

Le verdict, cette fois, est sans ambiguïté : le Piotroski F-Score bat le marché en stratégie autonome. 12.73 % de rendement annualisé contre 7.52 %, un Sharpe de 0.71 contre 0.49, un alpha annualisé de plus de cinq points. Un euro investi dans la stratégie en 2004 en vaut près de 15 aujourd'hui; le même euro placé dans l'indice en vaut un peu plus de 5.

Le contraste avec l'épisode précédent est saisissant. La Magic Formula pure (un composite value+qualité, pourtant plus sophistiqué sur le papier) échouait à battre le marché (6.18 % de CAGR, Sharpe de 0.35, alpha négatif). Le F-Score, pur score de qualité sans la moindre notion de prix, fait deux fois mieux. La qualité mesurée comme trajectoire se suffit donc bien davantage à elle-même que la qualité mesurée comme niveau. Toute prudence gardée (un univers, une période, 25 titres, c'est un échantillon), c'est un résultat fort, et il confirme ce que l'on peut lire dans Les Déterminants de la Richesse : le F-Score n'est pas qu'un améliorateur, il tient aussi la route seul.

Deux nuances, par honnêteté. D'abord, le résultat n'est pas un artefact de concentration : porté à 45 titres, la stratégie rend encore 12.95 % par an pour un Sharpe de 0.76 : la performance ne tient pas à une poignée de lignes chanceuses. Ensuite, et c'est le revers transversal à toute la série, les trois dernières années sont décevantes : sur cette fenêtre, la stratégie sous-performe l'indice (alpha glissant de -1.27, Sharpe de 0.67 contre 0.99 pour le benchmark). Le value et la qualité bon marché traversent une période difficile, et le F-Score n'y échappe pas.

L'explication la plus probable tient au régime de marché : ces années ont récompensé la croissance chère, dont l'envolée des géants de l'IA est l'expression la plus spectaculaire, et dans ce contexte tout ce qui penche vers le bon marché reste à la traîne, en Europe comme aux États-Unis. C'est précisément la configuration que j'examine dans ce que 2000-2003 m'a appris à voir : une prime à la croissance étirée jusqu'à des valorisations extrêmes, qui par le passé a fini par se retourner en faveur du value. Rien ne garantit que l'histoire se répète, mais qui détient aujourd'hui de la qualité bon marché a l'optionalité de son côté.

Les limites

Avant d'en venir à ce qui me paraît le point le plus instructif de cet article, trois limites à garder en tête.

Le F-Score exige des historiques complets. Cinq de ses neuf critères comparent un exercice au précédent. Une société récemment introduite en Bourse, ou aux comptes incomplets, est inéligible ou mal notée par construction. Le score est un outil pour entreprises matures.

Ce n'est pas un détecteur de valorisation. Et c'est sa faiblesse cardinale : un titre peut afficher un F-Score de 9 et se payer une fortune. Le score dit que l'entreprise est solide et s'améliore; il ne dit rien du prix qu'on la paie. D'où la nécessité, qu'on va voir à l'œuvre, de le combiner à un ratio de valorisation.

L'avantage small caps ne s'est pas matérialisé ici. La littérature (et mon propre livre, sur d'autres univers et d'autres périodes) prête au F-Score une efficacité renforcée sur les petites capitalisations, de l'ordre de plusieurs points supplémentaires. Sur cet univers européen et cette période précise, mon test restreint aux small et micro caps donne un résultat quasi identique à l'univers complet, sans surcroît significatif de rendement, de Sharpe ni d'alpha. Je le signale par souci d'exactitude : l'avantage existe peut-être ailleurs, il ne ressort pas ici.

La qualité a un prix

Reprenons le tableau de performance, et arrêtons-nous sur la ligne qui dérange : un Max Drawdown de -62.06 %, pire que celui du marché (-58.42 %), et pire encore que la Magic Formula pure (-57.24 %). Voilà qui heurte l'intuition. On attend d'un « score de qualité » qu'il protège à la baisse; il fait le contraire. En 2008, la stratégie a perdu 46 % sur l'année. Un portefeuille de sociétés financièrement solides aurait dû mieux résister. Pourquoi creuse-t-il davantage ?

L'hypothèse est la suivante, et elle se vérifie remarquablement bien : parmi les meilleurs F-Score se cachent des titres de qualité chèrement payés. Le score ne regarde pas le prix; rien n'empêche donc qu'une part du top 25 soit constituée d'entreprises excellentes mais survalorisées. Or ce sont précisément celles qui souffrent le plus lors d'une correction, quand le marché disqualifie brutalement les multiples élevés. La qualité sans garde-fou de prix achète, sans le vouloir, de la vulnérabilité.

Pour le vérifier, j'ajoute au F-Score un simple filtre de valorisation, les 20 % de titres les moins chers de leur secteur sur le ratio cours/ventes (P/S), avant de retenir les 25 meilleurs scores. Le résultat est éloquent.

Métrique	Piotroski seul	P/S + Piotroski	Benchmark
CAGR annualisé	12.73 %	16.32 %	7.52 %
Ratio de Sharpe	0.71	0.87	0.49
Ratio de Sortino	0.94	1.16	0.64
Max Drawdown	-62.06 %	-58.07 %	-58.42 %
Alpha annualisé	5.19 %	8.56 %	n/a

Le filtre value fait tout à la fois : il pousse le rendement (de 12.73 % à 16.32 %), il améliore le Sharpe, et surtout il ramène le drawdown au niveau du marché. Le détail mécanique est subtil mais parlant : la version filtrée est en réalité un peu plus volatile au quotidien (17.72 % d'écart-type contre 17.06 %), ce qui est normal puisque les titres bon marché sont plus nerveux, mais elle creuse moins en pire scénario. La volatilité mesure l'agitation ordinaire; le max drawdown mesure la profondeur d'un krach. Le filtre value ne calme pas l'agitation, il atténue les pertes extrêmes.

Le face-à-face sur les années qui comptent rend le mécanisme visible :

Année	Piotroski seul	P/S + Piotroski	Benchmark
2008	-46.40 %	-43.32 %	-42.71 %
2011	-20.19 %	-19.24 %	-7.96 %
2020	+23.73 %	+2.59 %	-3.22 %
2022	-19.14 %	-17.39 %	-9.15 %

On y lit deux choses, et la seconde est aussi importante que la première. En 2008, l'année de tous les dangers, le filtre value amortit la chute de trois points et, sur l'ensemble du chemin 2008-2009, ramène le drawdown maximal de -62 % à -58 %, soit le niveau de l'indice. La marge de sécurité plafonne la casse : on retrouve ici, par l'expérience, l'intuition de Benjamin Graham. Piotroski mesure la solidité, le bon business; Graham exige qu'on ne le paie pas trop cher, la marge de sécurité.

Mais 2020 rappelle qu'il n'y a pas de repas gratuit. Cette année-là, le filtre value a coûté vingt et un points (+2.59 % contre +23.73 % pour le Piotroski nu) : la reprise post-Covid fut menée par la qualité chère, justement celle que le filtre élimine. Le message honnête n'est donc pas « le value protège », mais : le filtre value atténue les pertes extrêmes dans les krachs, au prix d'un manque à gagner dans les rebonds tirés par la croissance. Et il ne faut pas s'y tromper : même filtrée, la stratégie reste nettement plus baissière que l'indice en 2011 et 2022 (-19 % contre -8 %). Le mariage value+qualité améliore le profil de risque; il n'en fait pas une stratégie défensive.

Conclusion

Le Piotroski F-Score sort grandi de l'épreuve européenne. En signal pur, il discrimine proprement le rendement sur tout le spectre du score. En stratégie autonome, il bat le marché sur 22 ans là où la Magic Formula pure échouait : la qualité mesurée comme trajectoire est, seule, plus robuste qu'on ne le croit. Et couplé à un simple ratio de valorisation, il gagne encore en rendement et en maîtrise du risque. C'est, à ce stade de la série, la brique la plus convaincante.

Mais cet épisode a surtout produit, de l'intérieur, le problème que les prochains vont résoudre. Nous avons désormais les deux ingrédients : le meilleur ratio de valorisation (le FCF Yield) et la meilleure mesure de qualité (le Piotroski). Reste à les marier intelligemment, et nous venons d'en avoir un avant-goût frappant. Car le choix du ratio value n'est pas neutre : le price-to-book déçoit depuis des années, quand un simple P/S transfigure la stratégie. Faut-il alors parier sur un ratio de valorisation, en espérant choisir le bon, ou les combiner tous, pour ne plus avoir à choisir ?

C'est précisément l'idée du Value Composite d'O'Shaughnessy, et l'objet du prochain épisode.

Pour aller plus loin sur la construction de portefeuilles factoriels et les déterminants empiriques de la performance, voir Les Déterminants de la Richesse.

En savoir plus sur dividendes

Subscribe to get the latest posts sent to your email.