IA Search : Google analyse un nombre de mots limité par requête

Publié le 09/01/2026 • Par Coline

Un “grounding budget” utilisé par Google pour générer les réponses IA

L’ancrage, ou le “grounding” est un processus utilisé par Google pour lier les résultats des modèles IA (Gemini, mode AI…) à des sources vérifiables et réelles afin d’améliorer la fiabilité des réponses proposées.

Cependant, comme l’ont souligné les récentes études de Dan Petrovic, Google ne semble pas s’appuyer sur l’intégralité des pages sources pour alimenter ses systèmes d’IA. En effet, dans le but d'optimiser la rapidité des réponses et d’éviter la surcharge d’informations, la taille des contenus extraits des sources au moment d’une requête serait, en réalité, limitée.

Après avoir analysé plus de 7000 requêtes comptant au moins 3 sources ainsi que les extraits exacts récupérés par le modèle de langage, Petrovic note l’existence d’un “budget de grounding”, soit un plafond d’environ 2000 mots que l’algorithme est capable d’extraire lors d’une requête.

Le classement dans la SERP influence la quantité de texte utilisée par l’IA Search

Le budget moyen de 2000 mots par requête est réparti entre les différentes sources utilisées par l’IA Search. Toutefois, d’après l’étude, cette répartition n’est pas équitable.

La position dans la SERP semble largement influencer le nombre de mots alloué à une page web : celles classées en première position récupèrent ainsi 28% du budget (médiane de 531 mots), contre 20% (378 mots) pour la troisième position et 13% (266 mots) pour la cinquième.

Dans ce contexte, il est clair que la stratégie de référencement classique reste un levier essentiel pour gagner en visibilité dans les résultats de recherche générés par l’IA de Google.

Grounding Budget : les contenus denses surpassent les contenus longs

L’étude de Dan Petrovic relève également un autre point intéressant : les contenus longs ne paraissent pas être avantagés par les modèles IA. Au contraire, plus la taille de la page est importante, plus la proportion de la page utilisée diminue :

- Moins de 1000 mots : moyenne de 370 mots relevés (61% de la page)
- 1000 - 2000 mots : moyenne de 492 mots relevés (35% de la page)
- 2000 - 3000 mots : moyenne de 532 mots relevés (22 % de la page)
- Plus de 3000 mots : moyenne de 544 mots relevés (13% de la page)

Produire des contenus denses et courts semble donc être une approche plus efficace que des pages longues et exhaustives dont seule une fraction du texte est potentiellement sélectionnée.

Comment adapter sa stratégie de contenu à la recherche par IA de Google ?

Comme le note Dan Petrovic en réponse à sa récente étude, il n’est pas possible pour lui de partager le jeu de données utilisé : bien que cohérents et sérieux, ses résultats ne sont donc, pour le moment, pas vérifiables.

Ces nouvelles observations sont toutefois d'une importance non négligeable dans un contexte où la manière dont les systèmes IA sélectionnent les contenus ne cesse d’évoluer.

Ainsi, concernant l’IA Search de Google, Petrovic et d’autres experts SEO en concluent que la densité prime sur la longueur des contenus. Les recommandations sont explicitement énoncées : proposer des pages ciblées et claires permettant à l’IA d’identifier rapidement les informations essentielles, maintenir un bon positionnement dans la SERP et favoriser la concision et la pertinence des textes à la longueur.

Dans le contexte actuel, adapter sa stratégie SEO à la recherche par IA devient un enjeu majeur. Notre agence SEO à Lyon vous aide à anticiper ces évolutions et à optimiser durablement la visibilité de votre site !