6.1.2. The Fallacy of Selection from a Large Database (L'illusion de la sélection depuis une grande base de données)

Une autre approche qui peut donner une apparence trompeuse d'imprévisibilité est de sélectionner aléatoirement une quantité d'une base de données et de supposer que sa force est liée au nombre total de bits dans la base de données. Par exemple, les serveurs USENET typiques traitent de nombreux mégaoctets d'information par jour [USENET_1, USENET_2]. Supposons qu'une quantité aléatoire ait été sélectionnée en récupérant 32 octets de données à partir d'un point de départ aléatoire dans ces données. Cela ne produit pas 328 = 256 bits de non-devinabilité. Même si une grande partie des données est du langage humain qui ne contient pas plus de 2 ou 3 bits d'information par octet, cela ne produit pas 322 = 64 bits de non-devinabilité. Pour un adversaire ayant accès à la même base de données Usenet, la non-devinabilité repose uniquement sur le point de départ de la sélection. C'est peut-être un peu plus qu'une paire de douzaines de bits de non-devinabilité.

Le même argument s'applique à la sélection de séquences à partir des données sur un enregistrement CD/DVD accessible publiquement ou toute autre grande base de données publique. Si l'adversaire a accès à la même base de données, cette étape de "sélection à partir d'un grand volume de données" n'apporte que peu. Cependant, si une sélection peut être faite à partir de données auxquelles l'adversaire n'a pas accès, telles que les tampons système sur un système multi-utilisateurs actif, cela peut être utile.

6.1.2. The Fallacy of Selection from a Large Database (L'illusion de la sélection depuis une grande base de données)​

6.1.2. The Fallacy of Selection from a Large Database (L'illusion de la sélection depuis une grande base de données)