lunes, 7 de abril de 2008

Letras y palabras más frecuentes

Siempre he pensado que la letra a era la que más utilizábamos en español, pero no es así. Divagando por la red he encontrado en El Paraíso de las Matemáticas la relación de las letras y palabras más habituales.

Las letras de alta frecuencia, es decir, aquéllas que se utilizan más de un 5% en cualquier texto, son la e (16,78%), la a (11,96%), la o (8,69%), la l (8,37%), la s (7,88%), la n (7,01%) y la d (6,87%). Estas siete letras superan el 68% del total.

Las letras de media frencuencia, entre el 5 y el 0,5%, son la r (4,94%), la u (4,80%), la i (4,15%, la t (3,31%), la c (2,92%), la p (2,76%) y la m (2,12%). El resto de letras no llega al 0,5%.

En cuanto a las palabras, las más usadas de dos letras son de (7,78%), la (4,60%) y el (3,39%). Las de tres letras son que (2,89%), los (1,96%) y del (1,56%). Por último, las palabras de cuatro letras más comunes son para (0,67%) y como (0,36%).

¿Para qué se han conseguido estos datos y de dónde han salido? Se utilizan en criptoanálisis y figuran en el libro Código y claves secretas: programas Basic, Anaya Multimedia 1986.

2 comentarios:

José Ángel dijo...

Criptoanálisis = espionaje ??? jejeje

Castedo Merinero dijo...

Mensajes secretos de espionaje...