Ich habe einige faszinierende Statistiken darüber gesehen, welches HTML-Markup im Web tatsächlich verwendet wird.
Es gibt Web Authoring Statistics von Google im Jahr 2005 und MAMA von Opera im Jahr 2008.
Gab es in jüngerer Zeit ähnliche Studien?
Ich habe einige faszinierende Statistiken darüber gesehen, welches HTML-Markup im Web tatsächlich verwendet wird.
Es gibt Web Authoring Statistics von Google im Jahr 2005 und MAMA von Opera im Jahr 2008.
Gab es in jüngerer Zeit ähnliche Studien?
<header>
,<footer>
und<nav>
wurden auf der Grundlage der beliebtesten Klassennamen gewählt gefunden, dass Google - Studie. Mir ist jedoch nichts Neues als die Studie von Opera aus dem Jahr 2008 bekannt.Antworten:
Dies stammt aus dem Januar 2011, ist aber nicht so weit verbreitet: http://try.powermapper.com/demo/statsversions.aspx
quelle
Ich musste kürzlich einige HTML-Elementstatistiken erstellen. Ich habe ein Webkorpus mit 600.000 Seiten aus dem Jahr 2009 heruntergeladen und die folgenden Statistiken für die Anzahl der Verwendungen der Tags in diesem Korpus erhalten, die auf 1000 begrenzt sind.
Hier sind ausgewählte Tags aus HTML5 und anderen, die weniger häufig sind.
Methodik
Ich habe nichts Besonderes ausprobiert. Ich habe gerade den ganzen Korpus (2,4 GB gezippt) genommen und ihn durch Perl laufen lassen
wo das Perl-Skript tut
Ich habe dann die Ausgabe mit einem Python-Skript zusammengefasst.
Vorsichtsmaßnahmen
Dieses Skript verwendet eine sehr einfache Heuristik, um nach Tags zu suchen, wird jedoch in einigen Kontexten durch ein '<' gefolgt von einem Wort verwirrt:
<script>if (x<notatag) ...
<!-- <notatag> -->
,<title>
,<textarea>
,<noscript>
oder ähnliche Elemente.quelle