Ist das Vermögen stark gewachsen, obwohl das Einkommen stagniert? Für die Steuerbehörden ist das ein Hinweis, dass das Einkommen in der Steuererklärung möglicherweise nicht oder nur teilweise deklariert wurde. Verdacht schöpfen sie auch, wenn Vergleiche zwischen Lohnangaben von Arbeitgebern und Angestellten, Mietzinseinahmen von Vermietern und Mietzinszahlungen von Unternehmen, Darlehensdeklarationen von Gläubigern und Schuldnern Unstimmigkeiten ergeben.
Solche Vergleiche sind allerdings aufwendig. Und oft fehlen den Steuerämtern die nötigen Informationen, weil der Datenaustausch zwischen den Kantonen und mit dem Ausland harzt. Vor allem aber: Wo sollen die Steuerbeamten zu suchen beginnen? Bei rund 5 Millionen Steuererklärungen von Privathaushalten und 300 000 von Unternehmen ist eine genaue Prüfung jedes Dokuments unmöglich.
Erfahrung hilft, Verdachtsfälle aufzuspüren. Aber auch spezialisierte Software. Basierend auf mathematischen Modellen, leuchtet bei vielen Steuerverwaltungen ein rotes Warnsignal auf, wenn eine Steuererklärung Widersprüche aufweist oder von der statistischen Wahrscheinlichkeit allzu stark abweicht. Und das ist wörtlich zu verstehen: Im Normalfall steht die Software-Ampel auf Grün, im Zweifelsfall wechselt sie auf Orange. Wirklich kritische Fälle blinken rot auf und werden als erste überprüft.
Beispiel: Entgegen der landläufigen Meinung finden sich die Zahlen 1 bis 9 in grossen Datensätzen nicht ungefähr gleich verteilt. Im Gegenteil: Jede Ziffer tritt mit ihrer eigenen Wahrscheinlichkeit auf (siehe Kasten im PDF). Dabei ist es egal, ob es sich um wissenschaftliche Messungen, Wirtschaftsdaten oder Zahlen in einer Steuererklärung handelt. Herausgefunden hat dies der kanadische Astronom Simon Newcomb (1835–1909) bereits 1881. Der US-Physiker Frank Benford griff diese Erkenntnis 1938 wieder auf. Nach ihm ist denn auch das Benfordsche Gesetz benannt, das der Steuersoftware zugrunde liegt. Die darauf basierende Software hat der US-Statistiker Mark Nigrini entworfen. Sie ist heute in vielen Ländern weltweit im Einsatz – auch in der Schweiz.
Was paradox wirkt, lässt sich plausibel erklären: Bei den Zahlen 0 bis 9 tritt jede Ziffer genau einmal auf. Zwischen 10 und 19 steht überall die Ziffer 1 am Anfang. Erst ab 99 ist das Verhältnis wieder ausgeglichen. Die Zahlen 100 bis 199 beginnen aber jedes Mal wieder mit einer 1. Statistisch tritt die 1 am Anfang also viel häufiger auf als jede andere Zahl.
Allerdings gilt das nur für echte, unverfälschte Daten. Manipulierte Daten – etwa in einer Steuererklärung – weichen davon ab. Wird beispielsweise aus einem Beleg über 110 Franken ein Beleg über 770 Franken oder aus einer Zahlung über 120 Franken eine Zahlung über 9120 Franken, so kann allein diese vermeintlich geringe Manipulation die Warnlampen der Steuersoftware aufleuchten lassen. «Es ist ausserordentlich schwierig, Daten so zu verfälschen, dass sie weiterhin Benford-artig bleiben», sagt Wissenschaftsautor Florian Freistetter. Besser also, man versucht es gar nicht.