Taxpayer-Panel
Seit seiner ersten Bereitstellung im Jahr 2007 bietet das Taxpayer-Panel (TPP) Forschenden die Möglichkeit, die Daten der Lohn- und Einkommensteuerstatistik (LESt) im Längsschnitt zu analysieren. Hierzu werden Beobachtungen derselben Steuerpflichtigen aus den Querschnittsdaten über die Zeit verknüpft. Von 2001 bis 2011 wurden die Daten der jährlichen Einkommensteuerstatistik (Geschäftsstatistik) und ab 2012 die Daten der jährlichen Lohn- und Einkommensteuerstatistik (Bundesstatistik) genutzt. Diese Querschnittsdaten enthalten die Angaben aus den Einkommensteuererklärungen der ca. 29 Millionen veranlagten deutschen Steuerpflichtigen und wurden über die Steuernummern sowie indirekte Identifikatoren zu einem Panel verknüpft.
Seit dem Veranlagungsjahr 2012 entfällt die Geschäftsstatistik. Die bis dahin dreijährliche Bundesstatistik zur Lohn- und Einkommensteuer wird seitdem jährlich erhoben. Das TPP wurde deshalb ab dem Veranlagungsjahr 2012 mit den Daten der Bundesstatistik fortgeführt. Die Bundesstatistik umfasst neben den veranlagten Steuerpflichtigen auch ca. 13 Millionen nicht veranlagte Steuerpflichtige, die sogenannten Lohnsteuerfälle.
Das TPP 2001-2020 weist insgesamt ca. 66 Millionen Beobachtungen (im wide-Format) auf, zu denen Angaben für mindestens zwei Jahreswellen vorliegen. Aufgrund des großen Umfangs von mehreren Millionen Steuerpflichtigen wird das TPP über die Forschungsdatenzentren primär als Stichprobe angeboten. Nähere Informationen zur Nutzung des TPP sind im zum Download verfügbaren Nutzungskonzept dargestellt.
Es ist zu beachten, dass es durch den Wechsel der Datengrundlage (Bundes- anstelle Geschäftsstatistik) teilweise zu Verschiebungen bei der Belegung der Kennzahlen ab Welle 2012 kommt. So werden in der Bundesstatistik alle Informationen zu Frauen in den B-Kennziffern ausgegeben, in den Geschäftsstatistiken standen die Werte alleinveranlagter Frauen dagegen in den A-Kennziffern (analog zu alleinveranlagten Männern). Die unterschiedliche Belegung dieser Kennzahlen muss insbesondere bei geschlechtsspezifischen Auswertungen beachtet werden.
Aktualisierung des TPP – TPP2
Mit dem Veranlagungsjahr 2020 endet die Aktualisierung des „alten“ TPP. Dieses wird der Wissenschaft weiterhin als TPP 2001-2020 zur Verfügung stehen, aber nicht um zusätzliche Veranlagungsjahre erweitert.
Es wird ergänzt durch das „neue“ TPP, Taxpayer-Panel 2 (TPP2). Für das TPP2 wurde die Methodik zur Erstellung des Panels umfassend überarbeitet, um insbesondere in der Stichprobe eine bessere Nachverfolgung von Beobachtungseinheiten zu erreichen. Es wird erstmals für den Beobachtungszeitraum 2012-2020 in Form zweier Datenbestände – 10%-Stichprobe und 1%-Stichprobe – zur Verfügung gestellt, wobei der bisherige zweijährige Veröffentlichungsturnus beibehalten wird. Da das TPP2 auf Basis der Bundesstatistik erstellt wird, gelten die o.g. Einschränkungen aus dem „alten“ TPP zur Belegung der Kennzahlen hier nicht mehr.
An die Stelle der Verknüpfung von Beobachtungen desselben Steuerpflichtigen über die Zeit als zentrale Einheit der Datenaufbereitung und Stichprobenziehung, treten nun als Cluster bezeichnete Zusammenhänge von Steuerpflichtigen im Beobachtungszeitraum. Ein Cluster stellt die Gesamtheit aller Beobachtungen von Steuerpflichtigen dar, welche sich aus sukzessiven Zusammenveranlagungen derselben Steuerfälle im Beobachtungszeitraum ergeben. Nähere Informationen zur Methodik enthalten die zum Download bereitstehenden Informationen zum TPP2.
Die 10%-Stichprobe des TPP2 2012-2020 enthält ca. 44 Millionen Beobachtungen (im long-Format) und ca. 7,5 Millionen distinkte Steuerfälle.
Datensatzbeschreibung und Analysepotenzial
Von den Steuerpflichtigen werden u. a. Bruttolohn, Einkünfte, Einkommen, zu versteuerndes Einkommen, Sonderausgaben, Lohn-, Einkommen- und Kirchensteuer erfasst. Weiterhin enthält das Datenmaterial Angaben über Geschlecht, Geburtsjahr, Religion, Kinderfreibeträge, Kindergeld, Art der Steuerpflicht, Steuerklasse und Veranlagungsart. Eine Aufstellung der Variablen - differenziert nach Veranlagungsjahren - ist in den zum Download verfügbaren Datensatzbeschreibungen enthalten.
Aufgrund des breiten Spektrums an Erhebungsmerkmalen bieten das TPP und das TPP 2 vielfältige Analysemöglichkeiten. Neben rein steuerlichen Betrachtungen sind u.a. auch Untersuchungen und Simulationsrechnungen über die Einkommensverteilung möglich.
Weitere Informationen zur Grundlage des Taxpayer-Panels und des Taxpayer-Panels 2 sowie die zugehörigen Qualitätsberichte und Rechtsgrundlagen finden Sie auf der Seite der Lohn- und Einkommenssteuerstatistik.
Besonderheiten bei der Datennutzung
Für das Taxpayer-Panel und das Taxpayer-Panel 2 gilt folgende Besonderheit bezüglich der Datenzugangswege: Wird die Nutzung des TPP oder TPP2 über die kontrollierte Datenfernverarbeitung (KDFV) beantragt, so kann der Zugang am Gastwissenschaftsarbeitsplatz (GWAP) kostenfrei zusätzlich genutzt werden. Voraussetzung hierfür ist, dass die Ergebnisfreigabe ausschließlich über die KDFV erfolgt. Der GWAP kann in diesem Fall für die Datenexploration und die Erstellung von Syntaxen genutzt werden.
Wir empfehlen diese Möglichkeit zu nutzen. Wenn Sie davon Gebrauch machen wollen, beantragen Sie im Nutzungsantrag bitte beide Zugangswege und vermerken Sie unter „Ergänzende Anmerkungen“ am Ende des Antrags, dass Sie für das TPP oder TPP2 die kostenfreie Nutzung ohne Ergebnisfreigabe nutzen möchten.
FAQ
Informationen zum TPP und TPP2 finden Sie auch im Forum4MICA, in welchem das FDZ Bund im Rahmen einer Testphase das TPP und TPP2 betreut. Dort können Sie Antworten auf bereits gestellte Fragen finden, nach einer kostenfreien Registrierung eigene Fragen stellen oder mit FDZ-Mitarbeitenden und anderen Wissenschaftlerinnen und Wissenschaftlern in Kontakt kommen. Den Forumsbereich finden Sie hier.
Verfügbare Mikrodaten
Die folgenden Erhebungsjahre dieser Statistik können über die einzelnen Zugangsformen genutzt werden. Bitte beachten Sie dabei, dass die Gemeindekennziffer für das Bundesland Bayern ab dem Berichtsjahr 2012 am Gastwissenschaftsarbeitsplatz lediglich pseudonymisiert zur Verfügung steht (bis zum Jahr 2011 sind die Bundesländer tiefste regionale Auswertungsebene).
Taxpayer-Panel (EVAS 73111)
Erhebungsjahr | Form des Datenzugangs | |||
---|---|---|---|---|
Off-Site-Zugang | On-Site-Zugang | |||
Public Use File (PUF) | Scientific Use File (SUF) | Gastwissenschaftsarbeitsplatz (GWAP) | Kontrollierte Datenfernverarbeitung (KDFV) | |
2012-2020 (TPP2) | - | - |
verfügbar Metadaten/DOI |
verfügbar Metadaten/DOI |
2001-2020 (TPP) | - | - |
verfügbar Metadaten/DOI |
verfügbar Metadaten/DOI |
Rechtsgrundlage
Gesetz über Steuerstatistiken (StStatG) vom 11. Oktober 1995