Inhalt von PeWi - Seite 33

Sinn (und Unsinn) von Backtests?

PeWi antwortete auf PeWi's Thema in Diskussionen zum Handel

9) Historie meiner Backtests Meine Gedanken möchte ich mit der Historie meiner Backtests abschließen. Ich habe im Herbst 2017 mit ersten Bots angefangen und ziemlich schnell auch den allerersten, primitiven Backtest ergänzt. Schon deswegen, weil ich mit Börsen und Trading überhaupt keine Erfahrungen hatte und von daher keinerlei Gefühl für gut und schlecht. Die ersten Strategien und Backtests waren entsprechend simpel: zwei kreuzenden EMAs und zwei geschachtelte Schleifen, die für beide EMAs die Parameterbereiche durchrechneten. Ähnliches dann für die Kombination RSI und Bollinger Bänder. Und das musste man dann für jedes Coinpaar wiederholen. Zu meinem ersten, ernsthaften Bot habe ich dann einen umfangreicheren Backtest entwickelt, der alle angegebenen Coinpaare gleichzeitig miteinander hat laufen lassen. Für jeden Parameter konnte man mehrere explizite Werte vorgeben, und der Backtest hat daraus zufällig einen Wert gezogen. Das ganze mehrere hundert mal, und man bekam eine große Ergebnistabelle mit den Gewinnen (oder Verlusten) und mehreren Kennzahlen wie Tradezahl, Sharpe Ratio, Profit Factor, Ulcer Index und einem anschließenden „Rang“, der die wichtigsten vorhergehenden Kennzahlen in eine einzige Zahl kondensiert hat. Bald darauf wurden drei Testzeiträume pro Backtest eingeführt, damit man sehen konnte, wie sich die Strategie und ihre Parameter in Bullen-, in Bären- und in Seitwärtszeiten machen würde. Die Zeiträume entsprechender Charakteristik habe ich dann per Augenmaß aus dem Chart heraus ermittelt und eingetragen. Weil Python für eigene Rechnungen doch recht langsam war, habe ich bald Caches für die Indikatorrechnungen und Multitasking eingeführt. Das hat es mir dann erlaubt, über Nacht nicht nur hunderte Parameterkombinationen rechnen zu lassen, sondern mehrere tausend. Einschub: Je mehr Parameter eine Strategie hat, und je mehr Möglichkeiten zur Auswahl man jedem Parameter vorgibt, desto mehr mögliche Kombinationen ergeben sich, mit denen man die Strategie laufen lassen kann. Nehmen wir das Minimal-Beispiel mit den beiden kreuzenden EMAs: Wenn ich bei jedem EMA für die jeweilige Periodenlänge fünf verschiedene Möglichkeiten durchtesten will, ergeben sich bereits 5 hoch 2 = 25 verschiedene Möglichkeiten. Bei der RSI-Bollinger-Strategie mit ihren fünf Parameters ergeben sich für je fünf Möglichkeiten pro Parameter bereits 5 hoch 5 = 3125 verschiedene Parametersätze. Bei zehn Parametern mit je zehn Auswahlmöglichkeiten landet man bereits bei 10 Milliarden an unterschiedlichen Kombinationsmöglichkeiten - da würde mein Backtest bereits 4 Jahre kontinuierlich rechnen müssen. Die Zahl der Möglichkeiten explodiert somit ziemlich schnell in Höhen, die man nicht mehr alle durchtesten kann. Insofern zieht man über Zufallszahlen eine bestimmte Anzahl mal aus dem Topf mit allen Möglichkeiten und rechnet nur die gezogenen Sets durch. Es ist nämlich gar nicht notwendig, wirklich alle Kombinationen durchzurechnen. Auch wenn man nur jede zehnte oder jede hunderste durchrechnet, bekommt man bereits ein Gefühl für die „Karte“. Wieder ein hinkender Vergleich: Um eine Landkarte zu erstellen, muss man auch nicht jeden einzelnen Zentimeter der Landschaft vermessen. Selbst wenn man nur mit einem Raster von je 100 Metern misst, bekommt man bereits einen brauchbaren Eindruck von der Landschaft, wo große Berge sind, wo große Seen sind etc. Schließlich wollen wir ja Overfitting vermeiden, d.h. hohe, aber schmale Berge sind uninteressant; wir wollen mehr so Gegenden wie das tibetische Hochland finden, wo’s in jeder Richtung ein ganzes Stück geht, und es so hoch bleibt. Insofern darf man grob rastern, und wenn man einen hohen Punkt findet, kontrolliert man die Nachbarpunkte. Sind die ebenfalls hoch, hat man robuste Parametersätze gefunden; sind die Nachbarn mal hoch, mal tief, mal mittendrin, dann war der hohe Ausgangspunkt nicht robust genug, sondern doch etwas overfittet. Damit aber rückte das Problem Overfitting immer mehr ins Bewusstsein. Bisher hatte ich mir einfach immer ein gut erscheinendes Ergebnis aus der Tabelle herausgepickt und dessen Werte in den Bot übernommen. Je mehr Parametersets man durchrechnen kann, desto mehr gerät man ins Overfitting. Das habe ich dann lange von Hand zu lösen versucht. Zuerst aus der Tabelle alle schlechten Ergebnisse löschen, danach die mit den allerbesten Werten für Gewinn, Sharpe Ratio etc., weil die am ehesten auf Overfitting basieren sollten. Die verbleibenden dann manuell verglichen, und was häufiger vorzukommen schien, dann als neue Parameter in den Backtest eingetragen. Zusätzlich noch zu jedem Wert den Wert darüber und darunter ergänzt und das ganze neu durchrechnen lassen. (Entspricht dem obigen Punkt „verrauschen und neu prüfen“.) Waren die neuen Ergebnisse weitgehend ähnlich gut, dann war der ursprüngliche Parametersatz wohl tauglich und konnte verwendet werden. Haben die neuen Ergebnisse dagegen recht gestreut, war der ursprüngliche Parametersatz bereits overfittet. Irgendwann wollte ich per Bot auch shorten können und bin von Binance zu Kraken umgezogen und von Python auf die schnellere Sprache Go umgestiegen. Den Großteil des bisherigen Pythonbots konnte ich übernehmen (d.h. auf Go portieren), den kleineren Rest habe ich neu geschrieben. Go als deutlich schnellere Sprache hat den Backtest aus dem Stand heraus um den Faktor 20 bis 50 beschleunigt, ich kann seitdem über Nacht knapp sechsstellige Zahlen an Parametersets durchlaufen lassen. Damit wurde auch das manuelle Aussuchen, Überprüfen und Verfeinern guter Parametersätze immer mühsamer. Mit den neuen Möglichkeiten und dem Kennenlernen vieler Indikatoren und Strategien anderer wurden meine eigenen Versuche auch immer komplexer. Trotz der deutlich höheren Geschwindigkeit von Go wurde die Rasterung der Backtests aufgrund der explodierenden Permutationen immer gröber, so dass die Chancen immer größer wurden, auch größere robuste Bereiche einfach zu übersehen. (Da ist es nur ein schwacher Trost, dass auch das Overfitting harmloser wird, da es statistisch einfach immer unwahrscheinlicher wird, genau so einen hohen, aber schmalen Peak zu treffen.) Eine automatische, selbst suchende Optimierung des Backtests musste her. Nach etwas Recherchieren klang die „genetische Optimierung“ interessant. Dankenswerterweise ließ sich das auf meine bisherigen Backtests obendrauf setzen. Man lässt einen konventionellen Backtest laufen, die genetische Optimierung pickt anhand einer zu definierenden Fitnessfunktion gute Datensätze heraus, übernimmt sie und füllt den Rest mit Mutationen und Kombinationen zur vollen Stärke auf. Auf diese neue Tabelle lässt man den nächsten Backtest los, und so weiter. (Übliche Fitnessfunktionen liefern typischerweise einen einzelnen Wert zurück, weswegen ich mich für den NSGA-II-Algorithmus entschieden habe, da dieser gleichzeitig auf mehrere Kennzahlen hin optimieren kann und dadurch die „genetische Vielfalt“ der Parametersätze erhält.) Mit so einer Optimierung läuft man natürlich irgendwann unweigerlich ins Overfitting hinein, weswegen man den Zyklus der genetischen Optimierung rechtzeitig abbrechen muss. Nur wann ist rechtzeitig? Wieviele Durchläufe der Methode sind noch ok? Das kann man über die Methode der In-Sample-/Out-Of-Sample-Tests kontrollieren. Der Backtest samt der genetischen Optimierung bekommt einen der Testzeiträume nie zu sehen. Nach jedem Durchlauf wird dieser spezielle Testzeitraum gesondert getestet. Solange seine Kennzahlen noch steigen, solange lernt die Optimierung tatsächlich sinnvolles, das auch außerhalb funktioniert. Wenn die Anpassung an die normalen Testzeiträume spezifisch wird, dann werden die Kennzahlen außerhalb wieder schlechter werden; und dann bricht man ab und nimmt den Durchlauf, bei dem die Out-Of-Sample-Kennzahlen am höchsten waren.

Sinn (und Unsinn) von Backtests?

PeWi antwortete auf PeWi's Thema in Diskussionen zum Handel

8 ) Was ist Overfitting, und was kann man dagegen tun? Overfitting bedeutet anschaulich gesprochen, dass eine Optimierung nicht dazu führt, dass die Strategie „sinnvoll“ besser wird, sondern dass sie anfängt, „auswendig“ zu lernen. Das ist ziemlich schlecht, denn die auswendig gelernten Kurse sind Vergangenheit und kommen im Livebetrieb nie so wieder. Die Strategie hat folglich Antworten auf Fragen gelernt, die nie mehr gestellt werden; ihr Wissen ist somit weitgehend nutzlos. In Konsequenz werden die echten Live-Ergebnisse um so schlechter, je mehr die Strategie die Backtest-Daten auswendig gelernt hat. Um mal einen holprigen Vergleich zu bringen: Wenn ich immer die gleiche Strecke mit dem Auto fahre, dann kann ich sie irgendwann „blind“ fahren. Das hilft mir aber nichts, wenn ich dann eine andere Strecke fahren muss. Wie kann eine Strategie beim Optimieren überhaupt „auswendig lernen“? Jede Strategie hat üblicherweise Stellschrauben, d.h. Parameter, die man so oder anders wählen kann. Bei einer simplen EMA-Kreuzungs-Strategie z.B. sind das die Periodenlängen des kurzen und des langen EMAs; bei einer simplen RSI-Bollinger-Strategie wären es bereits fünf Parameter (Periodenlänge des RSI, Über- und Unterkauft-Bereich, Periodenlänge Bollingerbänder und wie viel Standardabweichungen der Bänder). Der berühmter Mathematiker, Physiker und Computer-Pionier John von Neumann hat mal gesagt: „Mit vier Parametern kann ich einen Elefanten fitten, und mit fünf mit seinem Rüssel wackeln lassen.“ Das heißt, dass man mit den Stellschrauben/Parametern der Strategie die Strategie an die Kurse im Testzeitraum anpassen kann. Je mehr Parameter eine Strategie hat, desto genauer kann man sie anpassen. Ein bisschen Anpassung ist ja nicht verkehrt - bei obiger EMA-Kreuzungs-Strategie sind viel zu kurze EMAs sicherlich untauglich und viel zu lange auch. Irgendwo im mittleren Periodenbereich liegen sinnvolle Werte. Suche ich aber das absolute Optimum, dann bekomme ich ein Parameter-Paar für den Testzeitraum A, vermutlich ein anderes für den Testzeitraum B und ein drittes für C. Sprich, das absolute Optimum in den Backtestergebnissen ist immer unbrauchbar für andere Zeiten bzw. den späteren Livebetrieb. Gesucht sind Werte, die idealerweise überall „halbwegs“ funktionieren. Overfitting ist im übrigen keine theoretische Gefahr, sondern eine mit Sicherheit auftretende, sobald man mit Optimierungen anfängt. Was kann man dagegen tun? Es gibt mehrere Möglichkeiten: a) Möglichst wenig Parameter in der Strategie verwenden. Je weniger Einstellschräubchen, desto weniger genau können die Parameter an den Testzeitraum angepasst werden. Meiner Erfahrung nach funktionieren heutzutage simple Strategien allerdings kaum mehr. b) Nicht auf den Gewinn optimieren, sondern auf das Sharpe Ratio Eine Kennzahl wie das Sharpe Ratio ist weniger anfällig für Overfitting als der Gewinn. Für einen hohen Gewinn reicht im Extremfall ein einziger Glückstreffer, für ein gutes Sharpe Ratio sind dagegen viele gute Treffer nötig. In einem Paper einer Universität über Trading mit Methoden künstlicher Intelligenz schrieben die Autoren explizit, dass sich ihre Ergebnisse deutlich verbessert hätten, als sie ihr Optimierungskriterium vom Gewinn auf das Sharpe Ratio umgestellt hatten. c) Mehrere verschiedene Testzeiträume verwenden und die Ergebnisse mitteln. Ein Parametersatz, der für den Zeitraum X merklich overfittet, sollte für die anderen Testzeiträume eher mäßige Ergebnisse liefern, d.h. sein Ergebnisdurchschnitt über alle Zeiträume ist demzufolge auch eher mäßig. Gute Ergebnisdurchschnitte gibt es nur für Parametersätze, die über alle Testzeiträume halbwegs brauchbare Ergebnisse geliefert haben, und nur die zieht man in Betracht. Das mildert das Problem des Overfittings, löst es aber nicht. Wenn man viele Parameter in der Strategie hat, dann wird die Optimierung letztendlich alle Testzeiträume lernen. D.h. mehr Testzeiträume sind auf jeden Fall besser - eine echte Hilfe ist das aber nur, wenn die Strategie relativ wenige Parameter verwendet. d) Den Backtest mit einer Datenflut ersäufen. Je mehr Parameter man hat, desto mehr kann gelernt werden. Deswegen noch mehr Testzeiträume, noch längere Testzeiträume, noch mehr Coins, ... solange alles steigern, bis es viel zu viele Daten sind, als mit der Parameterzahl gelernt werden können. Das ist sehr schwammig und leider schwierig zu kontrollieren, wann man genug Daten hat, um das Overfitten zu verhindern. Dennoch - je mehr Daten, desto besser. Overfitting wird schlimmer mit wenigen Daten und milder mit mehr Daten. Deswegen ist es immer besser, noch mehr Daten zu verwenden - leider erhöht das die Rechenzeit auch entsprechend. Methoden des maschinellen Lernens (z.B. neuronale Netze, Entscheidungsbäume, etc.) haben typischerweise extrem viele Parameter, da ist eine möglichst große Menge an Daten eine Grundvoraussetzung, ohne die man überhaupt keine Chance gegen Overfitting hat. e) In-Sample optimieren, Out-Of-Sample kontrollieren Eine heutzutage häufig angewandte Methode. Man lässt die Optimierung über soundsoviel Daten/Testzeiträume/Coins/... laufen und prüft mit den Testergebnissen einen zusätzlichen, während der Optimierung nie verwendeten Zeitraum. Solange während der Optimierung noch tatsächlich „echtes Wissen“ gelernt wird, werden sich auch die Ergebnisse für den zusätzlichen Zeitraum verbessern. Sobald das Overfitting einsetzt, werden die Ergebnisse des zusätzlichen Zeitraumes wieder schlechter werden. f) Parametersatz verrauschen und prüfen. Overfitting charakterisiert sich dadurch, dass es nicht „robust“ ist. Sobald sich etwas (Kurs, genauer Parameterwert, ...) leicht ändert, fallen die Ergebnisse deutlich ab. Das kann man sich zunutze machen, wenn man ein Ergebnis auf Overfitting prüfen möchte. Man kopiert den Parametersatz mehrfach und ändert in jedem Duplikat einen oder mehrere Parameterwerte um wenige Prozent. Basiert der ursprüngliche Parametersatz größtenteils auf Overfitting, dann werden die leicht veränderten Duplikate mehrheitlich merklich abfallen. Enthält der ursprüngliche Parametersatz dagegen kaum Overfitting, dann werden auch die leicht veränderten Duplikate ähnlich gute Ergebnisse erzielen.

Sinn (und Unsinn) von Backtests?

PeWi antwortete auf PeWi's Thema in Diskussionen zum Handel

7) Fehlerquellen Backtest-Ergebnisse nutzen nur etwas, wenn sie nicht aufgrund von Fehlern verfälscht sind. Die meisten Fehler fallen in fünf große Fehlerklassen. a) Vergessen von Fee und Slippage Das ist der simpelste Fehler. Jeder Kauf und Verkauf kostet Gebühren, und wenn man die nicht berücksichtigt, ergibt sich ein geschöntes Bild. Gerade bei schnellen Strategien mit vielen, schnellen Trades spielen die Gebühren eine große Rolle, und manch eine Strategie, die ohne Gebühren stabil profitabel wäre, rutscht mit den Gebühren in die Minuszone. Slippage: Der angezeigte Kurs ist die Spitze des Orderbuchs. Bei illiquiden Coins kann diese Spitze ziemlich dünn sein, und um die Menge an Coins kaufen oder verkaufen zu können, die dem gewünschten Betrag entspricht, muss man auch Angebote aus der zweiten und dritten Reihe des Orderbuchs bedienen. Damit bekommt man schlechtere Kurse, und gerade bei kleinen Coins kann dieser Kursunterschied deutlich über ein Prozent ausmachen, was tödlich für Strategien ist, die viele kleine Trades machen wollen. Im Gegensatz zur Fee ist die Slippage sehr variabel und hängt vom konkreten Coin, der eigenen Positionsgröße, der Tageszeit und der allgemeinen Aktivität am Markt ab. Die Slippage kann man somit nur raten, und ihre Wirkung auf die Ergebnisse ist in realiter oft schlimmer als die Fees. Am besten konzentriert man sich auf hochliquide Coins und hält seine Ordergrößen im Zaum - andernfalls muss man genau hinschauen und genau wissen, was man tut! b) Unterschiede zwischen Bot- und Backtest-Source: Wenn man für den Backtest nicht weitgehend die Originalsourcen des Bots nutzen kann, sondern viele Teile nachprogrammieren muss, dann wird es sehr schwer, diese beiden Pfade dauerhaft konsistent zu halten, so dass Bot und Backtest für gleiche Kurse wirklich genau das gleiche tun. Gerade, wenn man anfängt, kleine Optimierungen und Änderungen einzupflegen, dann kann man fast darauf wetten, dass man die eine andere Kleinigkeit irgendwann im anderen Zweig einzupflegen vergisst oder versehentlich einen subtilen Unterschied einbaut. In Summe laufen Backtest-Verhalten und Bot-Verhalten damit immer weiter auseinander; die Backtests werden damit unbrauchbar. Die Konsequenz daraus ist, seinen Source so zu bauen, dass möglichst viel für Bot und Backtest gleichermaßen genutzt werden kann. Lieber ein paar if-Verzweigungen in den Funktionen, als die Funktionen doppelt halten. c) Programmfehler: Fehler im Sourcecode des Backtests ruinieren die Aussagekraft der Ergebnisse etwas bis vollkommen. Ein Beispiel wäre, dass ein Coin aufgrund eines Bugs im Backtest überhaupt nicht verwendet wird. Oder dass aufgrund von Rundungsfehlern oder fehlenden Prüfungen der Backtest gleichzeitige Orders gestattet, die minimal bis deutlich über der vorgegebenen Balance liegen. Besonders tückisch ist der Off-By-One-Fehler. Preis- und Indikatordaten werden im Programm oft in Arrays gehalten, und wenn aufgrund eines Bugs der Arrayindex um eins nach oben verrutscht, dann kann der Backtest um eine Candle in die Zukunft sehen. Mit etwas Erfahrung erkennt man das an den Ergebnissen relativ schnell, weil der Backtest dann typischerweise nur minimale Drawdown ausweist und in quasi allen Marktsituationen satte Gewinne macht. Wenn das Ergebnis zu gut scheint, um wahr zu sein, dann ist es auch nicht wahr. d) Datenfehler Auch wenn der Source fehlerfrei ist, kann der Backtest falsch sein. Wenn z.B. Kraken wegen Wartungsarbeiten o.ä. down ist, gibt es für diese Zeiten keine Candles. Sprich, die für den Backtest heruntergeladenen Candles haben an der Stelle einfach ein „Loch“, was zu mannigfaltigen Fehlern im Backtest führen kann. Oder einzelne Werte einzelner Candles stimmen nicht; es kommt durchaus vor, dass Exchanges oder Datendienste Fehler in ihren Daten haben. Mal ist der Open-Wert viel zu niedrig oder zu hoch, mal der Close-Wert, mal steht Null drin. Wenn der Backtest in genau dieser Candle kauft oder verkauft, dann ergeben sich ebenfalls völlig unrealistische Gewinne oder Verluste. Es empfiehlt sich, die Candledaten in einer Tabellenverarbeitung zu visualisieren, dem Auge fallen Brüche und Ausreißer gut auf. Solche Fehlstellen muss man anschließend korrigieren, oder gleich den betreffenden Coin ausschließen, wenn’s bei ihm öfter vorkommt. e) Overfitting Overfitting ist ein so grundlegendes und großes Problem für alle Optimierungsversuche, so dass ihm ein eigenes Kapitel gewidmet ist.

Sinn (und Unsinn) von Backtests?

PeWi antwortete auf PeWi's Thema in Diskussionen zum Handel

6) Welche Arten von Backtests gibt es? Die simple Ausführung eines Backtests lässt dich deine Strategie mit den gewählten Parametern ausführen und zeigt dir dann an, was im Testzeitraum rausgekommen wäre. (Mit den Einschränkungen aus 4) und 5)!) Etwas fortgeschrittenere Backtests enthalten gerne Optimierungen. Sprich, man kann für einen oder mehrere Strategieparameter Wertebereiche vorgeben, und der Backtest rattert alle Kombinationen durch und spuckt aus, welches die beste Kombinationen für den Testzeitraum gewesen wäre. Das ist oft gefährlich, denn meistens wird einfach nur der Endkontostand als Kriterium für die beste Parameterkombination genommen. Zum einen sind die Ergebnisse typischerweise nicht belastbar (siehe 4) und 5)), und zum anderen landet man damit in der großen Backtest-Falle namens Overfitting. (Siehe 8).) Weiter fortgeschrittenere Backtests erlauben zusätzliche Freiheiten, z.B. mehrere Testzeiträume gleichzeitig, wählbare Kriterien, auf die optimiert werden soll, und Maßnahmen, die Overfitting einschränken sollen.

Sinn (und Unsinn) von Backtests?

PeWi antwortete auf PeWi's Thema in Diskussionen zum Handel

5. Wozu dann überhaupt Backtests? Ich nutze seit der Erfahrung aus 4) Backtests nicht mehr als Voraussage, wie der Bot später im Echtbetrieb laufen sollte, sondern mehr zum grundsätzlichen Testen von Strategie-Ideen und zum Aussortieren schlechter Einstellungen. Erfahrungsgemäß und auch in der Literatur beschrieben ist der Livebetrieb immer schlechter als der Backtest. Damit ändert sich auch die Aussage des Backtests - er kann nicht sagen, was man in realiter mit der Strategie schaffen könnte oder sollte, sondern er kann nur die verschiedenen Strategien und Einstellungen relativ ranken. Verständlicher formuliert: Gute Ergebnisse im Backtest werden im Livebetrieb schlechter sein - wie viel ist ungewiss. Aber schlechte Ergebnisse im Backtest werden in realiter noch schlechter sein. Man kann also mit einem Amateur-Backtest wie meinem nicht prognostizieren, was der Bot tatsächlich erwirtschaften kann, aber man kann damit durchaus die schlechten Ideen und die schlechten Parameter-Einstellungen erkennen und aussortieren. Was den Backtest mit guten Ergebnissen übersteht, könnte tauglich sein und ist es ggfs. wert, es mit kleinem Geld mal live auszuprobieren. Und dazu benutze ich meine Backtests hauptsächlich, und dafür finde ich sie auch sinnvoll. Konkrete Prognosen für die Zukunft und den späteren Ertrag mit echtem Geld finde ich dagegen hochgradig unseriös!

Sinn (und Unsinn) von Backtests?

PeWi antwortete auf PeWi's Thema in Diskussionen zum Handel

4) Wie genau sind Backtests? Wenn man die jeweilige Strategie überhaupt backtesten kann: Schwierig - typischerweise nicht so dolle. Zumindest das, was man als interessierter Amateur so hinbekommt. (Was echte Profis können, kann ich nicht beurteilen.) Wer also einen Bot über ein paar Monate laufen lässt und anschließend diesen Zeitraum nochmal durch einen Backtest jagt, wird meiner Erfahrung nach deutlich divergierende Ergebnisse erhalten, sowohl, was die konkreten Trades betrifft als auch das Ergebnis (Profit, Sharpe Ratio, ...). Das hat verschiedene Gründe. Zum einen die subtilen Gründe wie die üblicherweise fehlende Einbeziehung von Orderbuch und Konkurrenten. Die machen für Strategien auf großen Candles und begrenzten Einsatz wahrscheinlich wenig aus. Meiner Vermutung nach entstehen die wesentlichen Abweichungen eher durch das Backtest-Design selber. Üblicherweise rechnet man nach jeder fertigen Candle diverse Indikatoren aus und schickt die dann an die Exchange. D.h. man rechnet mit dem letzten Close-Preis und bekommt dann für die nachfolgende Bot-Order irgendeinen Preis nach dem Open der neuen Candle. Gerade, wenn sich im Preis einiges tut, und der Bot darauf reagiert, entstehen durch diesen zeitlichen Versatz u.U. merkliche Differenzen. Das betrifft vor allem schnelle Strategien (kurze Candles) und langsame Programme. Bis alle Daten geholt und alle Indikatoren berechnet sind, ist die nächste Candle schon fast rum. Ein zweites Problem, das einem möglicherweise gar nicht gleich auffällt, ist dass sich kleine Unterschiede (auch Rundungsfehler) über die Zeit gewaltig aufschaukeln können - Stichwort Schmetterlingseffekt. Dazu eine Anekdote von meinem eigenen Bot: Beim Test einer neuen Strategie bekam ich bei jedem Durchlauf deutlich unterschiedliche Ergebnisse bei eigentlich völlig gleichen Bedingungen. Nach längerem Suchen nach eigenen Bugs kam ich schließlich darauf, dass von mir verwendete Sprache Go bei Hashmaps absichtlich (durch Hinzufügen eines Zufallselementes) die Reihenfolge der enthaltenen Objekte verwürfelt. Sprich, mein Bot hat bei dem einem Backtest die Coins in der Reihenfolge A bekommen und beim nächsten Backtest in der Reihenfolge B etc. Und dadurch, dass bei dieser Strategie nur weniger Positionen als mögliche Coins erlaubt waren, hat sich die Reihenfolge der Coin-Orders (und dadurch auch das Ergebnis) völlig unterschiedlich entwickelt. Wenn sich mehrere Coins angeboten haben, aber nicht mehr genügend Order-Slots frei waren, dann wurde je nach Coinreihenfolge mal Coin A, mal Coin B oder mal Coin C genommen - kein Wunder, dass die Backtests über die Zeit dann deutlich auseinanderliefen. (Bei Strategien, die die Coins nach irgendwelchen Kriterien ranken, wird die Hashmap-Reihenfolge durchs Sortieren überschrieben; die liefern dann bei jedem Backtest die gleichen Trades und das gleiche Ergebnis ab.) Daraus habe ich für mich das Fazit gezogen, dass ein Backtest per se ungenau ist und auch im Nachhinein nie die Realität widerspiegeln kann. Ein Backtestlauf ist quasi lediglich das Ziehen einer Möglichkeit aus den vielen Möglichkeiten und Ergebnissen, die durch die verschiedenen Unterschiede (Reihenfolge, Konkurrenten, Orderbuch, ...) entstehen. Und wenn man diese Verwürfelungen zulässt, dann bekommt man eine Bandbreite an Ergebnissen und kann eher abschätzen, in welchem Bereich ein späteres Ergebnis schwanken kann.

Sinn (und Unsinn) von Backtests?

PeWi antwortete auf PeWi's Thema in Diskussionen zum Handel

3) Kann man alles backtesten? Keinesfalls, es gibt einiges an Strategien, die sich überhaupt nicht vernünftig backtesten lassen. Das betrifft vor allem zwei Umstände. Manche Strategien benötigen Daten, die man üblicherweise nicht oder nur sehr teuer bekommt wie z.B. ein zeitlich und preislich fein aufgelöstes Orderbuch. Oder die Strategie hängt sehr davon ab, dass man besser und schneller ist als Konkurrenten. Arbitrage z.B. betrifft gleich beide Punkte und ist somit nicht backtestbar. Allgemein: Je kürzer die Zeitbasis ist, auf der die Strategie arbeitet, desto schwieriger wird ein Backtest. Eine Strategie, die auf Stundencandles oder noch größeren Zeiträumen arbeitet, ist weit einfach backzutesten als eine, die auf 1-min-Candles beruht. Zusätzlich: Je größer die eigenen Positionen werden, desto schwieriger werden brauchbare Tests, weil man durch große Orders das Orderbuch merklich beeinflusst und damit den Kurs verzerrt. Das lässt sich im Backtest kaum simulieren. Was „große Orders“ sind, ist im Kryptomarkt stark relativ. Bei hoch liquiden Coins wie BTC und ETH kann man auf großen Börsen üblicherweise sechsstellige Orders praktisch ohne Kursbeeinflussung unterbringen, bei kleinen „Shitcoins“ und/oder kleinen Börsen können auch dreistellige Orders schon kritisch werden.

Sinn (und Unsinn) von Backtests?

PeWi antwortete auf PeWi's Thema in Diskussionen zum Handel

1) Was sind Backtests? Mit einem Backtest wird eine Strategie auf historischen Daten eines bestimmten Zeitraums ausgeführt. Typischerweise wird das Verhalten während dieses Testzeitraumes anhand mehrerer bis vieler Kennzahlen analysiert und präsentiert. Solche Kennzahlen sind mindestens Gewinn und Verlust und üblicherweise minimal eine Kennzahl wie das Sharpe Ratio; oft sind es aber deutlich mehr Kennzahlen bis hin zur statistischen Auswertung sämtlicher Trades. Verbreitet ist das vor allem unter Betreibern automatisierten Trading, man kann einen Backtest prinzipiell aber auch per Hand anhand der Kursdaten und der Strategiekriterien auf dem Papier durchführen. 2) Welchen Nutzen hat ein Backtest? Ein guter Backtest zeigt einem das grundlegende Verhalten seiner Strategie auf, man bekommt ein erstes Gefühl dafür, was sie taugt, und bei welchen Kursverhältnissen sie gut oder schlecht performt. Ohne Backtest muss man die Strategie im Livebetrieb kennenlernen, und das dauert u.U. ziemlich lange. Meinen ersten ausgefeilteren Bot habe ich im Bärenmarkt entwickelt und konnte ihn über Monate hinweg gut gegen fallende Kurse härten, wusste aber die ganze Zeit über nicht, wie er sich dann bei steigenden Kursen schlagen würde. Bei Backtests kann man üblicherweise den Testzeitraum auswählen, und damit kann man die Strategie in einer Vielzahl von unterschiedlichen Marktbedingungen ausprobieren. Im Livebetrieb würde das Jahre dauern, ähnlich umfangreiche Erfahrungen zu bekommen. Ein zweiter, wichtiger Aspekt ist, dass man beim Austesten seiner Strategie durch Backtests kein echtes Geld riskieren muss. Ein Backtest ist ja immer nur eine Simulation. Das lässt sich im Livebetrieb stark mildern, indem man mit sehr kleinen Positionsgrößen arbeitet. Je nach Zahl der gleichzeitigen laufenden Tests und den eigenen finanziellen Verhältnissen kann das verschmerzbar sein oder immer noch wehtun. Ein Teil der Bots bietet im Livebetrieb zusätzlich die Möglichkeit des Paper Tradings an, d.h. die Kauf- und Verkaufsorders werden nicht tatsächlich ausgeführt, sondern nur simuliert. Ohne Backtest bleibt dennoch das Problem, dass es sehr lange dauert, genügend viele Erfahrungen mit der Strategie zu sammeln. Eine Gegenanzeige zum zweiten Punkt: Gerade bei manuell ausgeführtem Trading wird oft bewusst empfohlen, mit echtem Geld zu arbeiten. Es ist viel leichter, sich bei Spielgeld an die Strategie zu halten als bei echtem Geld. Der durchschnittliche Mensch neigt laut Studien dazu, Gewinne vorschnell zu nehmen und Verluste in der Hoffnung auf `nen Turnaround zu lange laufen zu lassen. (Einer der Gründe, warum ich auf Bots setze - das nimmt die Emotionen weitgehend raus.)

Sinn (und Unsinn) von Backtests?

PeWi erstellte Thema in Diskussionen zum Handel

Nachdem hier im Coinforum immer mal wieder das Thema Backtest kurz aufflackert, und ich mich seit Jahren mit Backtests beschäftige, möchte ich ein paar Punkte aus meiner Erfahrung niederschreiben und freue mich über Hinweise, Korrekturen, Verbesserungen und überhaupt eine rege Diskussion ... Disclaimer: Ich spreche hier immer vom Level, den man als interessierter Amateur erreicht. Echte Profis können das vermutlich besser. Aufgrund der Länge unterteile ich meine Niederschrift in mehrere Posts.

Bürgergeld

PeWi antwortete auf user2748's Thema in Offtopic

[...] ... gibt's hier noch jemanden, der recht dicht an Vorständen ist und das eventuell bestätigen kann oder eine andere Meinung dazu hat? (meine Beobachtung - nicht Meinung - dazu: Wer als Vorstand die Menschen nicht überzeugt, die ihm auf allen Ebenen zuarbeiten, ist nicht lange Vorstand) Ganz aus der Luft gegriffen scheint das nicht zu sein, wenn man nach "studie anteil soziopathen im management" sucht. Zwei der Treffer, die auf Studien verweisen: - https://www.wissenschaft.de/gesellschaft-psychologie/viele-manager-leiden-unter-einer-persoenlichkeitsstoerung/.. - https://de.linkedin.com/pulse/kennen-sie-die-25-psychopathen-ihrem-führungsteam-barth- Es gibt - allerdings mengenmäßig deutlich unterlegen - auch Artikel, die obige These ablehnen.

Craig Wright Satoshi-Story

PeWi antwortete auf Nucoin's Thema in Allgemeine Diskussionen

Das ist der Punkt, der mich an "CSW ist Satoshi" am meisten stört - CSW vertritt in manchen der zentralen Punkte genau gegensätzliche Positionen zum BTC-Whitepaper.

Bürgergeld

PeWi antwortete auf user2748's Thema in Offtopic

Wenn du auch schon am Existenzminimum gelebt hast, dann weißt du, dass es zwischen "ernährt sich brauchbar" und "ist am verhungern" doch eine merkliche Bandbreite gibt. Wer sich z.B. fast jeden Tag nur Nudeln aus einer billigen Großpackung macht, hat dadurch sicherlich ein bisschen Lebensmittelgeld eingespart. Wer auf Duschgel, Deo etc verzichtet, spart ebenfalls minimal ein. Etc pp. Ich denke, wenn man unbedingt will (Rauchen, Haustier etc), dann findet man auch Wege. Auch wenn es langfristig für einen ungesund sein mag. Du hattest sicherlich mehr Interesse als obige Personen, dich selber brauchbar zu ernähren, hygienisch und nicht abgerissen unterwegs zu sein. Und du hattest die intellektuellen Fähigkeiten, die relativen Preise zu vergleichen. Wer ganz einfach gestrickt ist, schaut oft nur auf den absoluten Preis und schnallt das gar nicht, wie er da völlig unnötig Geld zum Fenster rausschmeißt. Zu diesen Videos allgemein: Da wird viel Stuss gezeigt. a) Exemplarisch dein erster Videolink, in den ich kurz hineingesehen habe. Ein intelligenter Mensch kauft nicht Essen für einzelne Tage ("eine Möhre"), sondern eine 1kg-Packung Möhren für 1,09€ (oder so) und hat dann für 'ne Woche. Wer so unüberlegt - du beschreibst es ja gut - Einzelportionen kauft, kommt mit dem Tagessatz nicht hin. (Anders, wer größere Packungen an Grundnahrungsmitteln kauft und selber kocht - schreibst du ja auch.) b) Bei entfernten Bekannten miterlebt: Medien (auch "seriöse") interessieren sich bei solchen Berichten überhaupt nicht für den tatsächlichen, konkreten, echten Fall, sondern sie wollen einen Bericht, der ordentlich Zuschauerquote bringt. Und da wird ungeniert sinnentstellend gekürzt, zitiert, verdreht und behauptet. Muss man selber erlebt haben - seitdem bin ich ziemlich desillusioniert und bringe solchen Medienberichten große Skepsis entgegen. Natürlich wird da polarisierend dargestellt. Haustiere können eine psychologische Hilfe und Stütze sein, wenn einem menschliche Unterstützung fehlt.

Bürgergeld

PeWi antwortete auf user2748's Thema in Offtopic

Und was lassen sie ggfs. im Gegenzug weg (was hingegen "wir" als notwendig empfinden würden), um sich obiges leisten zu können?

Warum ist Kraken so teuer? Coinbase vs. Kraken

PeWi antwortete auf wikko's Thema in Fragen von Einsteigern

Steht irgendwo in Christophs Artikelserie - die Umstellung auf PoS ändert an der Gebühren erst mal nichts. Gefunden - in "Geldpolitik nach dem Merge" steht: "Die Gebührenordnung von Ethereum richtet sich weiterhin nach dem London-Upgrade bzw. EIP-1559, das am 5. August 2021 aktiviert wurde."

Klimawandel

PeWi antwortete auf Axiom0815's Thema in Offtopic

"Aktuell ist die Dürre-Situation nach den Regenfällen der letzten Wochen für die oberflächennah wachsenden Pflanzen nahezu im ganzen Land entspannt. Nur in Niedersachsen und Sachsen-Anhalt ist der Oberboden so trocken, dass sie sich nicht weit von dem Punkt befinden, an dem sie zu welken beginnen, wie die Daten des Dürremonitors zeigen, die das Leipziger Umweltforschungszentrum sammelt. Gräbt man allerdings etwas tiefer, um einen Eindruck von den Böden bis zu einer Tiefe von 1,80 Meter zu bekommen, so färbt sich die Deutschlandkarte tiefrot. Fast im ganzen Land herrscht nach diesem Maßstab immer noch mindestens eine schwere Dürre, wobei für weite Landesteile eher eine der beiden höheren Warnstufen (extreme Dürre und außerordentliche Dürre) angezeigt werden. Nur im Einzugsgebiet der oberen Donau und in der östlichen Hälfte Mecklenburg-Vorpommerns sieht es etwas besser aus." https://www.heise.de/tp/features/Alarmierender-Befund-Deutschland-trocknet-aus-7265105.html

IOTA Seed

PeWi antwortete auf Firevox's Thema in Allgemeine Diskussionen

Äpfel und Birnen? Chrysalis ist die Bezeichnung für das aktuelle Iota-Mainnet, Firefly der Name der zu dieser Iota-Version gehörenden Wallet-Software. Insofern muss man dich an Firefly weiterleiten. In Firefly musst du mit dem passenden Seed die Migration deines Guthabens aus dem alten Iota-Netz auf das aktuelle Netz anstossen. Ob es für deinen Seed irgendwelche Vorab-Prüfungsmöglichkeiten gibt, dass du nicht alle 2080 Möglichkeiten manuell in der Firefly-Wallet ausprobieren musst, müssen die Profis hier beantworten.

Prognose

PeWi antwortete auf fjvbit's Thema in Kursentwicklung & Chartanalyse

Wenn man auf Long spekuliert, dann leiht man sich USD/USDT/..., um jetzt die Coins kaufen zu können und später mit Gewinn verkaufen zu können. Dann gibt er die ursprüngliche Summe an USD/USDT/... zurück, der Rest ist sein Gewinn. Wer jetzt Coins leiht, spekuliert darauf, sie jetzt zu verkaufen und sie später billiger zurückkaufen und zurückgeben zu können. Die Differenz zwischen dem, was er jetzt als Verkaufserlös bekommt, und dem, was er für den Rückkauf ausgeben muss, ist sein Gewinn.

Prognose

PeWi antwortete auf fjvbit's Thema in Kursentwicklung & Chartanalyse

ETH-Lending kostet auf Bitfinex gerade 407.48% p.a. - da wird heftig auf heftig fallende Kurse nach dem Merge in einer halben Stunde spekuliert. Edit: Das liegt ungefähr um den Faktor Tausend über den "normalen" Zinssätzen für ETH.

Bestehende Long Position Short Order - Was passiert?

PeWi antwortete auf ___elvis___'s Thema in Allgemeine Diskussionen

Sorry, mit Phemex kenne ich mich nicht aus. Das hätte mit einem weiteren Long vermutlich geklappt. Dass du versehentlich Short geklickt hast, sollte dir in Konsequenz eine Verkleinerung deiner vorher bestehenden Long-Position beschert haben. Eigentlich sollte dir Phemex doch deutlich anzeigen, welche Position(en) in welcher Größe du jetzt aktuell hast?

Bestehende Long Position Short Order - Was passiert?

PeWi antwortete auf ___elvis___'s Thema in Allgemeine Diskussionen

Dazu wären ein paar weitere Informationen ganz hilfreich, z.B. welche Börse, welcher Coin etc. Mangels dieser Infos kann ich nur mal erklären, wie das auf der von mir verwendeten Börse Kraken funktioniert (und vermutlich auf den meisten anderen Kryptobörsen auch): Long ist das Gegenteil von Short und umgekehrt. D.h. wenn ich zu einer Long-Position einen genau so großen Short aufmachen, löschen sich beide Positionen aus, und ich habe dann keine Position mehr offen. Wenn ich bei einer bestehenden Long-Position einen kleineren Short zusätzlich aufmache, dann löschen sich der Short und der entsprechende Anteil des Longs gegenseitig aus; das Ergebnis bleibt ein entsprechend verkleinerter Long übrig. Mache ich zu einem bestehenden Long einen größeren Short auf, dann bleibt nach dem gegenseitigen Auslöschen noch ein Stück Short übrig, d.h. ich habe von Long auf Short gewechselt. Insofern hast du das vermutlich schon richtig gemacht - du wolltest deinen Long verkleinern, hast einen kleineren Short gestartet, der hat ein Stück vom Long ausge-x-t, und jetzt ist dein Long entsprechend verkleinert.

Energiepreise

PeWi antwortete auf Aktienspekulaant's Thema in Offtopic

Das ist in der Tat ein großes Problem. Es gibt inzwischen erste Untersuchungen, dass genau dieser Mechanismus zur Echokammer-Bildung und Spaltung der Gesellschaft beiträgt: https://www.heise.de/tp/features/Paradoxerweise-koennen-Gesellschaften-ab-einer-gewissen-Konnektivitaet-zerfallen-4967504.html

Umgang mit Propaganda

PeWi antwortete auf Christoph Bergmann's Thema in Forum über das Forum

Um der Gerechtigkeit Genüge zu tun: @bartiohat sich die Finger gegen Corona-Querdenker wundgeschrieben und sich meiner Erinnerung nach deutlich gegen Putin und Russland ausgesprochen. Seine zugegebenermaßen heftige Kritik bei Energie- und Regierungsthemen, die typischerweise kein gutes Haar an irgendetwas lässt, in die Russentroll-Schublade zu stecken, kann ich nicht nachvollziehen. Und ganz allgemein: Auch wenn du es gut meinst, halte ich diesen "Russentrollfabriken-Unterstützungsvorwurf" für übertrieben. Ich bin inzwischen ein älteres Semester, und für mich liegt das klar noch in der Bandbreite, die eine vernünftige freie Gesellschaft aushalten kann und muss. Selbst wenn die anderen von dir genannten User wissentlich oder unwissentlich Zuarbeiter der Russentroll-Fabriken wären, sie sind wenige (kein Überschreiten einer kritischen Masse), bleiben mit Posts dieser Art im wesentlichen in den OT-Threads und werden im allgemeinen von den anderen Usern mengenmäßig und argumentativ überstimmt. Fazit meinerseits: Die von dir bemängelten Posts und User sehe ich nicht als tatsächliches "Problem", sondern eher als "Lästigkeit". Die von dir vorgestellte Lösung hat für mich den etwas unangenehmen Beigeschmack, den man heutzutage "den Medien" vorwirft: Verengung des Meinungskorridors, Konformitätdruck, Verringerung der Meinungsvielfalt, etc. Nebenbei ein interessantes Fundstück zum Thema "Trollfabriken" - anscheinend tun auch "wir" so etwas auf systematischer Basis: https://www.heise.de/news/Zahlreiche-gesperrte-Fake-Accounts-sozialer-Netzwerke-als-prowestlich-enttarnt-7242644.html

Gendern - weiblich, männlich, divers...

PeWi antwortete auf koiram's Thema in Offtopic

Zugegeben. Allerdings frage ich mich öfters, ob Namensumbenennungen wirklich einen nennenswerten Effekt haben. Am Beispiel der Name für Schwarze - der wurde in der Vergangenheit mehrfach geändert, ohne dass sich ernsthaft was geändert hatte. Die diskriminierende, verächtliche Konnotation wurde von den "Gestrigen" über kurz oder lang sukzessive auf den neuen Begriff übertragen. (Erst heutzutage, nachdem der Großteil der Gestrigen nicht mehr da ist, scheint die aktuelle Bezeichnung diskriminationsfreien Bestand zu haben.) In Konsequenz - mir scheinen Aktionen wie obige Umbenennungen eher Syptombekämpfung zu sein, die Kräfte bindet und Reibung erzeugt, aber wenig Effekt hat. Und im Gegenzug nervt die Reibung soundsoviele, die dem grundsätzlichen Thema eigentlich durchaus positiv gegenüberstehen würden. Insofern möglicherweise kein effizienter Ansatz, die gewünschten Veränderungen zu erreichen. Ich könnte mir vorstellen, dass der umgekehrte Ansatz effizienter ist - an der Wurzel des Rassismus (konkrete Probleme, Benachteiligungen, ..) arbeiten und nicht an der Oberfläche, dann fallen die Syptome mit der Zeit mit weniger Aufwand nebenher. Zum Beispiel durch solche Aktionen. Konkrete Benachteiligungen oder Ungleichbehandlungen aufzeigen und versuchen abzustellen oder zumindest zu mildern.

25. August 2022
78 Antworten
- 2
- gendern
- gender
- (und 5 weitere)
  Markiert mit:
  - gendern
  - gender
  - geschlechtsneutral
  - weiblich
  - männlich
  - divers
  - ens

Energiepreise

PeWi antwortete auf Aktienspekulaant's Thema in Offtopic

Nicht unbedingt. Siehe Tilo Jung - es reicht, wenn der Gewinn deutlich einbricht. Das Unternehmen muss nicht in Gefahr sein, und es darf auch in vorherigen Quartalen dick Gewinn gemacht haben. (Edit: Man lese auch die Kommentare unter dem Tweet.) -

Prognose

PeWi antwortete auf fjvbit's Thema in Kursentwicklung & Chartanalyse

Das ist die übliche Wahl zwischen Pest und Cholera - entweder zügig dabei sein (und damit auch auf viele Fehlausbrüche reinfallen), oder auf längere Bestätigung warten und dafür die ersten Wochen verpassen. Den Sweetspot zwischen beiden Extremen "zu bald" und "zu spät" zu finden ist knifflig; und der verändert sich sicherlich auch über die Zeit.

Profile

Forum

Blogs

Shop

Kalender

Downloads

Galerie

Alle Inhalte von PeWi

Wichtige Information