PeWi Geschrieben 21. Oktober 2020 Teilen Geschrieben 21. Oktober 2020 8 hours ago, skunk said: Die erste Frage wäre ja welchen Reward man definiert und das unabhängig vom Input. Möchte ich auf maximalen Profit gehen und ganz stumpf das zum Reward machen? Ich habe das Gefühl selbst wenn ich eine richtig gute KI damit Training, wird das Resultat eher eintäuschend sein. Daher erstmal eine künstlich dumme KI mit fertigen Indikatoren trainieren aber dabei am Reward spielen. Wie du schon vermutest, ist maximaler Profit kein guter Reward. Das führt im Zweifelsfall zu Overfitting und lässt Drawdowns und ähnliches völlig außer acht. In einem deiner beiden verlinkten Artikel war erwähnt, dass bei solch primitiven Reward-Funktionen das Ergebnis besser wurde, wenn der Reward auch erhöht wurde, wenn das Netz keine Coins besaß, falls der Preis fällt. In einem Forschungspaper waren die Trainingsergebnisse belegbar besser und robuster, wenn auf ein möglichst gutes Sharpe Ratio optimiert wurde. 8 hours ago, skunk said: Nach spätestens 3 Jahren kommt eine CPU mit locker der 4 fachen Geschwindigkeit. ... kommt eine GPU mit locker ... Ansonsten d'accord. 1 1 Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Empfohlene Beiträge
Erstelle ein Benutzerkonto oder melde Dich an, um zu kommentieren
Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können
Benutzerkonto erstellen
Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!
Neues Benutzerkonto erstellenAnmelden
Du hast bereits ein Benutzerkonto? Melde Dich hier an.
Jetzt anmelden