Ugrás a tartalomra
Megjelent az Elemzésközpont új Daytrade képzése: A 70 órás, 2026-os tananyag a rövid távú kereskedés legfontosabb technikáit mutatja be deviza-, index- és részvénypiaci példákon keresztül. Tanfolyam megtekintése

Tőzsdei stratégiák tesztelése: hibák, torzítások és gyakorlati szempontok

Szerző | Hírlevél | Facebook

Az alábbi írás elsősorban kezdő tőzsdei kereskedőknek és befektetőknek szól. Azt mutatjuk be, hogy milyen adatokra, információkra, összefüggésekre és stratégiákra támaszkodnak a piaci szereplők rövid és hosszabb időtávon. Nemcsak azt nézzük meg, hogy ezek a módszerek működtek-e a múltban, hanem azt is, mennyire megbízhatók valójában, milyen hibák torzíthatják a visszateszteléseket, és hogyan lehet kiszűrni a félrevezető eredményeket. Végül arra is kitérünk, milyen szempontok alapján érdemes megítélni, hogy egy tőzsdei összefüggés a gyakorlatban is használható-e.

Megérzések, tippek, tőzsdeguruk

A kezdő tőzsdei kereskedők, részvénypiaci befektetők jelentős hányada valószínűleg el sem jut addig, hogy a bevezetőben felsorolt problémákkal foglalkozzon. Ők azok, akik elhiszik a reklámok ígéreteit, vagy a filmekben látottak alapján alakítják ki a véleményüket a tőzsdézésről, és gyakran tippek, megérzések, tőzsdeguruk tanácsait követve fektetik be a pénzüket.

Az emberi agy hosszú évezredeken keresztül úgy fejlődött, hogy segítse az embert a túlélésért folytatott küzdelemben. A kialakult ösztönök és megérzések a múltban valóban segítették az embert a fenyegetések elhárításában. A modern világban azonban ezek a fenyegetések átalakultak, és ma már nemcsak fizikai, hanem pénzügyi fenyegetésekkel is szembe kell néznünk. Gondolok itt a válságokra, a tőzsdék összeomlására, a hiperinflációra vagy a részvények zuhanó árfolyamára. Ugyanakkor azok az ösztönök és megérzések, amelyek korábban segítették az embert a túlélésben, a pénzügyi döntések területén gyakran haszontalanok, sőt sokszor éppen ezek teszik rossz befektetővé vagy kereskedővé az embert. Vizsgálatok sora áll rendelkezésünkre, amelyekből kiderül, hogy az emberi agy, a gondolkodásmódunk, az ösztönök és az érzelmek számos módon akadályozzák a racionális döntéshozatalt a kereskedés és a befektetés során. A fentieket alátámasztja a nyolc nagy amerikai brókercég ügyfelei között végzett felmérés eredménye is. Az alábbi táblázatból kiderül, hogy a nyereséggel kereskedők 87%-a rendelkezik kereskedési stratégiával, és mindössze 13%-uknak nincs stratégiája.

 

Stratégia nélkül kereskedik

Stratégiával kereskedik

Nyereséges 13% 87%
Nem nyereséges 43% 57%

A kereskedési stratégia, módszer tulajdonképpen egy szabályrendszer, amelyet a kereskedő előzetesen, tesztelések során alakított ki. A szabályrendszer pontosan meghatározza a kereskedő számára, hogy az egyes piaci helyzetekben mit csináljon. A szabályrendszer és a stratégia kialakításának lépéseiről itt beszéltünk.

A tőzsdét kipróbáló befektetők és kereskedők nagy része a valóságban eddig a pontig sem jut el. Ennek gyakran az az oka, hogy a kezdeti kudarcok, kisebb, és sokszor nagyobb veszteségek után belátja: a tőzsdei kereskedés nem neki való. A kezdők másik része viszont felismeri, hogy szüksége van szabályokra, összefüggések ismeretére és tudásra. Itt kezdődik a nehezebb rész, ugyanis kérdéses, hogy ezek a múltban működő szabályok és összefüggések mennyire megbízhatók. Sőt sokszor az is kérdéses, hogy egyáltalán működött-e a múltban az adott összefüggés, nemhogy megbízható becslést tudjunk adni a jövőbeni használhatóságára.

Hogyan szűrd ki a múltban sem működő módszereket?

Amint egy kezdő kereskedő elkezd foglalkozni a tőzsdei kereskedés mikéntjével, számos tanácsot és ajánlást kap, hiszen az interneten fellelhető blogok százai taglalják a különböző módszereket. Az egyes stratégiák, összefüggések megismerése során azonban az első lépésnek mindig annak kellene lennie, hogy megvizsgáljuk: működött-e egyáltalán a múltban a kérdéses összefüggés, vagy még arról sem beszélhetünk, hogy valaha is érvényes volt. Elég csak rákeresni a technikai elemzés különböző módszereire, amelyek között a japán gyertyákat, árfolyam-alakzatokat, illetve sok száz különböző indikátort találunk. Ezekről gyakran anekdotikus, felszínes leírások születnek, így vagy ezekre alapozva kezded el használni a módszert, vagy saját magad visszateszteled, esetleg megnézed, hogy valaki más végzett-e ilyen vizsgálatot. A technikai elemzés eszközei között valóban találunk olyan módszereket, amelyek a véletlennél jobb eredményt adtak a múltban, de nagyon sok olyan is van, amely a véletlennél sem megbízhatóbb. Például a japán gyertyaalakzatok 76%-a nem adott jobb eredményt a véletlennél, lásd itt. A fentiek a fundamentális mutatókra, arányszámokra is igazak, például a P/E, EV/EBIT vagy P/S mutatókra. Tudjuk, mit jeleznek és mit mutatnak, de vajon milyen eredménye lesz a kereskedésünknek, ha ezekre támaszkodunk? Erre is vannak válaszok, például: P/E ráta, mutató használata, 3 tanulmány eredménye.

Az első lépés tehát mindig az, hogy egy-egy módszer, stratégia vagy összefüggés vizsgálata során arra fókuszálunk: működött-e egyáltalán a múltban. Az alábbiakban bemutatunk néhány olyan problémát, amelyek ismerete segíthet abban, hogy kiszűrjük a tesztelési hibákat, amelyeket egyes tőzsdei módszerek és összefüggések vizsgálata során elkövethetnek az elemzők. Ezek miatt számos olyan tévhittel találkozhatsz a tőzsdéken, amelyek csak bizonyos feltételek fennállása mellett igazak. Nézzünk néhány példát.

1) Start date bias torzítás a tőzsdén

A start date bias tulajdonképpen azt jelenti, hogy a visszatesztelés eredménye attól függően változik, mikor indítjuk el a vizsgálatot. Vessünk egy pillantást az arany árfolyamára az elmúlt 50 évben. Azt láthatjuk, hogy az 1970-es években erőteljesen drágult az arany, néhány év alatt 100 dollárról 600 dollárra emelkedett az ára, ami 500%-os emelkedésnek felel meg. Ha pedig az 1970–1980 közötti időszakot nézzük, akkor az arany ára közel a tizenkilencszeresére nőtt. Ha ebből az időszakból indulunk ki, akkor az arany befektetési teljesítménye rendkívül jónak tűnik. Ha viszont kivesszük a buborékjellegű időszakot, már egészen más képet kapunk. Ez jól mutatja, hogy a kezdő időpont megválasztása jelentősen befolyásolhatja a végeredményt.

Az alábbi grafikonon a 10 éves lejáratú amerikai államkötvény hozama látható. Megfigyelhetjük, hogy az 1980-as évektől kezdődően egészen a 2000-es évekig meredeken esik a kötvények hozama. Ez pedig azt jelenti, hogy a kötvények árfolyama emelkedik. Ha egy elemzést ebből a különösen kedvező időszakból indítunk, akkor a kötvénybefektetések múltbeli hozama jóval kedvezőbbnek fog tűnni, mint egy hosszabb, kiegyensúlyozottabb mintán.

2) n=1 problémája, azaz alacsony esetszám torzító hatása

Sokat beszéltünk már az n=1 problémájáról, és gyakran ez áll a különböző tévhitek, médiában megjelenő félelemkeltő cikkek és jóslások mögött. Kimutatunk valamilyen összefüggést vagy válságjelzést, de elfeledkezünk arról, hogy mindezt nagyon kevés megfigyelés alapján tesszük. Általánosságban elmondható, hogy minél alacsonyabb az esetszám, annál megbízhatatlanabb a levonható következtetés. Ennek tükrében már érthetőbbé válik, hogy például egy engulfing japán gyertya 63%-os találati arányánál az is fontos, hány múltbeli eset alapján kaptuk ezt az eredményt. Ha például mindezt mindössze 10 megfigyelés alapján számoljuk ki, akkor nagy esély van rá, hogy nagyobb mintán egészen más arányt kapnánk. Minél több az esetszám, annál inkább közelít az eredmény a statisztikai átlaghoz. A példánkban az engulfing japán gyertya valószínűsége 14.148 múltbeli eseten alapult.

Az emberi agy könnyen elfogadja az egyszerű összefüggéseket, és gyakran nem foglalkozunk azzal, hogy az alacsony esetszám torzíthatja az eredményeket. Ez evolúciós szempontból érthető. Ha például egy csörgőkígyó megmar valakit, és az illető belehal, abból azonnal levonjuk a következtetést, hogy a csörgőkígyó harapása halálos. A pénzügyi világban viszont pont arra van szükség, hogy ne álljunk meg egyetlen vagy néhány esetnél, hanem minél több megfigyelést vegyünk figyelembe.

3) Sample selection bias, survivorship bias

A címbeli két megnevezés arra utal, hogy szándékosan vagy véletlenül szűrt adatokon, termékeken, illetve speciális időszakon végezzük a visszatesztelést, így az eredmények csak arra az időszakra vagy termékre lesznek jellemzők. Például kihagyunk bizonyos időszakokat, mert sejtjük, hogy egy hosszabb mintán rosszabb eredményt adna a stratégia.

A survivorship bias arra a hibára utal, hogy egyes részvényeket kihagyunk a visszatesztelésekből. Példaként képzelj el egy részvénykiválasztási rendszert, amelyet visszatesztelünk 1000 részvényen az utóbbi 10 évben. Azt tapasztaljuk azonban, hogy bizonyos részvényeknek nincs 10 évnyi adatuk, így ezeket kizárjuk a vizsgálatból. Ezzel pedig történetesen azokat a cégeket zárjuk ki, amelyek csődbe mentek, és ezért nincs adatunk róluk az utóbbi években. Azzal, hogy kizártuk a csődbe ment társaságokat, az eredményünk sokkal jobb lett, mint amilyen a valóságban lenne. Bővebben: Túlélési torzítás (survivorship bias) a tőzsde, befektetések területén.

Beszéltünk már arról is (részletek itt), hogy bár jelenleg néhány ezer társaságot találsz az amerikai tőzsdéken, 1967 és 2016 között összesen 25.000 társaság került az amerikai tőzsdékre, és ebből sok ezer már nincs jelen, mert csődbe ment.

Ha tehát ezeket az adatokat figyelembe vesszük, és az egyes részvények élethosszig tartó hozamát egy grafikonon ábrázoljuk, akkor jól látható, hogy a leggyakoribb eset a 100%-os veszteség. Az alábbi ábra x tengelyén az élethosszig tartó hozamok láthatók, az y tengely az esetszámot mutatja. Az x tengelyen a -1 és 0 közötti tartományban azok a részvények vannak, amelyekkel nem lehetett pozitív hozamot elérni, míg a 0-nál nagyobb értékek a pozitív hozamot jelzik.

Azzal tehát, hogy kihagyjuk a már nem kereskedhető társaságokat a tesztelésből, gyakorlatilag elkövetjük a survivorship bias hibát.

4) Delisting bias problémája a tőzsdén

A delisting bias problémája a tőzsdéről kivezetett társaságokhoz kapcsolódik. Arról van szó, hogy a kutatásokhoz gyakran a CRSP (Center for Research in Security Prices) adatbázisát használják a közgazdászok és elemzők, és ezen keresztül számítják ki az egyes portfóliók hozamát. A valóságban azonban előfordul, hogy társaságok csődbe mennek, felvásárolják őket, egyesülnek, a részvények átkerülnek más tőzsdére stb. Ezek eredményeként a céget kivezetik a tőzsdéről. A CRSP ugyan tartalmaz úgynevezett delisting return adatokat is, de ezek sok esetben hiányosak. Emiatt elképzelhető, hogy a visszatesztelés eredménye jobb képet mutat, mint amit a valóságban tapasztalnánk.

5) Curve fitting probléma a tőzsdén

A matematikában a curve fitting a görbeillesztést jelenti, vagyis különböző adatokhoz illesztünk egy görbét, hogy leírjuk az átlagos kapcsolatot. A pénzügyekben gyakori, hogy korrelációs vizsgálatot végzünk, vagyis megnézzük, hogy két adat között van-e lineáris kapcsolat. A lineáris regresszió eredménye egy, az adatokra illesztett egyenes. Erre jó példa a CAPE mutató (magyarázat a mutatóhoz itt), ahol azt vizsgáljuk, hogy a mutató értéke és a jövőbeni részvénypiaci hozam között van-e kapcsolat.

forrás: Robert J. Shiller

A fenti képen minden egyes pont a CAPE mutató értékét és a következő évi tőzsdei hozamot mutatja. Ha ránézünk erre a ponthalmazra, látható, hogy az adatok meglehetősen szórtan helyezkednek el. Magas CAPE, vagyis drága részvénypiac esetén is előfordulhat magas vagy alacsony jövőbeni hozam, és ugyanez igaz alacsony CAPE esetén is. Már ránézésre látszik, hogy a kapcsolat nem túl szoros. Ha pontosabbak akarunk lenni, lineáris regresszióval illesztünk egy egyenest a pontokra, amely enyhe negatív kapcsolatot jelez.

A tőzsdei kereskedők azonban a curve fitting alatt általában nem ezt a matematikai értelemben vett görbeillesztést értik, hanem azt, hogy egy stratégia paramétereit addig optimalizáltuk, amíg az in sample adatokon a lehető legjobb eredményt adta, de out of sample adatokon ez az eredmény már nem ismétlődött meg. Az alábbi grafikonon egy ilyen példát láthatunk. A General Electric részvényein egy mozgóátlag alapú kereskedési stratégia jelzései szerint lépünk piacra. A kék görbe azt mutatja, hogy az időszak végére a kezdeti 10 ezer dolláros egyenleg 25 ezer dollárra emelkedett, jelentősen felülteljesítve a vétel és tartás stratégiát.

A fenti stratégiában 11 havi mozgóátlagot használunk, amely 14,84%-os évesített hozamot eredményezett 0,65-ös Sharpe-ráta mellett. Ezzel szemben a vétel és tartás stratégia eredménye ugyanezen időszakon 7,87%-os évesített hozam és 0,29-es Sharpe-ráta volt. Az eredmények szépek, ugyanakkor ha csak kismértékben megváltoztatjuk a paramétereket, az előny gyakran eltűnik. Ha például nem 11, hanem 8, 9, 12 vagy 13 havi mozgóátlagot használunk, már nem feltétlenül kapunk ilyen jó eredményt.

Fontos tehát tisztában lenni azzal, hogy a paraméterek túlzott optimalizálásával szinte bármely módszer eredményessé tehető múltbeli adatokon, de ennek gyakran semmi köze nincs a stratégia valódi teljesítményéhez. Figyelmeztető jelzés, ha a rendszer paramétereinek kismértékű változtatása is lényegesen megváltoztatja az eredményt. A robusztus rendszer ezzel szemben számos eltérő időszakon, eltérő terméken és kisebb paraméterváltozások mellett is hasonló eredményt ad.

7) Overfitting probléma a részvénypiacokon

A curve fitting kifejezés inkább tőzsdei szlengnek tekinthető, a szakirodalom valójában overfitting néven tárgyalja a problémát. Nemcsak a forex robotok világában jelent gondot, hanem a professzionális befektetők és alapkezelők körében is az egyik leggyakoribb hiba. Ha egy kereskedési algoritmust fejleszt egy intézményi befektető vagy alapkezelő, alapvető elvárás, hogy a stratégia elérjen egy bizonyos Sharpe-ráta szintet. A Sharpe-ráta az egységnyi kockázatra vetített többlethozamot jelenti, és ebben az értelemben gyakran az S&P 500 index múltbeli Sharpe-rátája szolgál kiindulópontként. A probléma ott kezdődik, amikor a múltbeli adatokon gyengébben teljesítő módszereket nem vetik el, hanem további szabályokkal próbálják „megjavítani” őket. Ez a legtöbbször overfittinghez vezet.

A How should you discount your backtest PnL? című kutatás jó példát mutat erre. Az alábbi grafikonon látható, hogy az eredetileg gyengébb teljesítményt hozó változatot milyen könnyű „feljavítani” in sample adatokon, miközben ez a javulás a jövőben már nem feltétlenül jelentkezik.

forrás: How should you discount your backtest PnL?

8) Mit jelent a data mining?

A big data és az ehhez kapcsolódó fogalmak ma meglehetősen divatosak, a data mining pedig alapvetően a nagy mennyiségű adatokban rejlő információk és összefüggések kinyerését jelenti. Tőzsdei, pénzügyi értelemben természetesen nagy jelentősége van ennek, hiszen rengeteg adat áll a befektetők és kereskedők rendelkezésére. Kutatások széles köre foglalkozik különböző összefüggésekkel, de az interneten is százával találunk olyan kereskedési technikákat, amelyek múltbeli adatokon megfigyelt összefüggésekre épülnek. Ide tartoznak a technikai elemzés jelzései, például az RSI, a MACD, a Bollinger, a Parabolic SAR, a japán gyertyák, az alakzatok, illetve a fundamentális oldalon a value, quality, size, momentum és más hatások.

Ezek az összefüggések tehát valóban sok adat felhasználásával kerültek elő, de pénzügyi területen a data mining kifejezést gyakran pejoratív értelemben is használják: vagyis arra utalnak vele, hogy a kimutatott összefüggés valójában nem létezik, csak az adatok „ügyes” válogatásával sikerült látszólagos kapcsolatot találni. Ebben az értelemben a data mining egy visszatesztelési hiba, amelyet data snooping bias néven ismernek a kereskedők.

9) Mit jelent a data snooping bias?

A data snooping bias azt jelenti, hogy olyan összefüggéseket olvasunk ki a pénzügyi adatokból, amelyek a valóságban nem léteznek. Főleg akkor fordul elő, ha nagyon sok adatot, nagyon sok változót és nagyon sok lehetséges modellt vizsgálunk. Jó példa erre az indikátorok paramétereinek addig történő módosítása, amíg az adatsoron a legjobb eredményt nem kapjuk. Megtaláljuk az indikátor azon paramétereit, amelyek a legjobb múltbeli hozamot adták, azonban ez az eredmény lehet pusztán a véletlen műve is, és ha egy másik idősoron vagy a jövőben próbáljuk ki a stratégiát, már nem fog működni.

Sullivan és Timmermann tanulmányukban szemléletes példát mutatnak be erre. Amikor a közgazdászok elkezdték keresni azokat a megbízható összefüggéseket, amelyekkel az S&P 500 index hozama előre jelezhető, az egyik legjobban korreláló adat a bangladesi vajtermelés volt. Józan ésszel belátható, hogy a bangladesi vajtermelésnek semmi köze az S&P 500 indexhez, mégis, ha elég sok változót vizsgálunk, könnyen találhatunk ilyen véletlen együttmozgásokat.

Arra is láthattunk már példát, hogy módszertanilag korrektnek tűnő statisztikai kutatásokban is előfordulnak hibák. A hipotézisvizsgálatok során általában a nullhipotézis elutasításával próbáljuk alátámasztani az alternatív hipotézist. Például a value-prémium esetében a nullhipotézis az, hogy az olcsó és drága részvények közötti átlagos hozamkülönbség 0. Ha ezt elutasítjuk, akkor arra következtetünk, hogy a különbség nem nulla. Fontos azonban pontosan fogalmazni: a p-érték nem azt jelenti, hogy 5% az esélye annak, hogy a prémium nem létezik. Hanem azt, hogy ha a nullhipotézis igaz lenne, akkor mekkora valószínűséggel kapnánk a megfigyelthez hasonló vagy annál szélsőségesebb eredményt.

Miért követjük el a data snooping bias problémáját?

Fentebb már megbeszéltük a hipotézisvizsgálatok alapjait. Most egy egyszerű matematikai példán keresztül világítanék rá a felmerülő problémákra. Pierre de Fermat felfedezte, hogy bármely prímszám rendelkezik a következő tulajdonsággal:

2p-1 osztva p-vel mindig 1 maradékot ad, ahol p bármely prímszám.

Tegyünk egy próbát: 213-1 = 212 = 4096, amelyet 13-mal osztva 1 maradékot kapunk. Ez valóban igaz minden prímszámra.

Találtunk tehát egy összefüggést, ugyanúgy, ahogy egy tőzsdei kereskedő is különböző szabályokat és mintázatokat fedez fel a pénzpiacokon. A gond csak az, hogy attól, hogy egy állítás sok esetben igaz, még nem biztos, hogy jól el tudjuk különíteni azokat az eseteket, amelyekre valóban érvényes. A véletlen közbeszólhat. Léteznek például úgynevezett Carmichael-számok, amelyek nem prímszámok, mégis igaz rájuk a fenti feltétel. Ilyenek például: 561, 1105, 1729, 2465, 2821, 6601, 8911.

Vigyük tovább ezt a gondolatot a részvénypiacra. Tegyük fel, hogy olyan részvényeket keresünk, amelyek azonosítójában Carmichael-számok szerepelnek. Ha így visszatesztelünk egy szabályt, könnyen találhatunk egy-két jól teljesítő részvényt, és hajlamosak lehetünk azt hinni, hogy felfedeztünk egy új összefüggést. Valójában azonban ez lehet pusztán a véletlen műve.

Megnevezés

Érték

Havi átlaghozam

0,017

Havi átlaghozam szórása

0,142

Sharpe-ráta

0,86

Jensen-alfa

5,15

Teljes hozam

320,75 dollár

A fenti teljesítményadatok első ránézésre jónak tűnnek, különösen a 0,86-os Sharpe-ráta. Könnyű lenne ebből arra következtetni, hogy a Carmichael-számot tartalmazó azonosítójú részvények jól teljesítenek. Ez azonban téves következtetés, és a jó eredmény itt nagy valószínűséggel pusztán a véletlen műve.

A fenti példában több hibát is elkövettünk. Például a társaság túlélte a hosszú időszakot, ami önmagában is survivorship bias problémát vet fel. Tulajdonképpen olyan ez, mintha előre tudnánk, mely cégek maradnak életben a következő 65 évben, és utólag ezek közül válogatnánk. A neurális hálózatok és a nem lineáris tesztelési technikák ma már a kutatások szerves részét képezik, de ha nem vagyunk elég óvatosak, könnyen ugyanilyen hibás eredményekhez juthatunk velük is.

Az akadémikus kutatásokban is találunk hibákat

A tőzsdei kereskedők és befektetők szűk köre támaszkodik valóban módszertanilag kifogástalan visszatesztelésekre. Nagyon kevesen használnak olyan összefüggéseket, amelyek statisztikailag megbízhatóan lettek dokumentálva. Itt az oldalon több ilyen összefüggésről is beszámoltunk, elég csak az asset growth hatásra, a value-faktorokra, a jövedelmezőségi mutatókra, a részvénypiac kockázati prémiumára vagy a size-effektre gondolni. Ezeknek a vizsgálatoknak a sajátossága, hogy általában arra fókuszálnak: kimutatható-e hozamkülönbség bizonyos részvénycsoportok között. Ha igen, akkor valóban találtunk egy összefüggést, amely akár fel is használható a gyakorlatban. A probléma az, hogy a sok száz publikált összefüggés közül nem mindegyik statisztikailag szignifikáns és módszertanilag megfelelő. Ahhoz, hogy ezt megítéljük, két fontos mérőszámmal kell megismerkednünk: a t-stat értékkel és a p-értékkel.

1) T-stat mutató jelzései a tőzsdéken

A legtöbb statisztikai vizsgálat során találkozunk az úgynevezett t-stat értékkel. Ez lényegében azt mutatja, hogy a becsült hatás mennyire nagy a becslési bizonytalansághoz képest. Sok esetben, ha a t-stat abszolút értéke 2 körül vagy annál nagyobb, akkor az eredményt 5%-os szinten statisztikailag szignifikánsnak tekintik. Fontos azonban pontosan fogalmazni: ez nem azt jelenti, hogy 95% a valószínűsége annak, hogy az összefüggés biztosan létezik. Inkább arról van szó, hogy a nullhipotézis mellett ekkora vagy ennél szélsőségesebb eltérés ritkán fordulna elő.

  • Részvénypiac kockázati prémiuma = részvénypiac éves hozama – rövid lejáratú kötvény hozama
  • Value prémium = értékalapon olcsó (P/B) részvények hozama – értékalapon drága részvények hozama
  • Size prémium = alacsony kapitalizációjú részvények hozama – nagy kapitalizációjú részvények hozama

Az amerikai tőzsdét vizsgálva a részvénypiac kockázati prémiuma átlagosan 8,24% évente, és a prémium az esetek 68,1%-ában pozitív volt az elmúlt 90 évben. A vizsgálat t-stat értéke 3,91, ami erős statisztikai bizonyítéknak tekinthető arra, hogy a prémium nem pusztán a véletlen műve.

A value-prémium évente átlagosan 4,7%-os többlethozamot jelentett, és az elmúlt 91 év 61,5%-ában pozitív volt. Az alábbi ábrán látható, hogy a t-stat érték 2 fölött van, ami szintén statisztikailag szignifikáns eredményre utal.

A size prémium évente átlagosan 4,05%-os hozamkülönbséget jelentett az alacsony és a nagy piaci kapitalizációjú részvények között, az alacsony piaci kapitalizációjú cégek javára. A t-stat érték itt is 2 fölött van (2,45), ami ismét arra utal, hogy az eredmény nem pusztán a véletlenből adódik.

Fontos azonban tisztában lenni azzal, hogy ha a t-stat érték kisebb, mint 2, az nem jelenti automatikusan azt, hogy az összefüggés nem létezik. Alacsony esetszám vagy nagy szórás mellett valódi kapcsolat esetén is kaphatunk alacsonyabb t-stat értéket.

2) P-value értékek vizsgálata a tőzsdei módszerekben

A közgazdászok és elemzők által széles mintán, több ezer részvényen visszatesztelt összefüggések esetében gyakran közlik a p-value-t, magyarul p-értéket. A p-érték 0 és 1 közötti szám, és statisztikailag akkor szokás szignifikánsnak tekinteni egy eredményt, ha a p-érték kisebb vagy egyenlő, mint 0,05. A p-érték azonban nem azt mutatja meg, hogy mekkora az esélye annak, hogy a nullhipotézis igaz, hanem azt, hogy ha a nullhipotézis igaz lenne, akkor mekkora valószínűséggel kapnánk a megfigyelthez hasonló vagy annál szélsőségesebb eredményt.

Például a value-prémium esetében a nullhipotézis az, hogy az olcsó és drága részvények közötti átlagos hozamkülönbség 0. Ha a p-érték 0,05 alatti, akkor az eredmény statisztikailag szignifikánsnak tekinthető, de ebből még nem következik automatikusan, hogy a hatás a jövőben is ugyanolyan erős lesz, vagy hogy gazdaságilag is jelentős.

3) P-hacking technikák

A különböző kutatások és vizsgálatok eredménye szempontjából a p-érték sokszor elsődleges szemponttá vált. Ez pedig oda vezethet, hogy a kutatók tudatosan vagy tudattalanul addig alakítják a mintát, a változókat vagy a specifikációt, amíg a p-érték 0,05 alá nem csökken. Ezt nevezzük p-hackingnek. Ezekre a problémákra Regina Nuzzo hívta fel a figyelmet, és bár a jelenség nemcsak a pénzügyi kutatásokra jellemző, a tőzsdei anomáliákkal foglalkozó vizsgálatokban is megfigyelhető.

Elég belepillantani például Yan Liu és Heqing Zhu munkájába. A vizsgálatból jól látszik, hogy rövid idő alatt rendkívül sok új tőzsdei összefüggést fedeztek fel, amelyek közül sok vagy egyáltalán nem létezik, vagy gazdaságilag túlságosan gyenge ahhoz, hogy gyakorlati jelentősége legyen. Emiatt egyes kutatók már azt javasolják, hogy az 5%-os szint helyett szigorúbb, 1%-os szignifikanciaszintet használjunk.

Miért romlanak el idővel a tőzsdestratégiák?

A szisztematikus, más néven mechanikus tőzsdestratégiák alkalmazása során szigorú, jól leírt szabályok alapján történik a portfólió kialakítása és a pozícióba lépés. A szabályok jellemzően a múltban megfigyelt összefüggéseken alapulnak, például value-, size- vagy jövedelmezőségi prémiumon. Tipikus példa a momentum stratégia, de az algoritmikus kereskedési rendszerek is ebbe a körbe tartoznak.

Az elmúlt években számos vizsgálat rámutatott arra, hogy a múltbeli adatokon megfigyelt összefüggések a jövőben csak korlátozottan alkalmazhatók. Az egyik ismert kutatást a Quantopian vezetői készítették. A Quantopian egy közösségi finanszírozással létrejött hedge fund volt, amely ingyenes platformot biztosított algoritmusok fejlesztésére és visszatesztelésére. A felhasználók öt év alatt rendkívül nagy számú visszatesztelést végeztek, és ebből egy részt out of sample adatokon is megvizsgáltak.

A kutatás részleteit itt olvashatod el, de a fő megállapítások közül kiemelném ezt:

„Specifically, we find that commonly reported backtest evaluation metrics like the Sharpe ratio offer little value in predicting out of sample performance (R² < 0.025).”

Ez nagy vonalakban azt jelenti, hogy a múltbeli adatokon kimutatott teljesítmény és a jövőbeni adatokon kimutatott teljesítmény között nagyon gyenge a kapcsolat. Az alábbi ábrán is ez látható.

forrás: All that glitters is not gold..

Egy másik, 2019-es kutatásban a közel 300 ismert tőzsdei összefüggés közül 72 jól ismert anomáliát vizsgáltak meg. Az eredmény hasonló volt: out of sample adatokon romlott a teljesítmény.

forrás: Why and How Systematic Strategies Decay

A következő táblázatban a 72 összefüggéssel kinyerhető többlethozamok Sharpe-rátája látható. A teljes mintán átlagosan 0,98-as Sharpe-rátát mértek, az in-sample legjobb módszerek átlagos Sharpe-rátája pedig 1,15 volt.

forrás: Why and How Systematic Strategies Decay

A következő grafikon azt mutatja, hogy a publikáció előtti magas Sharpe-ráta jellemzően alacsonyabb out of sample Sharpe-rátával járt együtt. Átlagosan 43%-kal csökkent a Sharpe-ráta out of sample adatokon.

forrás: Why and How Systematic Strategies Decay

3 tényező, amely árulkodik a problémáról

A fenti vizsgálatban összesen 11 tényezőt vizsgáltak meg, amelyek összefüggésbe hozhatók a szisztematikus stratégiák hozamának hanyatlásával. Ebből 6 bizonyult igazán lényegesnek.

1. A publikáció dátuma

Az egyik legerősebb előrejelző az out of sample hozamok csökkenésére a publikáció dátuma. Általánosságban megfigyelhető, hogy a közelmúltban felfedezett összefüggések lényegesen gyengébben teljesítenek out of sample adatokon.

2–3: Arbitrázs

A második és harmadik tényező az arbitrázzsal függ össze, vagyis azzal, hogy a feltárt összefüggések mennyire kiaknázhatók költséghatékonyan. Minél könnyebben és olcsóbban lehet kihasználni egy anomáliát, annál hamarabb tűnik el.

4–6: Overfitting problémák

A 4–6. változók az overfitting, túloptimalizálás problémáját jelzik. Ide tartozik például a modell rugalmassága, a paraméterek túlzott finomhangolása, illetve az, ha az összefüggés csak kisebb mintán mutatható ki erősen.

A fentiekből jól látható, hogy érdemes már a tesztelés fázisában számolni azzal, hogy a jövőbeni adatokon a stratégia eredményei gyengébbek lehetnek. Emellett fontos megismerni a kritikus pontokat is: t-stat, p-érték, data mining, overfitting, small sample bias stb.

Mire figyelj a tőzsdei összefüggések vizsgálata során?

Fentebb látható volt, hogy a t-stat és a p-érték jó kiindulási pontnak tekinthető, de érdemes arra is odafigyelni, hogy a vizsgált összefüggés a gyakorlatban is használható-e. Az alábbi egyszerű szempontok segíthetnek ebben.

1) Mennyire megbízható a tőzsdei összefüggés?

Egy-egy kimutatott hozamkülönbség vagy prémium nem feltétlenül pozitív minden időszakban. A pozitív átlag sem jelenti azt, hogy rövidebb távon mindig nyereséges lesz a stratégia. Az alábbi táblázat azt mutatja, hogy meghatározott időtávon mekkora az esélye annak, hogy egy ismert prémium pozitív hozamot ad.

 

1 év

3 év

5 év

10 év

Size 59% 66% 70% 77%
Value 63% 72% 78% 86%
Momentum 72% 84% 90% 97%
Beta 66% 76% 82% 91%

Annak a valószínűsége tehát, hogy egyéves időtávon a size effekt kihasználásával többlethozamunk lesz, 59%, value faktorok esetén 63%, momentum esetén 72% stb.

2) Mennyire széles körű a tőzsdei összefüggés?

Arra a kérdésre keressük a választ, hogy a kimutatott összefüggés más tőzsdéken, más piacokon is megfigyelhető-e. Számos olyan tőzsdei anomália létezik, amely nemcsak az amerikai részvénypiacon működik, hanem például az európai vagy a japán piacon is, akár gyengébb, akár erősebb formában.

3) Mennyire erős, robusztus a megfigyelés?

Fontos odafigyelni arra is, hogy a kimutatott összefüggést ne csak egyetlen vizsgálat támassza alá. Az is lényeges, hogy ne csak egyetlen paraméterezés mellett működjön. Vegyük például a value-faktort. Ezt vizsgálhatjuk P/B, P/E, P/S vagy EV/EBIT mutatóval, és mindegyik alapján kimutatható valamilyen mértékben a value-prémium. Ez növeli az összefüggés robusztusságát.

4) Mennyire lehet kihasználni a gyakorlatban?

A kérdés itt arra irányul, hogy ha a jutalékokat, adókat és más költségeket is figyelembe vesszük, akkor is kihasználható-e a feltárt összefüggés. Ez nem mindig van így. Például a short term reversal effekt esetében a költségek könnyen felemészthetik az előnyt. Arra is ügyeljünk, hogy az alulárazott helyzeteket általában könnyebb befektetési stratégiákba illeszteni, míg a túlárazott helyzetek kihasználásához sokszor short ügyletekre vagy long-short stratégiákra van szükség.

5) Logikus magyarázat az összefüggés létezésére?

Figyeljünk oda arra is, hogy a különböző tőzsdei összefüggések és anomáliák mögött rendszerint valamilyen elméleti magyarázat áll. Gyakoriak a kockázatalapú vagy viselkedési magyarázatok. Érdemes ezeket is tisztázni, és logikus magyarázatot találni arra, miért létezhet az adott összefüggés.

Működni fog a jövőben a kiválasztott kereskedési módszer a tőzsdén?

Eddig arról beszéltünk, hogy a kiszemelt stratégia, módszer vagy anomália a múltban létezett-e, és nem pusztán szándékos vagy véletlen tesztelési hiba miatt volt kimutatható. Ezek után azonban azt is tudni kell, hogy semmilyen garancia nincs arra, hogy a hatás a jövőben is ugyanolyan erősen megfigyelhető lesz. Ráadásul az is előfordul, hogy amikor egy összefüggés széles körben ismertté válik, a hatása fokozatosan csökken.

Emellett a legmegbízhatóbb összefüggések esetében is igaz, hogy nem minden évben hoznak eredményt. Ahogy fentebb láthattuk, egyes prémiumok a múltban is csak az esetek 50–70%-ában voltak pozitívak. Senki ne várja tehát azt, hogy a tőzsdestratégiák 100%-os biztonsággal működnek majd a jövőben. Mindenesetre, ha a kereskedő ki tudja szűrni a tévhiteket, a megalapozatlan összefüggéseket és a múltban sem működő stratégiákat, akkor már nagyon sokat tett azért, hogy ne pazarolja a pénzét és az idejét rossz módszerekre.

Tanfolyamaink – fejleszd pénzügyi tudásod!

Ha szeretnél elmélyedni a befektetések világában, válassz az alábbi gyakorlatorientált képzések közül:

  • Befektetés: kezdőknek szóló tanfolyam a portfóliókialakításról, részletek itt.
  • Tőzsdei kereskedés: magyar és külföldi piacok gyakorlati bemutatása, technikai és fundamentális elemzéssel, részletek itt.
  • Daytrade kereskedés: intenzív, rövid távú stratégiák devizákkal és részvényekkel, napi kereskedőknek, részletek itt.
  • Bitcoin és kriptoeszközök: modern, jövőorientált képzés a legújabb blokklánc-trendekről és kriptokereskedésről, részletek itt.
  • Adatelemzés: kvantitatív módszerek gyakorlati bemutatása valódi tőkepiaci adatokon, programozás nélkül, részletek itt.