Nagy nyelvi modelleknél (ChatGPT) egyszerűbb megoldások is hatékonyak

2023.07.19. (sze) - 11:59

Kategória:

Az olyan nagy nyelvi modellekkel, mint a ChatGPT és annak pénzügyi adatokon betanított változatával (Bert) kapcsolatban jelentős várakozások fogalmazódtak meg a befektetők részéről, és sokan úgy gondolják, hogy ezek a rendszerek a minden probléma megoldására alkalmas, univerzális eszközök lesznek. A témával kapcsolatos új vizsgálat azonban rámutatott két fontos tényezőre. Az egyik, hogy a nagy nyelvi modellek használata erőforrás-igényes (energiafelhasználás, karbonlábnyom), másrészt pedig egyes feladatokat a sokkal egyszerűbb nyelvi modellek is hasonló hatékonysággal képesek elvégezni. Témáink:

Mire használhatók a pénzügyek területén a fejlett nyelvi modellek?
Pénzügyi adatok algoritmikus feldolgozása
A nyelvi modellek versenye

Mire használhatók a pénzügyek területén a fejlett nyelvi modellek?

Sokan azt gondolják, hogy hamarosan majd csak mesterséges intelligenciával támogatott algoritmusok fognak kereskedni a tőzsdén, akikkel szemben az átlagos befektetőnek nem lesz esélye. Azonban ettől még nagyon messze van a mesterséges intelligencia fejlesztése, ráadásul, ha elméletileg elképzeljük ennek megvalósulását, és minden piaci szereplő tökéletes előrejelzéseket képes készíteni a részvénypiacon, akkor a kinyerhető többlethozam nullára csökkenne. Ennek következménye, hogy a befektetők a részvénypiac kockázati prémiumát tudnák kinyerni, mely jelenlegi is az alapvető célja a hosszú távú részvénypiaci befektetőknek. Mindenesetre vizsgálatok rámutattak arra, hogy a nagy nyelvi modellek hatékonyabbak elődjeiknél, így például beszámoltam arról, hogy a ChatGPT jobban értelmezi elődjeinél a Fed sajtótájékoztatókat, de hatékonyan használható arra is, hogy a híreket feldolgozva értékelje a részvénypiaci hangulatot, és erre az információra alapozva sikerült többlethozamot hozó stratégiát kialakítani (részletek itt). Egy másik cikkünkben arról is beszéltünk, hogy a nagy nyelvi modellek pénzügyi adatokra felépített változatával (Bert) végzett kísérletek azt mutatják, hogy a gyorsjelentéseket is képes értelmezni a rendszer, sőt a gyorsjelentésekre betanított FtBert még hatékonyabban végzi el a feladatot. Arról is beszéltünk, hogy felsőfokú végzettséggel rendelkezők munkájának hatékonyságát is képes javítani a ChatGPT (vizsgálatokról itt beszéltünk). Egy új tanulmányban pedig két feladaton tesztelték vissza a nagy nyelvi modellek legújabb változatait, és az eredményeiket összevetették a korábbi módszerekkel.

Pénzügyi adatok algoritmikus feldolgozása

Érdemes tisztában lenni azzal, hogy a tőkepiaci, pénzügyi adatok algoritmikus feldolgozásának közel két évtizedes múltja van, azaz a ChatGPT bemutatkozása előtt is léteztek, és használta hasonló algoritmusokat, nagyrészt a hírfeldolgozás, a hangulatmérés, a gyorsjelentések értelmezése területén. Én is beszámoltam többi ilyen vizsgálatról az elmúlt években, például a gazdasági adatok és a következő napok árváltozása közötti kapcsolat (lásd itt), a gyorsjelentések tartalmi változása és az árfolyam kapcsolata, illetve a gyorsjelentésekben előforduló negatív szavak és a jövőbeni hozam kapcsolata közötti összefüggések kutatása (lásd itt). Ezek a vizsgálatok mind a korábbi nyelvi modellek segítségével készültek.

A legegyszerűbbek egyszerűen szótárakat használnak, melyekben a vizsgálandó szavak, kifejezések felsorolásra kerülnek. A legkorábbi modellek a Harvard IV-4 szótárt használták erre a célra, de 2011-ben Loughran és McDonald összeállított egy specializált szótárt, mellyel sokkal pontosabban lehetett értelmezni a tőkepiaci tartalmakat. A szótárakat használó algoritmusok után a következő lépcsőfokot a Word2Vec és a Doc2Vec programok jelentették. Ezek már újabb, 2013-ban megjelenő nyelvfeldolgozási technikák, amelyeknél az algoritmus képes szóasszociációk megtanulására egy nagyobb szövegadatbázis segítségével. Ezek a modellek már képesek felismerni szavakat, kifejezéseket a betanítás után. A következő lépcsőfokot pedig a ChatGPT jelentette, ahol a betanulás után teljes mondatok, szövegek értelmezése vált lehetővé. A nagy nyelvi modellek pénzügyekre tanított változatát BERT néven találjuk meg, ennek módosított, gyorsjelentésekre, pénzügyi beszámolók értelmezésére készített változata az FtBert, FinBert. Az alábbiakban tárgyalásra kerülő vizsgálatban pedig a fenti modellek feladatmegoldási hatékonyságát vizsgálták meg.

A nyelvi modellek versenye

A Can AI Explain Company Performance.. cím alatti vizsgálatban két különböző feladat végrehajtási pontosságát vizsgálták meg a ChatGPT, a BERT, a FinBERT, LSI, Word2Vec, Doc2Vec rendszereken.

Az első feladata az volt az algoritmusoknak, hogy fel kellett ismerniük a társaságot a gyorsjelentések (10-K form) és a gyorsjelentésekhez kapcsolódó prezentáció (earnings call) alapján. A vizsgálatnak az a lényege, hogy a gyorsjelentés 10-K néven elérhető dokumentuma és a befektetőknek készített prezentáció nyelvezete, tartalma hasonló, így meg lehet határozni, hogy összetartoznak. Az első feladat végrehajtásában a ChatGPT teljesített a legjobban, ugyanakkor minden kategóriában (lásd grafikon x tengely) a Word2Vec jobban teljesített, mint a BERT vagy a FinBERT.

forrás: Can AI Explain Company Performance..

A második feladatban a gyorsjelentések tanulmányozása volt a cél, és a feldolgozott adatok alapján kellett megbecsülnie az algoritmusnak, hogy várhatóan mekkora meglepetés éri a piacot. A meglepetés az elemzői konszenzus és a tényleges nyereségadat különbsége, azaz ha a közzétett tényadat nagyobb, mint az elemzői várakozás, akkor pozitív meglepetés érte a piacot. Fordított esetben pedig negatív meglepetésről beszélünk. Az alábbi grafikonon az algoritmusok által megbecsült meglepetések mértéke látható, de a minta öt részre lett bontva a meglepetés mértéke alapján.

forrás: Can AI Explain Company Performance..

A grafikonból az derül ki, hogy gyakorlatilag mindegyik nyelvi modell hasonló teljesítményt ért el a feladat során. Ha a két szélsőséges kategóriát (0 és 4) vizsgáljuk, akkor azt látjuk, hogy a BERT hozta a legjobb teljesítményt. Ezt támasztja alá a regressziós vizsgálat is, melyben a BERT algoritmusnak lett a legmagasabb R²- tényezője.

Összességében tehát azt láthatjuk, hogy az első feladatban a ChatGPT kiemelkedően teljesített, de a második feladat végrehajtásában az olyan egyszerű modellek, mint a Word2Vec is haténynak bizonyult. Ezek az adatok is megerősítik azt, hogy nem minden területre, feladathoz van szükség drága, erőforrás-igényes megoldásokra, mert a korábban kifejlesztett egyszerű megoldásokkal is hasonló eredményt lehet elérni

Ha kérdésed van a fentiekkel kapcsolatban, hozzá szeretnél szólni a témához, csatlakozz facebook csoportunkhoz ide kattintva!

Tanfolyamaink:

Befektetési alapismeretek, stratégiák, részletek itt.
Tőzsdei kereskedés magyar és külföldi piacokon, részletek itt.
Rövid távú, daytrade kereskedés devizákkal, részvényekkel, részletek itt.
Bitcoin és kriptoeszközök képzés, részletek itt.

Új tartalmak

Kérdés: külföldi kötvények, kötvény ETF problémák [Előadás]

Hallgatói kérdéseket beszélünk meg az alábbi témákban: Külföldi kötvény adózási kérdések Egyedi külföldi kötvény vásárlása Külföldi kötvény ETF alapok Melyik a célravezetőbb? "US Államkötvénybe szeretnék befektetni, (befektetési horizont 4-5 év). Nem egyszerű döntést hoznom, mivel kötvény alapú ETF esetében, és az Interactive Brokers-nél kereskedhető kötvények más más rizikót hordoznak. Nagyon hálás lennék, ha az alábbi komplex kérdésem ellenére egy kis útmutatót vagy összegzést kapnék öntől, mivel nincs kellő tapasztalatom ezen a téren. 1. , Interactive Brokers US Treasury - Legoptimálisabb...

Több ESG, kevesebb céges csalás és manipuláció?

Cikkünkben az ESG-szempontokat figyelembe vevő befektetéssel foglalkozunk. A témával kapcsolatban beszámolok egy újabb, több száz részvényen végzett vizsgálatról, mely a társaságok ESG minősítése és a társaságok által elkövetett, befektetőket megkárosító visszaélések, csalások közötti kapcsolatot mutatta ki. Témáink: Az ESG lehetséges előnyei/hátrányai Több ESG, kevesebb csalás és manipuláció? Az ESG és a vállalatok pénzügyi teljesítménye Az ESG lehetséges előnyei/hátrányai Kétségtelen, hogy az ESG (környezeti, fenntarthatósági, irányítási szempontok) az elmúlt években rendkívül divatos...

A kötvényalapoknál számít a szakértelem?

Az alábbiakban egy 2007-2020 közötti, 3016 db aktívan kezelt kötvényalapokra kiterjedő vizsgálat részleteit beszéljük meg, melyből kiderül, hogy az alapkezelői szakértelemnek a kötvényalapok esetében van némi jelentősége. Ez alapvetően ellentmondásban van az aktívan kezelt részvényalapokkal összefüggő vizsgálatokkal. A szerencse hozzáértés problémája az alapkezelésben Vizsgálatok széles köre áll a rendelkezésünkre, melyekből kiderül, hogy az alapkezelési iparág szereplőinek többsége nem képes a felülteljesítésre. Több ezer befektetési alapon végzett vizsgálatok eredményei az alábbi adatokkal...

Népszerűtlen, unalmas részvények: Magasabb hozamot hoznak a tőzsdén?

Bejegyzésünkben az ún. neglected firm effect összefüggéssel foglalkozunk, melynek alapja, hogy a kevésbé ismert, népszerűtlen társaságok részvényei nagyobb hozamot hoznak, mint az ismert, népszerű társaságok részvényei. Megnézzük a múltbeli vizsgálatokat, kiderítjük, mi az oka ennek az anomáliának. Témáink: Mit kell tudni az elhanyagolt tőzsdei társaságokról? Hogyan, hol találhatunk elhanyagolt cégeket? Mit jelent az elhanyagolt cég effektus? Lehet, hogy nem is létezik az elhanyagolt cég effektus? Későbbi vizsgálatok nem tudták kimutatni az elhanyagolt cég anomáliát? Mit kell tudni az...

Mi történt a gazdaságban, részvénypiacokon? 04-29 [Előadás]

Az előadásunkban összefoglaljuk, hogy mi történt a héten a gazdaságban, a tőkepiacokon. USA: Advanced GDP 1,6% q/q (2,5%, 3,4% Fogyasztás (69%): +2,5%, +4% szolgáltatás, -0,4% tartós javak Beruházások (18%): +3,2% Kormányzati szektor (17%): +1,2% Külkereskedelem. Export +0,9%, import +7,2% GVA tábla Új lakások értékesítése 693 ezer Medián eladási ár 430.700, átlagos 524.800 dollár Heti újonnan munkanélkülis segélyért folyamodók száma PCE infláció: 3,9% m/m Csökken a kamatvágás valószínűsége Hozamgörbe alakulása Csökkenő optimizmus Gyorsjelentések: 46% jelentett 77% várt feletti EPS 8,4%...

A klímaváltozás gazdasági hatásai 173 ország (1970-2020) adatai alapján

Az IMF közzétett egy részletes vizsgálatot a klímaváltozás inflációra, gazdasági növekedésre gyakorolt hatásaival kapcsolatban. Vizsgálatukban 1970-2020 közötti időszakon, 173 ország gazdaságát áttekintve mutattak ki összefüggést a különböző klímaesemények (hősokkok, aszályok, viharok) és az infláció, illetve a gazdasági növekedés között. Cikkünkben a vizsgálat részleteit beszéljük meg. Témáink: A klímaváltozás gazdasági kockázatai A klímaváltozás hatása az inflációra A klímaváltozás hatása a gazdasági növekedésre A klímaváltozás jövőbeni gazdasági hatása Milyen mértékben árazzák a befektetők...

Kérdés: Diworsification, azaz a túlzott diverzifikáció [Előadás]

Előadásunkban a túlzott diverzifikáció, azaz a diworsification problémájával foglalkozunk az alábbi témák mentén: A részvények diverzifikációja akadémikus kutatásokban nem vita tárgya A portfólió diverzifikáció Markowitz-modellje alapján nem vita tárgya Diverzifikáció = alacsonyabb kockázat,de gyakran a kockázattal nem azonos arányban csökken a hozam Sokszor azonban a kockázattal együtt csökken a hozam, de a kockázat elviselése a gyakorlatban nehezebb, mint elméletben. A kockázatot mindig könnyebb elviselni a múltba visszatekintve Diworsification nem létezik az MPT alapán A túlélési torzítás...

ESG-tanúsítványok eredményei megkérdőjelezhetők?

Bejegyzésünkben egy az ESG indexekkel kapcsolat vizsgálatról számolok be, mely az egyik legnagyobb ESG tanúsítványt, indexet készítő társaság, az MSCI indexalkotási gyakorlatát kutatta 2009-2020 közötti időszakon. Témáink: Az ESG-tanúsítványok problémái Bizonyítékok az ESG-tanúsítványok problémáira.. A Refinitiv ESG-minősítése és az adatok utólagos kitöltése Kétségtelen, hogy az ESG (környezeti, fenntarthatósági, irányítás szempontok) az elmúlt években rendkívül divatos területévé vált a befektetéseknek, azonban, ahogy korábbi cikkünkben megbeszéltük, az ESG alapvetően nem a magas hozamról...

MAD effect: Mit jelent? Megbízhatóan jelzi a tőzsdén a jövőbeni hozamot?

A cikkünk témája a közelmúltban megfigyelt, mozgóátlagokhoz kapcsolódó összefüggés, mely hasonlóan más tőzsdei anomáliákhoz megbízhatóan jelzi a részvények jövőbeni hozamát. Az alábbiakban megbeszéljük a MAD effect lényegét, arról is szó lesz, hogy mekkora többlethozamot lehet kinyerni a hatással, szó lesz az effektusra épülő tőzsdestratégia eredményéről is. Mielőtt azonban a részleteket megtárgyaljuk, kitérünk a MAD-hatás alapját jelentő mozgóátlagok jelzéseire is. Témáink: Mozgóátlag stratégiák típusai Milyen szerepe, jelzései vannak a mozgóátlagoknak? Van bizonyíték a mozgóátlagok...

Kérdés: Portfóliókialakítás 5 éves időtávon [Előadás]

Hallgatói kérdések nyomán foglalkozunk az 5 éves befektetési időtávval, a portfóliókialakítás szempontjaival. Hallgatónk kérdései: 1. Diverzifikációs szempontok. Kicsit elakadtam abban, hogy a portfólió részvény része mekkora %-os eloszlásban tartalmazzon: S&P 500,MSCI ACWI,MSCI WORLD index követő ETF alapot. (Befektetési időtávom 4-5 év.) Példa:. (60%Stock/40%Bond) Portfólió 1.1 - S&P 500 60% + 40% Bond. 1.2 - S&P 500 30% + MSCI ACWI 30% + 40% Bond. 1.3 - S&P 500 20% + MSCI ACWI 20% + MSCI WORLD 20% + 40% Bond. 1.4 - MSCI ACWI 60% + 40% Bond. Mi alapján határozzuk meg ezt az...

további cikkek >>

Jogi nyilatkozat: Az oldalon megjelenő tartalom magánvélemény, kérjük ne alapozz rá semmilyen befektetési döntést! Az oldalra felkerülő tartalom kizárólag információs célt szolgál és nincs figyelemmel egyetlen felhasználó befektetési céljaira sem, és nem minősül befektetési tanácsadásnak. Az itt található információ csak jelzés értékűnek tekinthető, mivel annak pontossága és teljessége nem garantált. A kereskedési illetve kockázatkezelési döntések meghozatalakor nem javasolt az oldalon található információkra támaszkodni, az elhangzott vélemények és értelmezések előzetes értesítés nélkül bármikor módosíthatóak.

Az oldalon található tartalom semmilyen esetben nem minősíthető befektetésre való ösztönzésnek, értékpapírvásárlásra vagy -eladására vonatkozó felhívásnak, még abban az esetben sem, ha valamely befektetési módszerrel kapcsolatos leírás eladás vagy vétel mellett foglal állást! A jelen oldalon található információk és elemzések a szerzők magánvéleményét tükrözik. A jelen oldalon megjelenő írások nem valósítanak meg a 2007. évi CXXXVIII törvény (Bszt.) 4. § (2). bek 8. pontja szerinti befektetési elemzést és a 9. pont szerinti befektetési tanácsadást. Az előbb írtakra tekintettel az oldal üzemeltetője, szerkesztői, szerzői, a kiadó kizárják mindennemű felelősségüket az oldalon elérhető információra vagy adatra alapított egyes befektetési döntésekből származó bármilyen közvetlen vagy közvetett kárért vagy költségért.