تجزیه و تحلیل روابط سهام مبتنی بر GCN برای پیش بینی بازار سهام

ساخت وبلاگ

doi 10. 7717/peerj-cs. 1057 منتشر شده 2022-08-11 پذیرفته شده 2022-07-14 دریافت شده 2022-03-27 ویرایشگر دانشگاهی QICHUN ZHANG زمینه های موضوع هوش مصنوعی ، داده کاوی و یادگیری ماشین ، کلمات کلیدی گرافیک پیش بینی سهام ، چند منظوره ، چند منظرهرابطه سهام ، سری زمانی ، یادگیری مبتنی بر گراف ، LSTM کپی رایت © 2022 ژائو و همکاران. مجوز این یک مقاله دسترسی آزاد است که تحت شرایط مجوز انتساب Creative Commons توزیع شده است ، که امکان استفاده ، توزیع ، تولید مثل و سازگاری بدون محدودیت را در هر رسانه و به هر منظور به شرط اینکه به درستی نسبت داده شود ، امکان پذیر است. برای انتساب ، نویسنده اصلی (ها) ، عنوان ، منبع انتشار (علوم کامپیوتر PEERJ) و یا DOI یا URL مقاله باید ذکر شود. به این مقاله Zhao C ، Liu X ، Zhou J ، Cen Y ، Yao X. 2022 اشاره کنید. تجزیه و تحلیل روابط سهام مبتنی بر GCN برای پیش بینی بازار سهام. علوم کامپیوتر Peerj 8: E1057 https://doi. org/10. 7717/peerj-cs. 1057

خلاصه

بیشتر مدل های پیش بینی قیمت سهام صرفاً به اطلاعات تاریخی سهام هدف برای پیش بینی قیمت های آینده متکی هستند ، جایی که اثرات پیوند بین سهام مورد غفلت واقع می شود. با این حال ، گروهی از مطالعات قبلی نشان داده اند که اهرم همبستگی بین سهام می تواند پیش بینی ها را به میزان قابل توجهی بهبود بخشد. در این مقاله یک مدل چند عاملی رابطه ای سری یکپارچه (TRMF) ارائه شده است ، که یک الگوریتم روابط خود ایجاد کننده (SGR) را تشکیل می دهد که می تواند به طور خودکار ویژگی های رابطه ای را استخراج کند. علاوه بر این ، مدل TRMF روابط سهام را با سایر ویژگی های چند بعدی برای پیش بینی قیمت در مقایسه با آثار موجود ادغام می کند. اعتبار سنجی تجربی بر روی داده های NYSE و NASDAQ انجام می شود ، جایی که این مدل با روش های محبوب مانند توجه شبکه حافظه کوتاه مدت توجه (ATTN-LSTM) ، رگرسیون بردار پشتیبانی (SVR) و چارچوب چند عاملی (MF) مقایسه می شود. بشرنتایج نشان می دهد که در مقایسه با این روشهای موجود ، مدل ما نرخ بازده تجمعی بالاتری دارد و خطر کمتری از نوسانات بازده دارد.

معرفی

بر اساس آمار بانک جهانی، در سال 2021، نسبت ارزش بازار سهام جهانی به تولید ناخالص داخلی از 130 درصد فراتر رفته است (https://data. worldbank. org. cn/indicator/CM. MKT. LCAP. GD. ZS)یعنی بورس به یکی از محبوب ترین کانال های سرمایه گذاری تبدیل شده است. همانطور که در مدل قیمت گذاری دارایی های سرمایه ای تعریف شده است (فاما و فرنچ، 2004)، بازده به دست آمده توسط سرمایه گذار در بازار سهام عمدتاً شامل دو بخش است: بازده آلفا (بخشی از بازده فردی که با بازار نوسان نمی کند) و بازده بتا.(بخشی از بازده سیستماتیک که به دنبال نوسانات بازار است). اولی به عملیات بلندمدت یک شرکت بستگی دارد که تجزیه و تحلیل آن به بهترین وجه توسط انسان انجام می شود. در مقابل، دومی به شدت با بازار در کوتاه مدت نوسان می کند که برای تحلیل تکنیکال با استفاده از مدل های کمی مناسب تر است. بر اساس ویژگی های قیمت سهام، مدل های کمی به دنبال سهام کم ارزش شده و سود بر اساس بازده ارزش آن ها هستند.

به طور سنتی، مدل های کمی مبتنی بر یادگیری عمیق، داده های تراکنش یک سهام را به عنوان یک سری زمانی در نظر می گیرند (کائو، لی و لی، 2019؛ بائو، یو و رائو، 2017؛ نارایان، فان و لیو، 2021؛ گرین وود و شلیفر، 2014؛ ژانگ، آشوری و دنگ، 2017؛ دای، شائو و لو، 2013؛ کاظم و همکاران، 2013). شبکه عصبی بازگشتی (RNN) و انواع مختلف آن که در توالی مدل سازی خوب هستند، عملکرد خوبی در پیش بینی قیمت سهام به دست آوردند (Bao, Yue & Rao, 2017؛ Cao, Li & Li, 2019؛ Chen & Ge, 2019؛ Fischer & Krauss.، 2018؛ پانگ و همکاران، 2020؛ ژانگ، آگاروال و چی، 2017؛ لیو، لی و لیو، 2021). با این حال، آنها سهام را به عنوان یک نهاد جداگانه در نظر می گیرند و روابط آنها و یکپارچگی بازار سهام را نادیده می گیرند.

در واقع، قیمت سهام مرتبط به طور قابل توجهی بر یکدیگر تأثیر می گذارد. همانطور که در شکل 1 الف نشان داده شده است، فیس بوک و گوگل به یک صنعت تعلق دارند و قیمت سهام آنها روند مشابهی را نشان می دهد. بنابراین، روابط سهام برای افزایش دقت پیش بینی با توسعه یادگیری نمودار استفاده شده است. با این حال، اکثر محققان به طور مستقیم و به سادگی از روابط صنعتی ارائه شده توسط پلتفرم های شخص ثالث استفاده می کنند که کافی نیستند. همانطور که در شکل 1B نشان داده شده است، قیمت سهام NXPI و XEL برای مدت طولانی روند مخالفی را نشان داده اند. از آنجا که آنها به ترتیب نشان دهنده صنعت خودروهای انرژی جدید و صنعت سنتی انرژی فسیلی هستند، رابطه رقابتی بین آنها وجود دارد. با این حال، پلتفرم های شخص ثالث نمی توانند چنین روابط پیچیده ای را فراهم کنند.

The impact of stock relations on stock prices.

انگیزه مطالعه حل مشکلات اطلاعات ناقص و روابط کافی سهام در روشهای پیش بینی قیمت سهام موجود است که در بالا ذکر شد. بنابراین ، در مقاله ، ما الگوریتم را برای معدن روابط سهام به طور مؤثر طراحی می کنیم و آنها را با اطلاعات متعدد برای بهبود پیش بینی ادغام می کنیم. مشارکتهای اصلی عبارتند از: (1) ما الگوریتم روابط خود تولید کننده (SGR) را طراحی کردیم که از داده های معاملاتی برای تولید روابط سهام استفاده می کند. در همین حال ، ما شبکه عصبی سنتی نمودار سنتی (GCN) را اصلاح کردیم تا تأثیر روابط سهام بر قیمت را الگوبرداری کنیم.(2) مدل مدل چند عاملی رابطه ای (TRMF) را ارائه دادیم که ترکیبی از اطلاعات بعد از ابعاد برای پیش بینی قیمت سهام است.(3) ما اثربخشی و جهانی بودن TRMF را با داده های دو بازار سهام توسعه یافته ، بورس اوراق بهادار نیویورک (NYSE) و بازار سهام NASDAQ (NASDAQ) نشان دادیم.

باقیمانده این مقاله به شرح زیر سازماندهی شده است: بخش "کار مرتبط" تحقیق در مورد تجزیه و تحلیل فنی پیش بینی قیمت سهام و روابط سهام را بررسی می کند. سپس بخش "روش" ساختار مدل TRMF ، به ویژه الگوریتم SGR و ماژول Network Network Neturobularal (WGCN) را نشان می دهد. در بخش "تنظیم آزمایشی" ، داده های تجربی و پارامترهای مدل ذکر شده است. علاوه بر این ، بخش "نتایج" نتایج تست پشت مدل پیشنهادی و مقایسه آن با سایر مدل ها را ارائه می دهد. سرانجام ، بخش "نتیجه گیری" اثربخشی الگوریتم SGR و مدل TRMF در پیش بینی قیمت سهام را نتیجه می گیرد.

کار مرتبط

بین سهام موجود در بازار تأثیر پیوند وجود دارد ، که به طور گسترده در دانشگاهیان اثبات شده است (Baruník & Křehlík ، 2018 ؛ Diebold & Yilmaz ، 2014 ؛ Ferrer et al. ، 2018 ؛ Ma et al. ، 2022 ؛ Nasreen et al.، 2020 ؛ بنابراین ، چو و چان ، 2021). در میان آنها ، Diebold & Yilmaz (2014) چندین اقدامات اتصال را که از قطعات تجزیه واریانس ساخته شده است ، پیشنهاد کرده و اتصال روزانه متغیر از نوسانات بازده سهام مؤسسات مالی بزرگ ایالات متحده را در بحران مالی 2007-2008 ردیابی می کند. فرر و همکاران.(2018) اتصال پویا زمان و فرکانس بین قیمت نفت ، بازده سهام شرکتهای انرژی پاک آمریکا و چندین متغیر مالی حیاتی را با روش ارائه شده توسط Baruník & Křehlík (2018) نشان داد. Nasreen و همکاران.(2020) پویایی اتصال بین قیمت انرژی فسیلی و بازده بازار سهام شرکتهای انرژی پاک و فناوری را مورد تجزیه و تحلیل قرار داد. نتایج نشان داد که نوسانات اتصال در تمام فرکانس ها و در کل دوره آزمایشی منتقل می شود. بنابراین ، چو و چان (2021) تأثیرات همه گیر Covid-19 را در اتصال بازار مالی هنگ کنگ مورد بررسی قرار دادند. در مقایسه با سایر بحران ها که چگالی شبکه و خوشه بندی را می توان با همبستگی با شاخص های بازار مانند دوره های عادی توضیح داد ، آنها دریافتند که هم چگالی شبکه و هم خوشه بندی در شبکه های همبستگی جزئی در طول شیوع COVID-19 بیشتر است. با وجود ادبیات گسترده که نشان دهنده جهانی بودن اتصال بین سهام است ، مدلهای کمی آنها را در نظر نمی گیرند.

ترکیب روابط سهام در پیش بینی قیمت سهام یک جهت تحقیق نسبتاً جدید است (فنگ و همکاران ، 2019 ؛ چن ، وی و هوانگ ، 2018 ؛ لانگ و همکاران ، 2020). به طور معمول ، فنگ و همکاران.(2019) داده های طبقه بندی صنعت از بازارهای NASDAQ و NYSE در ایالات متحده را از وب سایت (https://www. nasdaq. com/screening/industries. aspx) به دست آورد تا یک نمودار را بسازید و آن را به GCN وارد کنید. نتایج تجربی نشان داد که این روش از مدل سنتی LSTM در بازده پشتی فراتر رفته است. علاوه بر این ، چن ، وی و هوانگ (2018) روابط سهام را از باد به دست آورد.(https://www. mediawiki. org/wiki/wikibase/datamodel/json) ، و از روش انتقال روابط برای افزایش تعداد روابط سهام استفاده کرد. نتایج تجربی نشان داد که افزایش تعداد روابط سهام می تواند عملکرد پیش بینی را بهبود بخشد. با این وجود ، سیستم عامل های شخص ثالث فقط می توانند روابط صنعت را فراهم کنند ، که به اندازه کافی جامع نیستند.

Scarselli و همکاران.(2009) ابتدا GCN را پیشنهاد کرد و شبکه های عصبی عمیق را به دسته نمودار گسترش داد. سالها بعد ، برونا و همکاران.(2014) برای ضبط الگوهای اتصال محلی در نمودارها ، عملیات Convolution را در دامنه فرکانس انجام داد. براساس روش آنها ، چندین اثر برای تسریع انجام شده است (Defferrard ، Bresson & Vandergheynst ، 2016 ؛ Kipf & Welling ، 2017). در میان آنها ، Kipf & Welling (2017) GCN را از طریق تقریب مرتبه اول محلی بر اساس پیچیدگی های نمودار طیفی ساده کرد و نشان داد که این روش از روشهای موجود در آزمایشات در شبکه استناد و مجموعه داده های نمودار دانش بهتر است. GCN برای شبکه های رابطه ای واحد بین نهادها استفاده می شود (وو و همکاران ، 2020 ؛ Fout et al. ، 2017 ؛ ژائو و همکاران ، 2020). با این حال ، ممکن است بین دو سهام چندین رابطه وجود داشته باشد. به عنوان مثال ، یک سازنده ابزار دستگاه A ممکن است از پیچ های ارائه شده توسط شرکت B. استفاده کند. سپس دو رابطه بین A و B وجود دارد: A هم حمل کننده پایین دست B و هم تأمین کننده B. است. بنابراین ، GCN کلاسیک باید برای پیش بینی قیمت سهام با ویژگی های روابط سازمانی سازگار شود.

روش

دستیابی و استفاده از روابط سهام جزء مهم مدل TRMF است. در این مقاله ، الگوریتم پیشنهادی SGR ما از داده های معامله برای به دست آوردن روابط سهام استفاده می کند. در همین حال ، ماژول WGCN تأثیر روابط در پیش بینی قیمت سهام را مدل می کند.

الگوریتم رابطه خود سازنده

ما در نظر می گیریم که آیا روابط بین دو سهام و نحوه طراحی قوانین برای گرفتن آنها وجود دارد. در اینجا ، ما به روابط واقعی سهام به عنوان روابط نهاد مانند روابط صنعتی و روابط رقابتی اشاره می کنیم. سهام ممکن است با بسیاری از سهام دیگر روابط نهاد داشته باشد. روابط ترکیبی در نهایت بر رفتار معاملاتی جفت سهام ، به ویژه قیمت در دوره های مختلف عمل می کند. به طوری که قیمت آنها یک الگوی خاص را نشان می دهد ، مانند افزایش قیمت دو سهام در حال افزایش یا در حال افزایش در کنار هم یا یک قیمت متوسط پنج روزه یک سهام در حال افزایش است در حالی که دیگری سقوط می کند. بنابراین ، همبستگی بین دو قیمت سهام نشان دهنده ترکیبی از روابط متعدد بین آنها است. یک نقشه برداری وجود دارد: (1) R I ، J 1 ، R I ، J 2 ، ... ، R I ، J N → F R I ، J K Where Rمن ، جرابطه نهاد بین سهام I و سهام J ، R I ، J K را نشان می دهد که همبستگی بین سهام I و سهام J را در برخی از داده های معاملاتی نشان می دهد. هر دو داده BOOL هستند که توسط 0 و 1 نشان داده شده اند.

 Data: stocks S, trading days Tr, trading features F, minimum support min_support Result: Stock relation adjacency matrix Asgr[len(S)][len(S)][len(F)] 1 Function gen_Stocks_Feature_Event(feature): 2 Event_Bit_Set[len(S)][len(Tr)] = 3 for t in Tr do 4 for s in S do 5 if trading feature of stock s in day t meet feature threshold then 6 Event_Bit_Set[s][t] = 1 7 end 8 end 9 end 10 retu Event_Bit_Set 11 12 for f in F do 13 E = gen_Stocks_Feature_Event(S, Tr, f) 14 for (s1,s2) pair from S do 15 dis = Hamming Distance between E[s1] and E[s2] 16 support = (len(Tr) - dis) / len(Tr) 17 if support>min_support سپس 18 ASGR [S1] [S2] [F] = 1 19 other 20 Asgr [S1] [S2] [F] = 0 21 End 22 End 23 الگوریتم پایان 1: الگوریتم رابطه خود تولید 

بنابراین ، ما از همبستگی قیمت سهام ، یعنی روابط خود تولید کننده (روابط SG) ، به عنوان جایگزینی برای روابط موجودیت استفاده می کنیم. الگوریتم SGR-RELATS SG SG. ورودی آن چندین ویژگی تجاری F است ، و خروجی یک ماتریس مجاور سه بعدی A استSGRبشرجریان الگوریتم در شبه کد در الگوریتم 1 نشان داده شده است. به طور خلاصه ، دو سهام دارای یک رابطه SG در یک ویژگی معاملاتی هستند ، به این معنی که آنها روزهای کافی را در این ویژگی ملاقات می کنند. آستانه در اینجا می تواند شبیه به قیمت بسته شدن بیشتر از 0 باشد ، قیمت متوسط پنج روزه کمتر از 0 و غیره است.

شبکه عصبی Convolutional Graphed Weighted

GCN به دو ورودی نیاز دارد: یک ماتریس مجاور A که نمایانگر رابطه است ، و دیگری یک ماتریس H است که ویژگی های سری زمانی سهام را نشان می دهد. ما از GCN ساده شده پیشنهاد شده توسط Kipf & Welling (2017) استفاده می کنیم که فرمول پیشرفته ترین هنر است (چن ، وی و هوانگ ، 2018 ؛ فنگ و همکاران ، 2019). این شامل دو لایه حلقوی است ، یکی برای ورودی به پنهان و دیگری برای مخفی کردن به خروجی: (2) A = D-1 /2 A + I D-1 /2 Y = F X ، A = S O F T M A X A Re l u a x w 0 w 1

در اینجا ، A + I ماتریس مجاورت روابط سهام Graph Graph Grate G با خود پیوست های اضافه شده ، D ∈ ℝ N × N ماتریس درجه G است. w 0 ∈ ℝ c1× C3یک ماتریس وزن به مخفی است ، و W 1 ∈ ℝ C3× C4ماتریس وزن پنهان به خروجی است.

توجه داشته باشید که A یک ماتریس مجاور 2D است ، به این معنی که فقط یک رابطه واحد بین گره های سهام است. با این حال ، دو سهام ممکن است دارای چندین رابطه SG باشد که در بخش قبلی تعریف شده است. بنابراین ، ما WGCN را برای استفاده از اطلاعات رابطه ای طراحی کردیم. این یک لایه وزن را به GCN سنتی اضافه می کند تا روابط مختلف SG را به یک رابطه مصنوعی ترسیم کند: (3) a s g r n ، n ، n r → w r n r ، 1 a n ، n a = w r a s g r در جایی ASGRماتریس مجاور چندین رابطه SG و W را نشان می دهدحرفبردار وزن را نشان می دهد.

Synthetic relations generation.

چارچوب به طور کامل

مدل TRMF شامل انتخاب ویژگی ، استخراج اطلاعات و پیش بینی هدف است. شکل 3 چارچوب را به طور کلی نشان می دهد.

TRMF model.

انتخاب ویژگی

ما ابتدا سه عنصر را تعیین می کنیم: سهام ، زمان آزمایش و ویژگی های معاملاتی برای به دست آوردن داده های اصلی و سپس فیلتر کردن آن. با ترسیم تمرین فنگ و همکاران.(2019) ، ما دو شرط را برای فیلتر کردن سهام موجود در بازار انجام می دهیم: در طول دوره آزمایشی ، (1) درصد روز معاملاتی واقعی بیشتر از 98 ٪. و (2) قیمت سهام کمتر از 15 دلار. شرط اول مربوط به این است که روزهای تعلیق بیش از حد می تواند به خصوصیات آماری داده ها آسیب برساند و این مدل می تواند الگوهای غیر طبیعی را بیاموزد. شرط دوم جلوگیری از سهام پنی (https://www. sec. gov/fast-answers/answerspennyhtm. html) است که برای سرمایه گذاران عمومی خطرناک است ، همانطور که توسط کمیسیون اوراق بهادار و بورس ایالات متحده پیشنهاد شده است. برای روز تعلیق ، داده های معاملات سهام سابقه روز گذشته را حفظ کرده است.

استخراج اطلاعات

ما اطلاعات منعکس کننده سهام را به سه دسته تقسیم می کنیم: عوامل فنی ، اطلاعات سری زمانی و عوامل تأثیر روابط. در میان آنها ، عامل فنی آمار مالی سهام را نشان می دهد ، اطلاعات سری زمانی الگوی توالی تاریخی را ضبط می کند و عامل رابطه ای تأثیر محیط بازار را بر روی سهام تجزیه و تحلیل می کند. مدل TRMF آنها را برای پیش بینی قیمت سهام ترکیب می کند.

فاکتور فنی: ما پنج عامل فنی بالغ و متداول را انتخاب می کنیم: میانگین حرکت (MA) ، میانگین متحرک نمایی (EMA) ، شاخص قدرت نسبی (RSI) ، نوسان ساز حرکت Chande (CMO) ، در حجم تعادل (OBV) (Fama و فرانسوی، 2015 ؛ Nazemi ، Heidenreich & Fabozzi ، 2018 ؛ Wang ، Zhuang & Feng ، 2022).

اطلاعات سری زمانی: ما از ATTN-LSTM برای استخراج اطلاعات سری زمانی سهام استفاده می کنیم. LSTM یک نوع عالی از RNN است که از یک شبکه عصبی چهار لایه در یک واحد مکرر برای حل مشکل ناپدید شدن شیب و انفجار در طول آموزش دنباله طولانی استفاده می کند. بنابراین ، LSTM می تواند از RNN معمولی در توالی های طولانی تر عمل کند. این می تواند به طور خلاصه به عنوان: (4) h t i = l s t m x t i ، h t - 1 i ، جایی که x i t و h i t نشان می دهد ویژگی های سهام و حالت های پنهان سهام سهام من در روز است.

علاوه بر این ، نقاط زمانی خاص اغلب مربوط به حرکات قیمت سهام است ، مانند زمانی که شرکت ها گزارش های مالی سه ماهه خود را منتشر می کنند یا محصولات جدید را راه اندازی می کنند. بنابراین ، ما از مدل LSTM پیشرفته با توجه استفاده می کنیم. مکانیسم توجه وزنهای مختلفی را به سری های زمانی اختصاص می دهد تا مدل بتواند به یک روز تجارت بحرانی خاص توجه کند.:I ⊺ u t ′ من

جایی که T طول سری زمان و W استac2× C1یک ماتریس به طور تصادفی اولیه است که در طول آموزش بهینه شده است. H ̃ I T حالت لایه پنهان ATTN-LSTM است ، که ویژگی های سری زمانی سهام I را توصیف می کند.

عامل تأثیر روابط: مؤلفه مهم استفاده از این رابطه برای پیش بینی قیمت سهام ، دستیابی و استفاده از آن است. همانطور که در بالا توضیح داده شد ، ما از الگوریتم SGR برای روابط سهام و WGCN برای به دست آوردن عوامل تأثیر رابطه استفاده کردیم.

پیش بینی هدف

سرانجام ، هر سه نوع اطلاعات به هم تقسیم شدند و به لایه کاملاً متصل وارد شدند.(8) z i = r e l u w fi: h ̃ i: yi ⊺ + b

جایی که f i یک بردار متشکل از عوامل فنی است ، y I عامل تأثیر رابطه از مدل WGCN است. Z من بازده مورد انتظار سهام من در روز بعد است ، که در اینجا به عنوان o بیان شده استحرف/ ot 1+بشرایحرفقیمت افتتاح روز T است.

تنظیم آزمایشی

داده های تجربی

داده های آزمایش از بورس اوراق بهادار نیویورک (NYSE) و بورس اوراق بهادار NASDAQ (NASDAQ) است. از آنجا که آنها دو بازار سهام برتر از نظر سرمایه گذاری در بازار جهانی در سال 2021 هستند (https://data. worldbank. org/indicator/cm. mkt. lcap. cd) و پیشرفته ترین بازارهای صنعت مالی جهانبشرسپس سهام تشکیل دهنده S& P 500 برای انتخاب سهام انتخاب می شود. این روش ، از یک طرف ، میزان محاسبه را کاهش می دهد. از طرف دیگر ، این سهام شامل 80 ٪ از ارزش بورس ایالات متحده است (https://en. wikipedia. org/wiki/s٪26p_500) ، بنابراین آنها می توانند کل بازار را نمایندگی کنند.

دوره آزمایشی 01/02/2018-06/28/2019 بود و به سه فاصله تقسیم شد: آموزش (01/02/2018 12/28/2018) ، اعتبار سنجی (01/02/2019-03/29/29/2019) ، و آزمایش (04/01/2019-06/28/2019). ما این انتخاب را انجام دادیم زیرا شاخص S& P 500 دوره های نوسانات ، کاهش و افزایش در مجموعه آزمون را نشان می دهد که نماینده است. در جدول 1 تعداد روزهای معاملاتی در NYSE و NASDAQ ذکر شده است.

SG-relations and industry relations in NYSE & NASDAQ.

شکل 5 نمونه هایی از روابط SG را نشان می دهد. در میان آنها ، می توانیم ببینیم که روابط SG می تواند بسیاری از روابط صنعت را پوشش دهد (https://en. wikipedia. org/wiki/list_of_s٪26p_500_companies) ، مانند fb. o & goog. o ، aep. o & lnt. o، و apa. o & fang. o. علاوه بر این ، چندین رابطه غیر صنعت در روابط SG وجود دارد. به عنوان مثال ، NVDA. O تأمین کننده AAPL. O است. قیمت متوسط 60 روزه آنها همان روند را نشان می دهد ، اما AAPL. O کمی از NADA. O عقب مانده است. علاوه بر این ، NXPI. O با Xel. o رابطه انحصاری دارد زیرا سابق نشان دهنده صنعت جدید وسیله نقلیه انرژی است در حالی که دومی نشان دهنده صنعت انرژی فسیلی سنتی است. قیمت متوسط 20 روزه آنها به صورت معکوس در نوسان است. سرانجام ، قیمت متوسط 60 روزه eBay. o روند معکوس آشکار با Exc. o را برای مدت طولانی نشان می دهد در حالی که ما نمی توانیم آن را با تجزیه و تحلیل صنعت مشخص کنیم. ممکن است ارتباط داخلی بین آنها وجود داشته باشد. این اطلاعات می تواند به پیش بینی دقیق تر قیمت آنها کمک کند.

Examples of SG-Relations.

جدول 5 به طور کمی پوشش روابط SG با تعداد غیر صفر به روابط صنعت را نشان می دهد. ما می توانیم ببینیم که رابطه SG تا حد زیادی می تواند روابط صنعت ارائه شده توسط پلت فرم شخص ثالث را پوشش دهد. در میان آنها ، رابطه SG می تواند بیش از 60 ٪ از روابط صنعت را در بازار NYSE و حتی بیش از 80 ٪ در بازار NASDAQ پوشش دهد. از طرف دیگر ، الگوریتم SGR روابط بسیاری را به سهام اضافه می کند که سیستم عامل های شخص ثالث در ارائه آن ناکام هستند. در هر دو بازار NYSE و NASDAQ ، روابط صنعت بیش از 5 ٪ از روابط SG را شامل نمی شود. اگرچه این جفت سهام با رابطه SG در یک صنعت یکسان نیستند ، اما در دوره های مختلف بین قیمت آنها ارتباط قوی وجود دارد. این روابط می تواند به عنوان اطلاعات مهم برای پیش بینی قیمت سهام مورد استفاده قرار گیرد. روابط SG ایجاد شده توسط داده های مختلف معاملاتی نرخ پوشش متفاوتی برای روابط صنعت دارد. از این تعداد ، رابطه SG مربوط به قیمت روزانه بالاترین پوشش را دارد و پوشش سایر داده های معاملاتی با رشد دوره کاهش می یابد. شکل 6 این قانون را بطور شهودی تر نشان می دهد. این پدیده نشان می دهد که قیمت های کوتاه مدت شرکت ها در همان صنعت با همبستگی دارند ، در حالی که همبستگی قیمت بلند مدت می تواند روابط دیگر را منعکس کند.

Coverage ratio of SG-relations to industry relations.

در مورد بازگشت تست پشت TRMF مطالعه کنید

Figure 7 presents the cumulative rate of retu of all models. Their performance follows the order of TRMF> TGC> Attn-LSTM> WGCN> SVR> Baseline>پنج عاملی. و بیشتر اوقات ، TRMF در بالا است. بنابراین ، TRMF می تواند حداکثر مزایا را برای سرمایه گذاران در محیط آزمایشی به همراه آورد.

Comparison of cumulative rate of retu among models.

در جدول 6 نتایج هر مدل آزمایشی تحت چهار معیار ارزیابی ارائه شده است. می بینیم که مدل TRMF از مدل های مقایسه در اکثر معیارها بهتر است. اول ، ما هر دو TRMF و TGC را از مدل پنج عاملی سنتی ، SVR و ATTN-LSTM در دو بازار با عملکرد عالی W استفاده کردیم. r. t. IRR ، MDD و SR. این تغییر می کند که ترکیب اطلاعات رابطه سهام در مدل می تواند پیش بینی قیمت سهام را به میزان قابل توجهی بهبود بخشد. از نظر MDD ، پیش بینی هر دو TRMF و TGC به طور قابل توجهی کوچکتر از سایر مدل های قابل مقایسه و شاخص های معیار است. هر دو آنها روابط سهام را در پیش بینی ادغام می کنند. بنابراین ، ما فرض کردیم که ضریب طبقه بندی رابطه می تواند به طور موثری کاهش را کاهش دهد زیرا قیمت گذاری سهام مرتبط باعث اعتماد به نفس به سرمایه گذاران می شود و به دلیل احساسات کوتاه مدت بازار ، وضعیت بیش از حد را کاهش می دهد. علاوه بر این ، عملکرد TRMF بهتر از TGC با استفاده از روابط صنعت بود ، که ممکن است مربوط به تعداد بیشتری از روابط SG باشد. این نشان می دهد که روابط SG پیشنهادی ما می تواند اطلاعات بیشتر رابطه را برای تقویت استحکام پیش بینی های مدل ضبط کند. با این حال ، TRMF نتوانست به بهترین عملکرد W برسد. r. t. MSE ، اگرچه هنوز دوم از همه مدل ها بود. دلیل این امر می تواند به این دلیل باشد که TRMF بیشترین پارامترها را دارد. WGCN ، که فقط از اطلاعات رابطه استفاده می کند ، نسبت به ATTN-LSTM پایین تر است که فقط از اطلاعات زمانی از نظر IRR و SR استفاده می کند و با توجه به MSE نمی تواند به دقت پیش بینی بالایی برسد. بنابراین ، اطلاعات سری زمانی سهام از اهمیت بیشتری برخوردار است و قیمت سهام سهام مختلف درجه زیادی از استقلال را حفظ می کند.

جدول 6: مقایسه عملکرد بین مدل ها.

نیس نادق
مدل مگس اری MDD SR مگس اری MDD SR
پنج عاملی 7. 33e - 4 0. 014 8. 2 ٪ 0. 011 8. 27e - 4 0. 001 10. 3 ٪ 0. 001
SVR 5. 21e - 4 0. 101 5. 9 ٪ 0. 255 6. 32e - 4 0. 109 7. 2 ٪ 0. 166
لاتین 2. 99e - 4 0. 214 5. 2 ٪ 0. 237 4. 63e - 4 0. 131 6. 5 ٪ 0. 326
WGCN 3. 15e - 4 0. 172 5. 9 ٪ 0. 172 4. 87e - 4 0. 117 24. 9 ٪ 0. 153
TGC 3. 13e - 4 0. 271 4. 6 ٪ 0. 345 4. 37e - 4 0. 282 4. 7 ٪ 0. 335
TRMF 3. 12e - 4 0. 385 3. 2 ٪ 0. 544 4. 41e - 4 0. 334 4. 4 ٪ 0. 492
پایه 7. 33e - 4 0. 014 8. 2 ٪ 0. 011 8. 27e - 4 0. 001 10. 3 ٪ 0. 001

نتیجه گیری

قیمت آینده سهام تحت تأثیر داده های معاملاتی تاریخی آن و سهام مرتبط است. بنابراین ، در این مقاله ، انتظار داشتیم روابط سهام را با اطلاعات متعدد برای پیش بینی قیمت ترکیب کنیم. برای حل مشکل ، ما یک مدل TRMF را پیشنهاد کردیم. هسته اصلی مدل TRMF یک الگوریتم برای تولید سهام ثروتمند به نام الگوریتم SGR است که از داده های معاملاتی برای معدن چندین رابطه SG به طور خودکار استفاده می کند. آزمایشات مبتنی بر داده های NYSE و NASDAQ اثربخشی راه حل ما را نشان داد. نتایج نشان می دهد که روابط SG می تواند بیش از 60 ٪ از روابط صنعت را از سکوی شخص ثالث پوشش دهد. TRMF از SVR ، ATTN-LSTM و TGC با IRR بالاتر ، SR و MDD پایین تر عمل کرد.

ما ثابت کردیم که همبستگی نوسانات قیمت در دوره های مختلف منعکس کننده روابط سهام است. اما سایر ابعاد معامله ، مانند حجم معاملات ، گردش مالی و سایر موارد ، در مقاله مورد بحث قرار نمی گیرد. بنابراین ، در آینده ، ما پتانسیل گسترش الگوریتم رابطه خود تولید را به سایر داده های معاملات سهام برای به دست آوردن اطلاعات روابط مؤثرتر و بهبود پیش بینی قیمت سهام بررسی خواهیم کرد.

اطلاعات تکمیلی

کد منبع مدل TRMF با مجموعه داده های فوق العاده

داده های پوشه ، مدل و ZbackTest به ترتیب داده های تجربی ، مدل و فرایند آزمایشی پس زمینه را نشان می دهند. HyperParameters در پرونده A_Global جمع آوری می شود.

پیوست A. سهام تجربی

نیس

No. n ، من Nusted ، Abbb ، Abé ، Sum ، Mum. ، I Mum. همه در آنجا ، همه از همه. n ، در آنجا ، یک روز ، من می توانم. bdx. n ، betude_b .. نه ، bix . j. s ، cent. ، cums. ، cbb ، cu. ، cu. ، cu. ، cuck ، cuck. ، ycients ، clat. ، clex. ، cube. ، cleg ، ku. ، kic. cpb. s ، clame. ، ce. ، عطر. ، crat ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، 000. 000. the Number. ter ، The Waters ، The Fox ، Rass. n ، The Head ، Yx. Jix ، em. ، او ، ri. ، em. ، quasin ، quas ، quas ، chalone. این است ، در آنجا ، exp. ، پرواز ، پرواز ، fex ، sum ، flus ، fum. nor ، bol. ، g. s. m ، g . ، م. ، br. ، bac. این است ، hghss. ، woll ، halm. نه ، آن را Wory ، Hass. Sals ، KM ، Mmb. Jt. t ، مانند nc. ، tin. no ، ms. j. t ، و Gracates ، و خانواده ها. . ، Centr ، As ، طناب ، ماسه ، trx. speitg ، پیشنهاد sint. ten. s ، بگویید .. ، گاهی اوقات ، téx. ، tu. ، sme. ، sme. n ،. f ، u. ، y. ، ، ، ، uas ، vé ، vum ، vumum. نه ، vuz. ، war ، about. در آنجا ares ، و کجا .. ، y. ، ffica.

این نام اسامی نام است

aal. o ، aapl. o ، abmd. o ، adbe. o ، adi. o ، adp. o ، adsk. o ، aep. o ، akam. o ، algn. o ، amat. o ، amgn. o ، amzn. O ، Anss. o ، apa. o ، atvi. o ، avgo. o ، biib. o ، bkng. o ، cdns. o ، cdw. o ، ce. o ، chrw. o ، chtr. o ، cinf. o ، cmcsa. o ، cme. o ، cost. o ، cprt. o ، csco. o ، csx. o ، ctas. o ، csh. o ، ctxs. o ، czr. o ، disca. o ، disck. o ، ظرف. O ، dltr. o ، dxcm. o ، ea. o ، ebay. o ، eqix. o ، exc. o ، expd. o ، expen fisv. o ، fitb. o ، ftnt. o ، gild. o ، goog. o ، googl. o ، has. o ، holx. o ، hon. o ، hsic. o ، hst. o ، idxx. o ، ilmn. o ، incy. o ، intc. o ، intu. o ، ipgp. o ، isrg . o ، jbht. o ، jkhy. o ، khc. o ، klac. o ، lkq. o ، lnt. o ، lrcx. o ، mar. o ، mchp. o ، mdlz. o ، mktx. o ، mnst. o ، mpwr. o ، msft. o ، mu. o ، ndaq. o ، nflx. o ، nlok. o ، ntap. o ، ntrs. o ، nvda. o ، nxpi. o ، odfl. o ، orly. o ، payx . o ، pcar. o ، pep. o ، pfg. o ، pool. o ، ptc. o ، pypl. o ، qcom. o ، qrvo. o ، reg. o ، regn. o ، rost. o ، sbac. o ، sbux. o ، sivb. o ، snps. o ، stx. o ، swks. o ، tech. o ، ter. o ، tmus. o ، trmb. o ، trow. o ، tsco. o ، tsla. o ، ttwo . o ، txn. o ، ual. o ، ulta. o ، viac. o ، vrsk. o ، vrsn. o ، vrtx. o ، wba. o ، wdc. o ، wltw. o ، wynn. o ، xel. o ، xlnx. o ، xray. o ، zbra. o ، Zion. o

ضمیمه B. معیارهای ارزیابی

اطلاعات اضافی و اعلامیه ها

منافع رقابتی

نویسندگان اعلام می کنند که هیچ علاقه رقابتی وجود ندارد.

آموزش تحلیل گری...
ما را در سایت آموزش تحلیل گری دنبال می کنید

برچسب : نویسنده : ملیکا زارعی بازدید : 30 تاريخ : دوشنبه 13 شهريور 1402 ساعت: 22:40