تجزیه و تحلیل دینامیکی شاخص داو جونز با استفاده از کاهش ابعاد و تجسم

ساخت وبلاگ

مجوز MDPI ، بازل ، سوئیس. این مقاله یک مقاله دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (CC توسط) توزیع شده است (https://creativeecommons.org/licenses/by/4. 0/).

داده های مرتبط

خلاصه

سری زمانی تولید شده توسط سیستم های پیچیده (CS) اغلب با پدیده هایی مانند هرج و مرج ، شکستگی و اثرات حافظه مشخص می شود که در تجزیه و تحلیل آنها مشکل ایجاد می کند. در این مقاله پویایی داده های چند بعدی تولید شده توسط CS بررسی شده است. شاخص میانگین صنعتی داو جونز (DJIA) به عنوان تختخواب آزمایشی انتخاب می شود. سری زمانی DJIA نرمال شده و در چندین بردار پنجره زمانی تقسیم می شود. این بردارها به عنوان اشیاء رفتار می شوند که رفتار دینامیکی DJIA را توصیف می کنند. سپس اشیاء با استفاده از مسافت های مختلف برای تولید ورودی های مناسب به الگوریتم های کاهش ابعاد و تجسم اطلاعات مقایسه می شوند. این تکنیک های محاسباتی با توجه به شباهت (dis) بین اشیاء ، بازنمودهای معنی داری از مجموعه داده اصلی را تولید می کنند. زمان به عنوان یک متغیر پارامتری نمایش داده می شود و غیر محلی بودن را می توان با تکامل مربوط به نقاط و شکل گیری خوشه ها مشاهده کرد. پرتره های تولید شده ماهیت پیچیده ای را نشان می دهند ، که از نظر الگوهای در حال ظهور بیشتر مورد تجزیه و تحلیل قرار می گیرد. نتایج نشان می دهد که اتخاذ ابزارهای کاهش ابعاد و تجسم برای پردازش داده های پیچیده یک گزینه اصلی مدل سازی با منابع محاسباتی فعلی است.

کلمات کلیدی: کاهش ابعاد ، تجسم داده ها ، خوشه بندی ، سری زمانی ، سیستم های پیچیده

1. معرفی

سیستم های پیچیده (CS) از چندین نهاد خودمختار تشکیل شده اند که توسط قوانین ساده توصیف شده اند که با یکدیگر و محیط آنها تعامل دارند. CS باعث ایجاد یک رفتار جمعی می شود که پدیده ای پویا بسیار غنی تر از آنچه که توسط عناصر فردی ارائه شده است ، نشان می دهد. غالباً ، CS تکامل ، سازگاری ، سازماندهی ، ظهور سفارشات و ساختارها ، همبستگی های دوربرد در حوزه زمان و فضای ، هرج و مرج ، شکریت و اثرات حافظه را نشان می دهد [1،2،3،4]. CS نه تنها از نظر ماهیت گسترده است ، بلکه در فعالیت های مرتبط با انسان نیز فراگیر است و شامل پویایی مولکولی ، ارگانیسم های زنده ، اکوسیستم ، مکانیک آسمانی ، بازارهای مالی ، سیستم های محاسباتی ، شبکه های حمل و نقل و شبکه های اجتماعی و اقتصادهای جهان و کشور و همچنین اقتصاد جهان و کشور است. بسیاری دیگر [5،6،7،8].

تجزیه و تحلیل سری زمانی با موفقیت برای مطالعه CS به کار گرفته شده است [9،10]. خروجی CS با گذشت زمان اندازه گیری می شود و داده های جمع آوری شده به عنوان تظاهرات پویایی CS تعبیر می شوند. بنابراین ، مطالعه سری زمانی اجازه می دهد تا نتیجه گیری در مورد رفتار CS حاصل شود [11،12]. با این وجود ، سری زمانی با کلمه واقعی ممکن است تحت تأثیر نویز ، اعوجاج و ناقص بودن قرار بگیرد و به روشهای پیشرفته پردازش برای استخراج اطلاعات قابل توجه از داده ها نیاز دارد [13]. تجسم اطلاعات نقش مهمی در تجزیه و تحلیل سری زمانی دارد ، زیرا بینشی در مورد ویژگی های داده ارائه می دهد. تجسم اطلاعات با تولید رایانه نمایش های بصری مجموعه داده ها مطابقت دارد. هدف اصلی آن در معرض نمایش ویژگی های پنهان در داده ها است ، به منظور درک سیستمی که چنین داده هایی را تولید کرده است [14،15]. کاهش ابعاد [16] نقش مهمی در تجسم اطلاعات دارد ، زیرا داده های عددی اغلب چند بعدی هستند. طرح های مبتنی بر کاهش ابعاد سعی می کنند ، در بازنمایی های بعدی ، اطلاعات موجود در مجموعه داده های اصلی را حفظ کنند. آنها شامل روشهای خطی ، مانند مقیاس بندی چند بعدی کلاسیک (MDS) [17] ، مؤلفه اصلی [18] ، همبستگی متعارف [19] ، تبعیض خطی [20] و تجزیه و تحلیل عاملی [21] و همچنین رویکردهای غیرخطی ، مانند غیر غیرMDS کلاسیک ، یا پیش بینی سامون [22] ، ایزومپ [23] ، eigenmap لاپلاسی [24] ، نقشه انتشار [25] ، تعبیه همسایه تصادفی T- توزیع شده (T-SNE) [26] و تقریب منیفولد یکنواخت (UMAP) [27].

سریال های زمانی مالی دارای ماهیت پیچیده ای هستند و توصیف پویا آنها چالش برانگیز است. میانگین صنعتی داو جونز (DJIA) یک شاخص مالی مهم است و در این مقاله به عنوان مجموعه داده ای که توسط CS ایجاد شده است ، تصویب می شود. این مقاله با ترکیب مفاهیم کاهش فاصله و ابعاد با ابزارهای تجسم محاسباتی ، یک استراتژی جایگزین برای تجزیه و تحلیل دامنه زمان کلاسیک را بررسی می کند. سری زمانی DJIA از مقادیر نزدیک روزانه عادی و تقسیم می شود و تعدادی از اشیاء را نشان می دهد که پویایی DJIA را توصیف می کند. این اشیاء بردارهایی هستند که طول زمان و زمان جزئی آنها نشان دهنده سازش بین وضوح زمان و طول حافظه است. اشیاء با استفاده از مسافت های مختلف مقایسه می شوند و از اختلافات آنها به عنوان ورودی به الگوریتم های مختلف کاهش ابعاد و تجسم اطلاعات ، یعنی خوشه بندی سلسله مراتبی (HC) ، MDS ، T-SNE و UMAP استفاده می شود. الگوریتم های فوق الذکر بازنمایی از مجموعه داده اصلی را می سازند ، که در آن زمان یک متغیر پارامتری است. ساختار توطئه ها از نظر الگوهای در حال ظهور بیشتر مورد تجزیه و تحلیل قرار می گیرد. شکل گیری خوشه ها و تکامل الگوهای در طول زمان ، یک رفتار دینامیکی با ناپیوستگی برای دوره هایی که حافظه به نوعی از بین می رود ، نقشه می کند. آزمایش های عددی امکان سنجی و اثربخشی روش برای پردازش داده های پیچیده را نشان می دهد.

سازمان مقاله به شرح زیر خلاصه می شود. بخش 2 مفاهیم اساسی ریاضی را بررسی می کند ، یعنی مسافت ها و الگوریتم های اتخاذ شده در مطالعه برای پردازش و تجسم داده ها. بخش 3 مجموعه داده DJIA را معرفی می کند. بخش 4 داده ها را تجزیه و تحلیل می کند و نتایج را با توجه به مسافت های مورد استفاده تفسیر می کند. بخش 5 تأثیر طول زمان و همپوشانی پنجره تقسیم بندی را ارزیابی می کند. بخش 6 نتیجه گیری را ارائه می دهد.

2. مفاهیم و ابزارهای ریاضی

2. 1فاصله ها

با توجه به دو نقطه v i و v j در یک مجموعه x ، عملکرد d (v i ، v j): x × x → [0 ، + ∞] فاصله بین نقاط را نشان می دهد اگر ، و فقط اگر ، شرایط را برآورده کند: هویت ناسازگار، تقارن و نابرابری مثلث [28].

در این مقاله ، مسافت ها =در نظر گرفته شده اند. بنابراین ، با توجه به v i = (v i 1 ،… ، v i p) و v j = (v j 1 ،… ، v j p) در یک فضای p- بعدی ، p ، 10 مسافت توسط [28] داده می شود:

آموزش تحلیل گری...
ما را در سایت آموزش تحلیل گری دنبال می کنید

برچسب : نویسنده : ملیکا زارعی بازدید : 33 تاريخ : سه شنبه 6 تير 1402 ساعت: 14:39