پیشبینی قیمت نفت خام اوپک با استفاده از مدل خودبازگشتی میانگین متحرک انباشته فازی
دکتر منصور زراءنژاد*، پویان کیانی**، صلاح ابراهیمی*** و علی رئوفی****
تاریخ دریافت: 17 دی 1391 تاریخ پذیرش: 6 خرداد 1392
عوامل زیادی بر قیمت نفت خام تأثیر میگذارند از این رو استفاده از یک مدل چند متغیری که تمام عوامل مؤثر بر قیمت نفت را لحاظ کرده باشد کاری دشوار است. به همین دلیل، پیشبینی این متغیر از طریق مدلهای چند متغیری بسیار دشوار است. در این حالت ممکن است استفاده از مدلهای تک متغیری روش مناسبی باشد. در این مدلها از حافظه تاریخی متغیر برای مدلسازی و پیشبینی استفاده میشود. اما یکی از محدودیتهای مدلهای تک متغیری این است که برای حصول نتایج مناسب نیاز به دادههای زیادی دارند. از آنجا که مدلهای رگرسیون فازی برای پیشبینی دقیق نیاز به تعداد دادههای کمتری دارند، در این تحقیق، از سه روش رگرسیون فازی، آریما و رگرسیون خودبازگشتی میانگین متحرک انباشته فازی (ترکیب دو روش مذکور) و از دادههای روزانه قیمت نفت اوپک برای پیشبینی قیمت نفت خام اوپک استفاده شده است. نتایج حاکی از این است که مدلهای رگرسیون فازی و رگرسیون خودبازگشتی میانگین متحرک انباشته فازی علاوه بر این که از نظر تمام معیارهای متداول خطای پیشبینی، عملکرد بهتری نسبت به مدل آریما دارند با فراهم کردن بهترین و بدترین حالت، تصمیمگیری را نسبت به مدل آریما تسهیل کرده است. همچنین مدل ترکیبی به مراتب پیشبینی بهتری نسبت به مدل رگرسیون فازی ارائه میدهد و فاصله بازه تصمیمگیری را کوتاهتر میکند.
واژههای کلیدی: پیشبینی قیمت نفت، آریما، رگرسیون فازی، رگرسیون خودبازگشتی میانگین متحرک انباشته فازی، اوپک.
طبقهبندی JEL: E37، C53، C45.
1. مقدمه
عوامل زیادی بر قیمت نفت خام تأثیر میگذارند از این رو استفاده از یک مدل چند متغیری که تمام عوامل مؤثر بر قیمت نفت را لحاظ کرده باشد، اگر غیر ممکن نباشد امری دشوار و پرهزینه است. در این حالت، روش جایگزین، مدلهای تک متغیری است. در این مدلها از حافظه تاریخی متغیر برای مدلسازی و پیشبینی استفاده میشود. روشهای تک متغیری به دلیل سهولت وکارایی خوبی که در پیشبینی دارند همواره مورد توجه بودهاند. اخیراً الگوریتمهای ابتکاری و هوش مصنوعی[1] از جمله، شبکههای عصبی مصنوعی[2] و کاربردهای آن بهعنوان ابزاری قدرتمند در تجزیه و تحلیل دادهها، موجب شده است که توجه اقتصاددانان نیز به این روشهای بیشبینی جلب شود و مدلهای مختلفی جهت پیشبینی متغیرهای اقتصادی ساخته شود. اما از آنجا که اکثر این روشها برای حصول به نتیجه خوب نیاز به دادههای زیادی دارند و از طرف دیگر دسترسی به دادههای زیاد از نظر کمی و کیفی نیاز به زمان و هزینه زیادی دارد، روشهایی که بتوانند با دادههای کم پیشبینی مناسبی انجام دهند بسیار مورد توجه است. روشهای فازی[3] به دلیل فازی در نظر گرفتن اعداد، برای مدلسازی و پیشبینی نیاز به دادههای کمتری دارند. از این رو، هدف این مطالعه ارائه رویکردی جدید برای پیشبینی قیمت نفت خام با تعداد دادههای کم است. در این رویکرد از ترکیب مدلهای آریما[4] و رگرسیون فازی[5]، مدل رگرسیون خودبازگشتی میانگین متحرک انباشته فازی[6] برای پیشبینی قیمت نفت اوپک[7] استفاده میشود.
در ادامه مقاله و در بخش دوم مطالعات تجربی انجام گرفته در این زمینه به اختصار مرور میشود. در بخش سوم روششناسی تحقیق، در بخش چهارم تخمین مدل و در بخش پایانی نتیجهگیری ارائه میشود.
2. مطالعات تجربی انجام شده
مطالعات زیادی برای پیشبینی قیمت نفت انجام شده است که از جمله آنها میتوان به موارد زیر اشاره کرد.
گوری و دیگران[8]، برای بررسی رابطه بین قیمت و مصرف نفت خام، به مطالعه سه رویکرد رفتار خطی، رفتار سهمیگون و رفتار بینظم برای قیمت نفت خام پرداختند. نتایج این مطالعه نشان داد که سری زمانی قیمت نفت با مصرف نفت طی سالهای 1998-1980 همبستگی داشته است. قیمت نفت به صورت خطی طی دوره 2003-1980 افزایش یافته است که این منجر به کاهش مصرف طی همین سالها شده است. همچنین افزایش قیمت نفت در سال 2003، مصرف همان سال را کاهش داده است.
محمدی و سو[9]، سودمندی چندین مدل ARIMA-GARGH را برای مدلسازی و پیشبینی نوسانات قیمت هفتگی نفت خام یازده بازار بینالمللی طی دوره 1/2/1997 تا 10/3/2009 بررسی کردند. بدین منظور از مشاهدات دوره ژانویه 2009 تا اکتبر 2009 برای بررسی عملکرد پیشبینی خارج از نمونه چهار مدل EGARCH،APARCH [10]،FIGARCH [11][12] و [13]GARCH استفاده شده است. نتایج پیشبینی متفاوت هستند اما در اکثر موارد مدل APARCH عملکرد بهتری نسبت به دیگر مدلها دارد.
مدیر شانهچی و علیزاده (1385)، در مطالعه خود با استفاده از شبکه عصبی و رگرسیون عمومی، مدل هوشمندی را برای پیشبینی کوتاهمدت قیمت نفت خام ایران به صورت ماهیانه در طی دوره 2003-1985 ارائه کردهاند. نتایج این مدل شبیهسازی شده نشان داد که سیستم طراحی شده، پیشبینی بهتری در بازههای مختلف نسبت به مدل شبکه عصبی و رگرسیون عمومی از خود نشان میدهد.
بهرادمهر (1387) در مطالعهای برای پیشبینی قیمت نفت خام از روش ترکیبی تبدیل موجک[14] و شبکه عصبی مصنوعی استفاده کرده است. دوره زمانی به کار گرفته شده در این مطالعه 4/1/2000 تا 2/9/2004 است. نتایج این مطالعه نشان داد که معیار خطای پیشبینی (RMSE) در روش ترکیبی تبدیل موجک و شبکه عصبی، کاهش چشمگیری نسبت به حالت شبکه عصبی مصنوعی دارد.
دشتی رحمتآبادی و دیگران (1390)، تحقیقی با هدف معرفی الگوهای مطلوب پیشبینی برای قیمت نفت خام ایران انجام دادند. دادههای مورد استفاده به صورت هفتگی و طی دوره 2010-1997 است و پیشبینیها برای 10، 20 و 30 درصد دادههای یاد شده انجام شده است. آنها در این مطالعه برای پیشبینی از چهار الگوی شبکه عصبی و الگوی خودرگرسیون میانگین متحرک استفاده کردند. نتایج این مطالعه نشان داد که برای پیشبینی 10 درصد از دادههای قیمت نفت خام، الگوهای شبکه رگرسیون تعمیمیافته[15] و شبکه آبشاری پس انتشار[16] با تابع آموزش شبهنیوتنی،[17] به ترتیب با خطای کمتر از 1 و کمتر از 2 درصد دارای بهترین عملکرد هستند. همچنین به طور نسبی با افزایش درصد دادههای مورد استفاده در پیشبینی، دقت پیشبینیها به ویژه با افزایش از 10 درصد به 20 درصد رو به افول میرود. محققین در نهایت نشان دادند که دقت پیشبینی روش خودرگرسیون میانگین متحرک کمتر از الگوهای شبکهی عصبی ارزیابی میشود.
صادقی و دیگران (1390) نیز در مطالعهای عملکرد شبکه عصبی و مدل آریما در مدلسازی و پیشبینی کوتاهمدت سبد نفت خام اوپک را بررسی کردند. دادههای مورد استفاده در این مطالعه قیمت سبد نفت خام اوپک به صورت روزانه از 1/9/2003 تا 22/9/2009 بود. در این پژوهش، با مدلسازی قیمت سبد نفتخام اوپک به وسیله شبکه عصبی مصنوعی بر مبنای انتظارات قیمتی، به مطالعه تطبیقی[18] روش مذکور با فرایند خطی آریما در پیشبینی قیمت نفت پرداخته شده است. نتایج این مطالعه نشان داد که شبکه عصبی پیشخور از نظر تمامی معیارهای عملکرد، بر روش آریما برتری دارد. همچنین رویکرد شبکه عصبی مصنوعی در پیشبینی روزانه قیمت سبد نفت خام اوپک قادر است میزان نوسانات قیمتی را دقیقتر از روش آریما پیشبینی کند.
در ادامه چند نمونه از مطالعاتی که با استفاده از رویکرد فازی به پیشبینی متغیرهای اقتصادی و مالی پرداختهاند را به اختصار بررسی میکنیم.
از جمله این مطالعاتی میتوان به مطالعه آزاده و دیگران (2009) اشاره کرد که به پیشبینی مصرف نفت برای چهار کشور ژاپن، آمریکا، استرالیا و کانادا پرداختند. بدین منظور از متغیرهای جمعیت، هزینه نفت خام وارداتی، تولید ناخالص داخلی (GDP) و میزان نفت تولیدی استفاده کردند. در این تحقیق از دادههای سالانه برای دوره زمانی 2005-1990 استفاده شده است. سپس دقت دو مدل رگرسیون فازی و رگرسیون آماری را در پیشبینی مصرف نفت این کشورها با هم مقایسه کردند. نتایج بدست آمده حاکی از آن است که برای سه کشور کانادا، آمریکا و استرالیا رگرسیون فازی پیشبینی بهتری نسبت به رگرسیون آماری ارائه میدهد اما برای ژاپن نتایج رگرسیون آماری بهتر از رگرسیون فازی است.
تسانگ و دیگران[19] عملکرد مدل رگرسیون خودبازگشتی انباشته فازی را با مدلهای آریما، مدل سری زمانی چن[20] و مدل سری زمانی واتادا[21] به منظور پیشبینی نرخ ارز مقایسه کردند. آنها بدین منظور از 40 داده روزانه نرخ ارز (دلار تایوان به دلار آمریکا) طی دوره 1 آگوست 1996 تا 16 سپتامبر 1996 استفاده کردند. 30 مشاهده اول برای مدلسازی و 10 مشاهده آخر را برای ارزیابی عملکرد مدل به کار گرفته شده است. نتایج این مطالعه حاکی از این است که مدل رگرسیون خودبازگشتی انباشته فازی به مراتب پیشبینی دقیقتری نسبت به مدلهای دیگر دارد.
از دیگر مطالعات، مطالعه خاشعی و دیگران (2010) است که یک مدل ترکیبی از شبکههای عصبی مصنوعی و رگرسیون فازی به منظور پیشبینی سریهای زمانی ارائه دادند. آنها از اطلاعات دو متغیر نرخ ارز طی دوره 5 نوامبر تا 16 دسامبر 2005 (42 مشاهده) و قیمت طلا طی دوره 26 نوامبر 2005 تا 5 ژانویه 2006 استفاده کردند. به این دلیل که مدلهای شبکه عصبی مصنوعی به دادههای زیادی برای پیشبینی نیاز دارند، محققین در این مطالعه با ترکیب این مدل با مدل رگرسیون فازی، مدلی از ترکیب دو روش مزبور برای پیشبینی سریهای زمانی پیشنهاد کردند که با فازی در نظر گرفتن عوامل لایه میانی شبکه عصبی چند لایه پیشخور[22] (MFNN)، دادههای مورد نیاز برای حصول به نتایج مطلوب را کاهش دهند. نتایج به دست آمده بیانگر این است که مدل ترکیبی نه تنها توانایی انجام یک پیشبینی مناسب را داشته، بلکه بهترین و بدترین حالت ممکن را نیز فراهم میکند. همچنین این مدل در شرایط برابر، عملکرد بهتری نسبت به شبکههای چندلایه پیشخور و رگرسیون فازی دارد.
وانگ[23] مطالعه مقایسهای بین مدل سری زمانی فازی و مدل آریما با هدف پیشبینی صادرات تایوان انجام داد. مدل مورد بررسی از روش سری زمانی فازی شامل مدلهای اکتشافی[24] و مدل مارکوف[25] است. در این پژوهش برای تحقیق بیشتر در مورد این که آیا پیشبینی مدل به طول دوره مورد بررسی وابسته است، دوره مورد مطالعه به سه دوره زمانی تقسیم شده است. اولین دوره بین ژانویه 1995 تا مارس 2002 است که شامل 87 داده حجم صادرات میشود. دوره دوم بین ژانویه 1998 تا مارس 2002 است و کلاً شامل 51 مشاهده میشود و دوره سوم، شامل 27 مشاهده از ژانویه 2000 تا مارس 2002 است. نتایج حاصل از پیشبینی توسط مدلهای فوق برای سه دوره زمانی حاکی از این است که برای دوره زمانی طولانی مدل آریما خطای پیشبینی کمتری دارد اما وقتی که دوره زمانی کوتاهتر میشود عملکرد سری زمانی فازی بهتر میشود. همچنین مدل اکتشافی نسبت به مدل مارکف خطای پیشبینی کمتری دارد.
چنان که ملاحظه میشود، اکثر روشها مانند شبکههای عصبی و آریما که برای پیشبینی قیمت نفت استفاده شده است نیاز به دادههای زیادی دارند. اما با توجه به تغییرات سریع در بازار نفت، دادههای گذشته نمیتوانند بهخوبی قیمت آینده را با دقت پیشبینی کنند. از این رو، باید به دنبال روشهایی بود که با تعداد مشاهدات کم نیز عملکرد خوبی داشته باشند و پیشبینی دقیقی ارائه دهند. در این مطالعه ابتدا دو مدل رگرسیون فازی و آریما معرفی، سپس با استفاده از خواص این مدلها، مدل رگرسیون خودبازگشتی میانگین متحرک انباشته فازی ارائه میشود.
3. روششناسی تحقیق
در این بخش ابتدا مدلهای آریما و رگرسیون فازی و سپس مدل ترکیبی رگرسیون خودبازگشتی میانگین متحرک انباشته فازی که ترکیبی بهطور مختصر شرح داده میشود.
1-3.فرآیند آریما
بنا به تعریف دنباله تصادفی یک فرآیند تصادفی مختلط میانگین متحرک خودبازگشتی، با درجات p و q است به شرطی که داشته باشیم:
(1)
فرآیند فوق را به صورت آریما () نشان میدهند بهطوریکه p، d و q به ترتیب بیانگر تعداد جملات خودبازگشتی،[26] مرتبه تفاضلگیری و تعداد جملات میانگین متحرک[27] هستند. در صورتی که d برابر با صفر گردد، فرآیند آریما تبدیل به فرآیند آرما میشود. معمولاً برای تخمین الگوی آریما و آرما از روش باکس- جنکینز[28] استفاده میشود که دارای سه مرحله شناسایی، تخمین و تشخیص دقت پردازش است.
تعداد جملات خودبازگشتی و تعداد جملات میانگین متحرک معمولاً با استفاده از توابع خودهمبستگی[29] (AC) و خودهمبستگیجزئی[30] (PAC) براساس مراحل باکس- جنکینز محاسبه میشود. اما از آنجا که ممکن است مدلهای بهینه دیگری نیز وجود داشته باشند که بر الگوی مذکور ترجیح داده شوند، این مدلها توسط معیار اطلاعات آکائیک[31] (AIC) یا معیار شوارتز- بیزین[32] (SBC) بازبینی میشود، بهگونهای که مدل مناسب باید کمترین مقدار آماره آکائیک یا شوارتز- بیزین را داشته باشد.
2-3. رگرسیون فازی
تئوری مجموعه فازی اولین بار توسط لطفیزاده در سال 1965 پایهگذاری شد. از آن زمان تا به حال شاهد گسترش روزافزون جنبههای تئوری و عملی آن توسط دانشمندان علوم مختلف بودهایم، بهطوری که امروزه در اغلب علوم کاربرد دارد. مهمترین ویژگی منطق فازی در مقایسه با منطق کلاسیک این است که دانش و تجربه بشر را میتوان در قالب روابط ریاضی بیان کرد. این موضوع موجب شده است که بتوان مسائل دنیای واقعی را به خوبی با استفاده از منطق فازی مدلسازی کرد. پانزده سال بعد از معرفی نظریه مجموعههای فازی توسط لطفیزاده، رگرسیون فازی توسط تاناکا و دیگران[33] مورد بحث و بررسی قرار گرفت. از آن سال تاکنون مطالعات زیادی درباره رگرسیون فازی صورت گرفته است.
چون در مدلهای رگرسیون و آریما از مفهوم جمله خطا استفاده میشود، در مدلسازی این مدلها باید تمامی فروض مربوط به خطا را در نظر گرفته شود. تاناکا و دیگران (1987) برای جلوگیری از خطای مدلسازی، رگرسیون فازی را که یک مدل پیشبینی فاصلهای است، ارائه کرد. تخمینهای حاصل از این مدل مقادیر دقیقی هستند و شامل جمله خطا نیستند. یکی از روشهای رگرسیون فازی، روش رگرسیون امکانی فازی است که بهترین مدل رگرسیونی را با حداقل کردن میزان فازی بودن به دست میآورد. در این مدل ورودیها و خروجیها مشاهدات اعداد غیرفازی هستند، ولی خروجی محاسباتی اعداد فازی هستند. ارتباط بین متغیرهای ورودی و خروجی در این مدل به صورت زیر است[34]:
(2)
که در آن بردار متغیرهای مستقل است. ضرایب اعداد فازی هستند و برای n متغیر ورودی یک عدد فازی که خروجی فازی است، به دست میآید.
تابع عضویت ضرایب مدل رگرسیون به شکل اعداد فازی مثلثی[35] متقارن است که به صورت زیر تعریف میشود:
(3)
که در آن تابع عضویت مجموعه فازی و بیانگر عوامل است. در رابطه بالا و به ترتیب مرکز و پهنای تابع عضویت است، بنابراین است.[36] شکل عدد مثلثی متقارن بهصورت زیر است[37]:
بنابراین رابطه (2) را میتوان به صورت زیر نوشت:
(4)
پس با توجه به اصل گسترش حول مرکز تابع عضویت متغیر خروجی فازی به صورت زیر تعریف میشود:
(5)
که در آن c و s به ترتیب بردار مقادیر مربوط به عوامل و گسترشهای آنها حول مرکز هستند.
یکی از روشها برای حل مسئله رگرسیون فازی تبدیل مسئله رگرسیون خطی فازی به یک مسئله برنامهریزی خطی است. هدف مدل رگرسیون تعیین مقادیر بهینه است بهطوریکه درجه عضویت خروجی فازی مدل برای همه نقاط از یک مقدار معین h بزرگتر باشد. انتخاب مقدار h بر گسترش عوامل فازی مدل مؤثر است و توسط کاربر تعیین میشود.
(6)
با افزایش h میزان فازی بودن خروجیها نیز افزایش مییابد.[38] هدف حداقل کردن ضرایب فازی برای تمامی مجموعه دادهها است بنابراین تابع هدف و قیدهای مسئله برنامهریزی خطی را میتوان بهصورت زیر نشان داد.
(7)
با حل مدل برنامهریزی خطی فوق، ضرایب فازی حاصل میشود. با قرار دادن مقادیر بهدست آمده به جای ضرایب در معادله رگرسیون، متغیر خروجی بهصورت فازی تعیین میشود.
3-3. مدل ترکیبی
مدل آریما یک مدل دقیق پیشبینی برای دورههای کوتاهمدت است. اما یکی از محدودیتهای آن، نیازمند بودن به تعداد دادههای زیاد است. در حالی که امروزه به علت تغییرات سریع تکنولوژیکی و محیطی نیاز به روشهایی است که بتوانند با دادههای کم، پیشبینی دقیقی انجام دهند. مدل رگرسیون فازی توانایی پیشبینی خوب با تعداد دادههای کم را دارد. اما یکی از محدودیتهای آن این است که طول فاصله فازی معمولاً وسیع میشود و در این حالت تصمیمگیری مشکل میشود. در این بخش براساس مفاهیم مدل رگرسیون فازی و مدل آریما یک مدل رگرسیون خودبازگشتی میانگین متحرک انباشته فازی تخمین زده میشود تا محدودیت نیاز به تعداد دادههای زیاد در مدل آریما تا حد امکان رفع شود.
پارامترهای مدل آریما به صورت مقادیر قطعی، و هستند، در صورتی که در روش رگرسیون خودبازگشتی میانگین متحرک انباشته فازی پارامترهای استفاده شده فازی هستند، و و به شکل اعداد فازی مثلثی بهکار گرفته شدهاند. با استفاده از پارامترهای فازی نیاز به دادههای گذشته کاهش مییابد.[39] مدل رگرسیون خودبازگشتی میانگین متحرک انباشته فازی بهصورت زیر ارائه میشود.
با استفاده از مدل باکس- جنکینز سری زمانی یک فرآیند آریما با میانگین 𝜇 ساخته شده است.[40]
(8)
معادله بالا قابل تبدیل به صورت زیر است.
(9)
تابع عضویت مجموعه فازی که در آن پارامترهای فازی که به صورت اعداد فازی مثلثی متقارن هستند، با توجه به اصل گسترش به صورت رابطه زیر است.[41]
(10)
در رابطه (10) درجه عضویت خروجی فازی مدل برای همه مشاهدات از یک مقدار معین h بزرگتر است.
(12)
به عبارت دیگر مدل فازی شده S بهصورت زیر تعریف میشود.
(13)
که در آن ضریب خودهبستگی در وقفه زمانی و ضریب خودهبستگی جزئی در وقفه زمانی i است.
(14)
برای همه نامعادله برقرار است. در نهایت مدل رگرسیون انباشته فازی به صورت رابطه زیر است.
(15)
در این مطالعه، از رویکرد ارائه شده توسط ایشیبوچی و تاناکا (1988) برای شرایطی که دامنه پیشبینی وسیع است، استفاده میشود. در این حالت وقتی که دامنه مدل رگرسیون فازی وسیع است، دادههای حد بالا و پایین مدل حذف و سپس مدل مجدداً فرمولبندی میشود.
4-3. فازیزدایی[42]
چون ضرایب مدل رگرسیون، اعداد فازی هستند، متغیر خروجی نیز فازی است. پس برای اینکه بتوان در تصمیمگیری و مقایسه از آن استفاده کرد، باید به عدد غیرفازی تبدیل شود. به این فرآیند که طی آن به هر مجموعه فازی یک عدد نسبت داده میشود فازیزدایی میگویند. شیوههای متفاوتی برای فازیزدایی وجود دارد. در این مطالعه از روش مرکز سطح[43] برای فازیزدایی استفاده شده است که به صورت رابطه زیر بیان میشود:
(16)
5-3. معیارهای ارزیابی پیشبینی
در روشهای پیشبینی، دادهها به دو قسمت تقسیم میشود. از قسمت اول که دادههای آموزش هستند، برای برازش و تخمین مدل استفاده میشود. از قسمت دوم که دادههای پیشبینی هستند، برای آزمون مدل استفاده میشود. روشهای زیادی برای اندازهگیری دقت پیشبینی مدل وجود دارد که از جمله اینها میتوان به معیار ریشه میانگین مجذور خطا[44] (RMSE) اشاره کرد که یکی از متداولترین معیارهای ارزیابی بهشمار میرود.
(17)
از دیگر معیارهای متداول در ارزیابی پیشبینیها میتوان به میانگین مطلق خطاMAE)[45]) و معیار درصد میانگین مطلق خطاهای پیشبینی[46] (MAPE) اشاره کرد. امتیاز استفاده از شاخص میانگین مطلق خطاهای پیشبینی این است که میتوان از آن برای مقایسه پیشبینی سریهایی که دارای مقیاس متفاوت هستند، استفاده کرد؛ زیرا این شاخص وابسته به مقیاس نیست. این شاخص بهصورت زیر تعریف میشود:
(18)
شاخص میانگین مطلق خطا نیز به صورت زیر است:
(19)
ضریب نابرابری تایل[47] (TIC) یکی دیگر از شاخصهایی است که برای مقایسه عملکرد مدلهای پیشبینی بهکار برده میشود. این شاخص، شاخص RMSE را به گونهای تعدیل میکند که همواره بین صفر و یک قرار گیرد. هر چه مقادیر این شاخصها پایینتر باشد، دقت پیشبینی بیشتر است.
(20)
در روابط فوق n نشانگر تعداد دادهها مورد استفاده، Y مقادیر واقعی و مقادیر پیشبینی شده است.
4. مدلسازی و تخمین
دادههای مورد استفاده در این مطالعه شامل 106 مشاهده قیمت روزانه نفت خام اوپک از 9/6/2011 تا 3/11/2011 است که در نمودار 1 نشان داده شده است. این دادهها از دو قسمت تشکیل شدهاند. قسمت اول دادههای مربوط به دوره زمانی 9/6/2011 تا 24/10/2011 برای برازش مدل و قسمت دوم دادهها از 25/10/2011 تا 3/11/2011 برای اعتبارسنجی و مقایسه مدل خودبازگشتی میانگین متحرک انباشته فازی با رگرسیون فازی و فرآیند آریما مورد استفاده قرار گرفته است.
نمودار 1. داده روزانه قیمت نفت از 9 ژوئن تا 24 اکتبر 11 20
1-4. مدل آریما
در مدلهای آریما حداقل پنجاه و ترجیحاً یک صد یا بیشتر مشاهده بهکار گرفته میشود. در این مطالعه با بهکارگیری نرمافزارEviews6 از 106 مشاهده قیمت نفت اوپک که بهصورت روزانه از 9/6/2011 تا 3/11/2011 بود، استفاده شده است که از این تعداد 98 داده برای تخمین مدل و 8 داده آخر برای ارزیابی قدرت پیشبینی مدل مورد استفاده قرار گرفته است. برای مرحله نخست در پیشبینی دادههای سری زمانی با استفاده از فرآیند آریما، بررسی انباشتگی سری زمانی و تعیین درجه انباشتگی (d) است. در این پژوهش براساس آزمون دیکیفولر تعمیمیافته[48]، سری زمانی مورد بررسی بدون نیاز به تفاضلگیری مانا است. در مرحله بعد با استفاده از توابع خودهمبستگی (AC) و خودهمبستگی جزئی (PAC) تعداد جملات خودرگرسیو (p) و تعداد جملات میانگین متحرک (q) براساس مراحل باکس- جنکینز محاسبه شد. با توجه به اینکه ممکن است مدلهای دیگری نیز وجود داشته باشند که مقدار آکائیک و شوارتز کمتری داشته باشند، مدلهای دیگر نیز بررسی شد. از آنجا که تعداد دادههای مورد استفاده زیاد نیست، از معیار شوارتز برای تعیین مدل بهینه استفاده شد. که مدل (0,0,2)ARIMA برای سری قیمت نفت کمترین معیار شوارتز را بین مدلها با مرتبههای گوناگون داشته است. در نتیجه، این مدل به عنوان مدل بهینه انتخاب شد که به صورت زیر است.
(21)
نمودار 2 مقادیر واقعی و مقادیر برازش شده مدل میانگین متحرک خودبازگشتی انباشته را نشان میدهد.
نمودار 2. مقادیر واقعی و مقادیر برازش شده حاصل از مدل خودبازگشتی میانگین متحرک انباشته
2-4. رگرسیون فازی
برای تخمین مدل رگرسیون فازی از 54 داده مورد نظر (از 22/8/2011 تا 9/11/2011)، تعداد 46 مشاهده برای تخمین مدل رگرسیون فازی در نظر گرفته شده و 8 مشاهده برای ارزیابی و آزمون مدل بهکار رفته است. با توجه به مدل بهینه آریما مدل رگرسیون فازی را به صورت رابطه زیر در نظر گرفته شد.
(22)
نتایج حاصل از بهینهسازی پارامترهای فازی نشاندهنده ضرایب رگرسیون به ازای است، که از طریق حل مدل برنامهریزی خطی پارامترهای و به دست آمدهاند و در نهایت معادله رگرسیون فازی بهصورت رابطه زیر حاصل شد.
(23)
در نمودار 3 مقادیر واقعی و فواصل فازی نشان داده شده است. طول فواصل فازی بسیار وسیع شده و مدل رگرسیون فازی فواصل مناسبی را به دست نمیدهد.
نمودار 3. مقادیر واقعی، حد بالا و حد پایین مدل رگرسیون فازی
3-4. رگرسیون خودبازگشتی میانگین متحرک انباشته فازی
در این بخش با استفاده از مدل برازش شده آریما و مقادیر باقیماندهها اقدام به مدلسازی مدل رگرسیون خودبازگشتی میانگین متحرک انباشته فازی شد. سپس با استفاده از نرمافزار برنامهریزی خطی پارامترهای مدل نهایی به صورت زیر است.
(24)
نمودار 4. مقادیر واقعی، حد بالا و حد پایین مدل رگرسیون خودبازگشتی میانگین متحرک انباشته فازی (قبل از حذف مشاهدات پرت)
همانطور که در نمودار 4 ملاحظه میشود، دامنه مدل رگرسیون خودبازگشتی میانگین متحرک انباشته فازی به مراتب نسبت به مدل رگرسیون فازی کوتاهتر است. ولی هنوز طول فواصل فازی وسیع است. در این حالت با استفاده از روش ارائه شده توسط ایشیبوچی و تاناکا (1988)، دو مشاهده مربوط به روزهای 8 و 28 سپتامبر که خارج از فاصله فازی هستند و داده پرت محسوب میشوند، حذف و دوباره مدل فرمولبندی شد. نتیجه به صورت رابطه زیر است:
(25)
نتایج مدل خودرگرسیون فازی بعد از حذف مشاهدات پرت در نمودار 5 نشان داده شده است.
نمودار 5. واقعی، حد بالا و حد پایین مدل رگرسیون خودبازگشتی میانگین متحرک انباشته فازی (بعد از حذف مشاهدات پرت)
مقایسه شکلهای رسم شده حاکی از آن است که فاصله بازه حاصل از روش رگرسیون خودبازگشتی میانگین متحرک انباشته فازی کمتر است و نتایج بهتری ارائه میدهد. در جدول 1 با استفاده از مدلهای ارائه شده مقادیر آینده متغیر وابسته پیشبینی شده است.
همانطور که در جدول 1 مشاهده میشود، روشهای رگرسیون فازی و میانگین متحرک خودرگرسیون انباشته فازی با فراهم کردن بهترین و بدترین حالت، تصمیمگیری را نسبت به مدل آریما تسهیل کرده است. علاوه بر این، طول فاصله مدل رگرسیون خودبازگشتی میانگین متحرک انباشته فازی به مراتب کوتاهتر از مدل رگرسیون فازی است. در ادامه با استفاده از روش مرکز سطح متغیرهای خروجی فازیزدایی شده است، سپس از آمارههای RMSE، MAPE، MAE و TIC برای ارزیابی عملکرد این مدلها استفاده شده و نتایج در جدول 2 نشان داده شده است.
جدول 1. نتایج پیشبینی قیمت نفت از 25 اکتبر تا 3 نوامبر
تاریخ
|
مشاهدات واقعی
|
پیشبینی ARIMA
|
پیشبینی رگرسیون فازی
|
پیشبینی خودرگسیون انباشته فازی
(بعد از حذف)
|
حد بالا
|
حد پایین
|
حد بالا
|
حد پایین
|
25- اکتبر
|
11/108
|
51/107
|
17/110
|
09/104
|
69/108
|
19/107
|
26- اکتبر
|
27/107
|
06/108
|
76/110
|
65/104
|
86/107
|
35/106
|
27- اکتبر
|
53/107
|
94/106
|
65/110
|
51/104
|
93/108
|
43/107
|
28- 1کتبر
|
03/108
|
46/107
|
39/110
|
27/104
|
69/108
|
19/107
|
31- اکتبر
|
97/105
|
96/107
|
70/110
|
60/104
|
59/106
|
08/105
|
1- نوامبر
|
63/105
|
46/105
|
29/109
|
16/103
|
86/106
|
34/105
|
2- نوامبر
|
85/107
|
61/105
|
54/108
|
53/102
|
60/108
|
12/107
|
3- نوامبر
|
61/106
|
26/108
|
11/110
|
11/104
|
75/106
|
28/105
|
منبع: یافتههای تحقیق
مقایسه مقادیر جدول 2 حاکی از آن است که تمامی معیارهای ارزیابی عملکرد برتری مدلهای رگرسیون فازی و رگرسیون خودبازگشتی میانگین متحرک انباشته فازی (قبل و بعد از حذف مشاهدات پرت) نسبت به مدل آریما تأیید میشود. گفتنی است که تعداد دادههای مورد استفاده برای برازش مدلهای رگرسیون فازی و رگرسیون خودبازگشتی میانگین متحرک انباشته فازی کمتر از نصف دادههایی است که برای مدلسازی مدل آریما استفاده شده است. همچنین نتایج معیارهای ارزیابی عملکرد نشان میدهد مدل خودبازگشت میانگین متحرک انباشته فازی به مراتب عملکرد بهتری نسبت به مدل رگرسیون فازی عملکرد بهتری دارد. نکته قابل توجه دیگر این که با حذف مشاهدات پرت، عملکرد مدل رگرسیون خودبازگشتی میانگین متحرک انباشته فازی بهبود یافته است. همچنین باید به این نکته توجه کرد نتایج به دست آمده از این مطالعه مربوط به قیمت روزانه نفت خام اوپک است و ممکن است تغییر ساختار در قیمت نفت خام و همچنین در بازارهای دیگر این نتایج پایدار نباشد.
جدول2. مقایسه عملکرد مدلهای آریما، رگرسیون فازی و رگرسیون خودبازگشتی میانگین متحرک انباشته فازی
مدل
|
RMSE
|
MAE
|
MAPE
|
TIC
|
آریما
|
295/1
|
077/1
|
006/1
|
006/0
|
رگرسیون فازی
|
141/1
|
907/0
|
847/0
|
0053/0
|
رگرسیون خودبازگشتی میانگین متحرک انباشته فازی (قبل از حذف)
|
383/0
|
318/0
|
297/0
|
0018/0
|
رگرسیون خودبازگشتی میانگین متحرک انباشته فازی (بعد از حذف)
|
368/0
|
286/0
|
268/0
|
0017/0
|
منبع: یافتههای تحقیق
5. نتیجهگیری
تغییرات قیمت جهانی نفت در کشورهای صادرکننده نفت مانند ایران، سبب بروز بحرانهای مختلف و همچنین تشدید تورم، رکود یا هر دو میشود. بنابراین پیشبینی دقیق قیمت از طریق کاهش نوسانات قیمتی، بسیار مهم است. در مطالعه حاضر از مدل سری زمانی آریما، رگرسیون فازی و رگرسیون خودبازگشتی میانگین متحرک انباشته فازی برای پیشبینی قیمت روزانه نفت اوپک استفاده شد. هدف این مطالعه مقایسه عملکرد این مدلها است. بدین منظور از معیارهای RMSE، MAE، MAPEو TIC استفاده شده است. نتایج نشان که مدل رگرسیون خودبازگشتی میانگین متحرک انباشته فازی نسبت به دو مدل دیگر پیشبینی دقیقتری دارد. در نتیجه میتوان از این مدل بهعنوان ابزاری دقیق برای پیشبینی قیمت نفت استفاده کرد. علاوه بر این، از دیگر مزیتهای مدل رگرسیون خودبازگشتی میانگین متحرک انباشته فازی این است که اولاً بدترین و بهترین حالت ممکن را برای تصمیمگیرنده مشخص میکند و موجب تسهیل و اطمینان در تصمیمگیری میشود. ثانیاً نسبت به مدل آریما نیاز به تعداد دادههای کمتری دارد. ثالثاٌ چون دادهها بهصورت فازی است، لازم نیست که در ارتباط با جمله خطا، فروض خاصی قائل شد.
منابع
الف- فارسی
بهرادمهر، نفیسه (1387)، «پیشبینی قیمت نفت با استفاده از هموارسازی موجک و شبکه عصبی مصنوعی»، فصلنامه مطالعات اقتصاد انرژی، سال پنجم، شماره 18، صفحات 98-81.
دشتی رحمتآبادی، ابراهیم، محمدی، حمید و زکریا فرجزاده (1390)، «ارزیابی عملکرد الگوهای شبکه عصبی و خودرگرسیون میانگین متحرک در پیشبینی قیمت نفت خام ایران»، فصلنامه مطالعات اقتصاد انرژی، سال هشتم، شماره 28، صفحات 118-97.
صادقی، حسین، ذوالفقاری، مهدی و مهدی الهامینژاد (1390)، «مقایسه عملکرد شبکههای عصبی و مدل در مدلسازی و پیشبینی کوتاهمدت قیمت سبد نفت خام اوپک با تأکید بر انتظارات تطبیقی»، فصلنامه مطالعات اقتصاد انرژی، سال هشتم، شماره 28، صفحات 47-25.
کورهپزان دزفولی، امین (1384)، اصول تئوری مجموعههای فازی و کاربردهای آن در مدلسازی مسائل مهندسی آب، انتشارات جهاد دانشگاهی واحد صنعتی امیر کبیر.
گجراتی، دامور (1377)، مبانی اقتصادسنجی، چاپ تهران، دانشگاه تهران، مؤسسه انتشارات، ویرایش دوم.
مدیر شانهچی، محمدحسین و ارغوان علیزاده (1385)، «پیشبینی کوتاهمدت قیمت نفت با استفاده از شبکه عصبی»، فصلنامه مطالعات اقتصاد انرژی، سال سوم، شماره 9، صفحات 27-1.
ب- انگلیسی
Azadeh, A., Khakestani, M. and M. Saberi (2009), “A Flexible Fuzzy Regression Algorithm for Forecasting Oil Consumption Estimation”, Energy Policy, No. 37, pp. 5567-5579.
Gori, Fieder, Ludovisi, David and Paulo Cerritelli (2007), “Forecast of Oil Price and Consumption in the Short Term under Three Scenarios: Parabolic, Linear and Chaotic Behavior”, Energy, Vol. 32, No. 1291-1296.
Ishibuchi, H. and H. Tanaka (1988), “Interval Regression Analysis Based on Mixed 0-1 Integer Programming Problem”, J. Japan Soc. Ind. Eng, Vol. 40, No. 5, pp. 312-319.
Khashei, Mehdi, Hejazi, Seyed Reza and Mehdi Bijari (2008), “A New Hybrid Artificial Neural Networks and Fuzzy Regression Model for Time Series Forecasting”, Fuzzy Sets and Systems, No. 159, pp. 769 -786.
Mohammadi, Hassan and Lixian Su (2010), “International Evidence on Crude Oil Price Dynamics: Applications of ARIMA-GARCH Models”, Energy Economics, No. 32, pp. 1001–1008.
Tanaka, H. and H. Ishibuchi (1992), “Possibility Regression Analysis Based on Linear Programming”, in: J. Kacprzyk, M. Fedrizzi (Eds.), Fuzzy Regression Analysis, Omnitech Press, Warsaw and Physica-Verlag, Heidelberg. (1992) 47 -60.
Tanaka, S. and K. Uejima (1987), “Linear Regression Analysis with Fuzzy Model”, IEEETrans, Systems, Man Cybernet, Vol. 12, No. 6, pp. 903-907.
Tseng, F. M., Tzeng, G. H., Yu, H. C. and B. J. C. Yuan (2001), “Fuzzy ARIMA Model for Forecasting the Foreign Exchange Market”, Fuzzy Sets and Systems, No. 118, pp. 9-19.
Wang, Chi-Chen (2011), “A Comparison Study between Fuzzy Time Series Model and ARIMA Model for Forecasting Taiwan Export”, Expert Systems with Applications, No. 38, pp. 9296-9304.
Wang, H. F. and R. C. Tsaur (2000), “Insight of a Fuzzy Regression Model”, Fuzzy Sets and Systems, Vol. 112, No. 3, pp. 355-369.
Yen, K. K., Ghoshray, S. and G. Roig (1999), “A Linear Regression Model Using Triangular Fuzzy Number Coefficients”, Fuzzy Sets and Systems, No. 106, pp. 167-177.
Zimmerman, H. J. (1996), Fuzzy Sets Theory and its Applications, Kluwer, Dordrecht.