Friday, 7 July 2017

อัต แบบบูรณาการ เคลื่อนไหว ค่าเฉลี่ย โมเดล


ค่าเฉลี่ยเคลื่อนที่แบบอัตถดถอย - ARIMA DEFINITION ของค่าเฉลี่ยเคลื่อนที่แบบอัตโนมัติแบบอัตถดถอย - ARIMA แบบจำลองการวิเคราะห์ทางสถิติที่ใช้ข้อมูลชุดเวลาเพื่อคาดการณ์แนวโน้มในอนาคต เป็นรูปแบบหนึ่งของการวิเคราะห์การถดถอยที่พยายามจะคาดการณ์การเคลื่อนไหวในอนาคตตามการเดินแบบสุ่มที่ดูเหมือนโดยหุ้นและตลาดการเงินโดยการตรวจสอบความแตกต่างระหว่างค่าในชุดแทนที่จะใช้ค่าข้อมูลจริง ความล่าช้าของซีรี่ส์ที่แตกต่างกันจะเรียกว่าการล่วงประเวณีและการล่าช้าภายในข้อมูลที่คาดการณ์จะเรียกว่าค่าเฉลี่ยเคลื่อนที่ การลดลงของค่าเฉลี่ยแบบรวมอัตโนมัติ - ARIMA ประเภทของโมเดลนี้โดยทั่วไปจะเรียกว่า ARIMA (p, d, q) โดยมีจำนวนเต็มหมายถึงอัตรอัตโนม รวมและส่วนค่าเฉลี่ยเคลื่อนที่ของชุดข้อมูลตามลำดับ การสร้างแบบจำลอง ARIMA สามารถพิจารณาแนวโน้มตามฤดูกาลได้ (p, d, q) โมเดลสำหรับการวิเคราะห์อนุกรมเวลาในชุดก่อนหน้าของบทความ (ตอนที่ 1 2 และ 3) เราเข้าสู่ รายละเอียดที่สำคัญเกี่ยวกับแบบจำลองเชิงเส้นเวลา AR (p), MA (q) และ ARMA (p, q) เราใช้โมเดลเหล่านี้ในการสร้างชุดข้อมูลจำลองโมเดลที่พอดีเพื่อกู้คืนพารามิเตอร์แล้วใช้โมเดลเหล่านี้กับข้อมูลความเสมอภาคทางการเงิน ในบทความนี้เราจะหารือเกี่ยวกับการขยายโมเดล ARMA นั่นคือแบบจำลองการเคลื่อนที่แบบรวมอัตโนมัติแบบอัตถดถอยหรือแบบจำลอง ARIMA (p, d, q) เราจะเห็นว่าจำเป็นต้องพิจารณารูปแบบ ARIMA เมื่อเรามีชุดที่ไม่ใช่แบบหยุดนิ่ง ชุดดังกล่าวเกิดขึ้นในที่ที่มีแนวโน้มแบบสุ่ม สรุปย่อและขั้นตอนถัดไปจนถึงปัจจุบันเราได้พิจารณารูปแบบต่อไปนี้ (ลิงก์จะนำคุณไปสู่บทความที่เหมาะสม): เราได้สร้างความเข้าใจเกี่ยวกับชุดข้อมูลเกี่ยวกับอนุกรมเวลาอย่างต่อเนื่องเช่นความสัมพันธ์แบบอนุกรม stationarity ความเป็นเส้นตรงส่วนที่เหลือ correlograms, การจำลอง, เหมาะสม, ตามฤดูกาล, การทดสอบความสมมาตรและการทดสอบสมมุติฐานตามเงื่อนไข ยังไม่มีการคาดการณ์หรือคาดการณ์จากแบบจำลองของเราและยังไม่มีกลไกในการสร้างระบบการซื้อขายหรือส่วนของผู้ถือหุ้น เมื่อเราได้ศึกษา ARIMA (ในบทความนี้) ARCH และ GARCH (ในบทความถัดไป) เราจะอยู่ในฐานะที่จะสร้างกลยุทธ์การซื้อขายระยะยาวขั้นพื้นฐานขึ้นอยู่กับการคาดการณ์ผลตอบแทนของดัชนีตลาดหุ้น แม้ว่าข้อเท็จจริงที่ว่าฉันได้ศึกษารายละเอียดเกี่ยวกับรูปแบบต่างๆที่เราทราบแล้วว่าในที่สุดจะไม่มีผลงานที่ยอดเยี่ยม (AR, MA, ARMA) ขณะนี้เรามีความรอบรู้ในกระบวนการสร้างแบบจำลองของซีรีส์อนุกรมแล้ว ซึ่งหมายความว่าเมื่อเรามาศึกษารูปแบบใหม่ล่าสุด (และแม้แต่ในวรรณคดีวิจัย) เราจะมีฐานความรู้ที่สำคัญในการวาดเพื่อประเมินรูปแบบเหล่านี้ได้อย่างมีประสิทธิภาพแทนการปฏิบัติต่อพวกเขาเป็นกุญแจสำคัญในการแก้ไข ใบสั่งยาหรือกล่องสีดำ ที่สำคัญกว่านี้ก็จะช่วยให้เรามีความมั่นใจในการขยายและปรับเปลี่ยนข้อมูลเหล่านี้ด้วยตัวเองและทำความเข้าใจกับสิ่งที่เรากำลังทำอยู่เมื่อเราทำเช่นนี้ขอขอบคุณที่อดทนรอเพราะอาจดูเหมือนว่าบทความเหล่านี้อยู่ห่างไกลออกไป การดำเนินการจริงของการซื้อขายจริง อย่างไรก็ตามการวิจัยการซื้อขายเชิงปริมาณที่แท้จริงคือการระมัดระวังวัดและใช้เวลาอย่างมากในการรับสิทธิ์ ไม่มีการแก้ไขอย่างรวดเร็วหรือรับรูปแบบที่หลากหลายในการซื้อขายควอนตัม เกือบจะพร้อมที่จะพิจารณารูปแบบการซื้อขายของเราเป็นครั้งแรกซึ่งจะเป็นส่วนผสมของ ARIMA และ GARCH ดังนั้นจึงจำเป็นอย่างยิ่งที่เราต้องใช้เวลาในการทำความเข้าใจกับรูปแบบ ARIMA อย่างมากเมื่อเราสร้างรูปแบบการซื้อขายครั้งแรกของเราแล้วเราจะพิจารณาเพิ่มเติม (เช่นตัวกรองคาลมาน) และแบบจำลองแบบอัตรภูมิ (Vector Caracticive - VAR) ซึ่งจะนำพาเราไปสู่กลยุทธ์การซื้อขายแบบอื่นที่มีความซับซ้อนมากขึ้น โมเดล ARIMA ถูกใช้เนื่องจากสามารถลดชุดที่ไม่ใช่แบบหยุดนิ่งลงในชุดเครื่องเขียนโดยใช้ลำดับขั้นตอนที่แตกต่างกัน เราสามารถเรียกคืนจากบทความเกี่ยวกับเสียงสีขาวและการเดินแบบสุ่มถ้าเราใช้โอเปอเรเตอร์ที่แตกต่างกันไปกับซีรีส์การเดินแบบสุ่ม (ชุดที่ไม่ใช่แบบหยุดนิ่ง) เราจะปล่อยให้เสียงสีขาว (ชุด stationary): เริ่ม nabla xt xt - x wt end ARIMA จะทำหน้าที่นี้เป็นหลัก แต่จะทำซ้ำหลาย ๆ ครั้งเพื่อลดชุดที่ไม่ใช่ stationary ให้เป็น stationary เพื่อที่จะจัดการรูปแบบอื่น ๆ ที่ไม่ใช่ stationarity เกินแนวโน้มแบบสุ่มสามารถใช้รูปแบบเพิ่มเติม ผลกระทบตามฤดูกาล (เช่นที่เกิดขึ้นในราคาสินค้าโภคภัณฑ์) สามารถจับคู่กับรุ่น ARIMA ตามฤดูกาล (SARIMA) อย่างไรก็ตามเราจะไม่พูดคุยเกี่ยวกับ SARIMA ในชุดนี้ (เช่นเดียวกับกลุ่มความผันผวนในดัชนีหุ้น) สามารถจัดการกับ ARCHGARCH ในบทความนี้เราจะพิจารณาชุดที่ไม่ใช่แบบหยุดนิ่งที่มีแนวโน้มแบบสุ่มและให้พอดีกับโมเดล ARIMA ในชุดเหล่านี้ เราจะสร้างการคาดการณ์สำหรับชุดข้อมูลทางการเงินของเราในที่สุด นิยามก่อนที่จะกำหนดกระบวนการ ARIMA เราต้องพูดถึงแนวความคิดของชุดข้อมูลแบบผสมผสาน: ซีรีส์แบบรวมของออร์เดอร์ d ชุดเวลาที่รวมอยู่ในใบสั่ง d. (d) ถ้า: begin nablad xt wt end นั่นคือถ้าเราแตกต่างชุด d ครั้งที่เราได้รับชุดสัญญาณรบกวนแบบแยกสีขาว อีกทางเลือกหนึ่งคือการใช้ Backward Shift Operator เป็นเงื่อนไขที่เหมือนกันคือตอนนี้เราได้กำหนดชุดข้อมูลแบบบูรณาการแล้วเราสามารถกำหนดกระบวนการ ARIMA ได้นั่นคือแบบจำลองอัตถดถอยเชิงรุกแบบบูรณาการของลำดับ p, d, q ชุดข้อมูลเวลาคือโมเดลเฉลี่ยเคลื่อนที่เชิงรุกแบบอัตถดถอย ของลำดับ p, d, q ARIMA (p, d, q) ถ้า nablad xt เป็นค่าเฉลี่ยเคลื่อนที่ของออร์เดอร์ p, q, ARMA (p, q) นั่นคือถ้าชุดมีความแตกต่าง d ครั้งและมันก็เป็นไปตามกระบวนการ ARMA (p, q) แล้วมันก็เป็นชุด ARIMA (p, d, q) ถ้าเราใช้สัญกรณ์พหุนามจากส่วนที่ 1 และส่วนที่ 2 ของชุด ARMA ขั้นตอน ARIMA (p, d, q) สามารถเขียนได้ในแง่ของ Backward Shift Operator : ที่ไหน wt เป็นชุดสัญญาณเสียงรบกวนแบบแยกสีขาว มีข้อควรทราบเกี่ยวกับคำจำกัดความเหล่านี้ เนื่องจากการเดินแบบสุ่มจะได้รับโดย xt x wt จะเห็นได้ว่า I (1) เป็นตัวแทนอื่นเนื่องจาก nabla1 xt wt. หากเราสงสัยว่าเทรนด์แบบไม่เป็นเชิงเส้นเราอาจจะสามารถใช้ความแตกต่างซ้ำ ๆ (เช่น d gt 1) เพื่อลดชุดเสียงรบกวนให้เป็นสีขาว ใน R เราสามารถใช้คำสั่ง diff พร้อมกับพารามิเตอร์เพิ่มเติมเช่น diff (x, d3) เพื่อทำซ้ำความแตกต่าง การจำลองสถานการณ์ Correlogram และการปรับรุ่นเนื่องจากเราได้ใช้คำสั่ง arima. sim เพื่อจำลองกระบวนการ ARMA (p, q) ขั้นตอนต่อไปนี้จะคล้ายกับที่ดำเนินการในส่วนที่ 3 ของชุด ARMA ความแตกต่างที่สำคัญที่สุดคือตอนนี้เราจะตั้งค่า d1 นั่นคือเราจะผลิตชุดเวลาที่ไม่ใช่แบบหยุดนิ่งที่มีส่วนประกอบแนวโน้ม stochastic ก่อนที่เราจะพอดีกับแบบจำลอง ARIMA กับข้อมูลจำลองของเราพยายามที่จะกู้คืนพารามิเตอร์สร้างช่วงความเชื่อมั่นสำหรับพารามิเตอร์เหล่านี้สร้าง correlogram ของส่วนที่เหลือของรูปแบบที่พอดีและในที่สุดจะดำเนินการทดสอบ Ljung-Box เพื่อระบุว่าเรามีอยู่หรือไม่ พอดี เราจะจำลองแบบ ARIMA (1,1,1) โดยมีค่าสัมประสิทธิ์อัตถาพะอัลฟา 0.6 และค่าสัมประสิทธิ์การเคลื่อนที่เบต้า - 0.5 นี่คือโค้ด R เพื่อจำลองและพล็อตชุดดังกล่าว: ตอนนี้เรามีชุดจำลองของเราที่เรากำลังจะลองและพอดีกับรูปแบบ ARIMA (1,1,1) เนื่องจากเราทราบคำสั่งที่เราจะระบุในแบบพอดี: ช่วงความเชื่อมั่นคำนวณเป็น: การประมาณการพารามิเตอร์ทั้งสองอยู่ในช่วงความเชื่อมั่นและใกล้เคียงกับค่าพารามิเตอร์ที่แท้จริงของชุด ARIMA แบบจำลอง ดังนั้นเราจึงไม่ควรแปลกใจที่เห็นส่วนที่เหลือมองไปเช่นการรับสัญญาณรบกวนสีขาวแบบไม่ต่อเนื่อง: ในที่สุดเราสามารถเรียกใช้การทดสอบ Ljung-Box เพื่อให้หลักฐานทางสถิติว่ามีความเหมาะสม: เราจะเห็นว่าค่า p มีค่ามากกว่า 0.05 และเป็นเช่นเราสามารถระบุว่ามีหลักฐานที่ชัดเจนสำหรับเสียงสีขาวแยกเป็นแบบที่ดีในการที่เหลือ ดังนั้นรูปแบบ ARIMA (1,1,1) จึงเหมาะสมอย่างที่คาดไว้ ข้อมูลทางการเงินและการคาดการณ์ในส่วนนี้เราจะปรับรูปแบบ ARIMA ให้เป็น Amazon, Inc. (AMZN) และ SampP500 US Equity Index (GPSC ใน Yahoo Finance) เราจะใช้ห้องสมุดคาดการณ์ที่เขียนขึ้นโดย Rob J Hyndman ให้เราดำเนินการติดตั้งไลบรารีใน R: ตอนนี้เราสามารถใช้ quantmod เพื่อดาวน์โหลดชุด Amazon ราคารายวันได้ตั้งแต่ต้นปี 2013 เนื่องจากเราจะได้รับคำสั่งซื้อชุดแรกของชุดนี้ ไม่จำเป็นต้องใช้ d gt 0 สำหรับคอมโพเนนต์แบบรวม: เช่นเดียวกับในตอนที่ 3 ของชุด ARMA เราจะวนรอบการรวมกันของ p, d และ q เพื่อค้นหารูปแบบ ARIMA ที่ดีที่สุด (p, d, q) โดยที่ดีที่สุดเราหมายถึงชุดคำสั่งซื้อที่ลด Akaike Information Criterion (AICACI Criterion): เราจะเห็นว่าได้เลือกลำดับของ p4, d0, q4 แล้ว โดยเฉพาะอย่างยิ่งเมื่อพิจารณาถึงความแตกต่างของลำดับแรกข้างต้นแล้ว: ถ้าเราคำนวณ correlogram ของเศษที่เหลือเราจะเห็นได้ว่าเรามีหลักฐานสำหรับชุดสัญญาณรบกวนสีขาวแบบแยก: มีสองยอดที่สำคัญคือที่ k15 และ k21 ถึงแม้ว่าเราควร คาดว่าจะเห็นยอดที่มีนัยสำคัญทางสถิติเพียงเพราะรูปแบบการสุ่มตัวอย่าง 5 ครั้ง ให้ลองทดสอบ Ljung-Box (ดูบทความก่อนหน้านี้) และดูว่าเรามีหลักฐานเพียงพอหรือไม่: เนื่องจากเราสามารถเห็นค่า p มากกว่า 0.05 ดังนั้นเราจึงมีหลักฐานว่ามีความเหมาะสมที่ระดับ 95 ขณะนี้เราสามารถใช้คำสั่งคาดการณ์จากไลบรารีคาดการณ์ล่วงหน้าเพื่อคาดการณ์ล่วงหน้าได้ถึง 25 วันสำหรับชุดค่าผลตอบแทนของ Amazon: เราสามารถดูการคาดการณ์จุดในอีก 25 วันโดยมีแถบข้อผิดพลาด 95 (สีน้ำเงินเข้ม) และ 99 (สีฟ้าอ่อน) . เราจะใช้การคาดการณ์เหล่านี้ในกลยุทธ์การซื้อขายแบบเป็นครั้งแรกของเราเมื่อเรามารวม ARIMA และ GARCH ให้ปฏิบัติตามขั้นตอนเดียวกันกับ SampP500 ประการแรกเราได้ข้อมูลจาก quantmod และแปลงเป็น stream ส่งกลับรายวัน: เราพอดีกับรูปแบบ ARIMA โดยการวนรอบค่าของ p, d และ q: AIC บอกเราว่ารูปแบบที่ดีที่สุดคือ ARIMA (2,0, 1) แบบจำลอง สังเกตอีกครั้งว่า d0 เนื่องจากเราได้นำเอาความแตกต่างของลำดับแรกของซีรี่ส์มาใช้: เราสามารถคำนวณส่วนที่เหลือของโมเดลที่พอดีเพื่อดูว่าเรามีหลักฐานเสียงรบกวนสีขาวแบบไม่ต่อเนื่องหรือไม่: correlogram ดูดีมีแนวโน้มดังนั้นขั้นตอนต่อไปคือการเรียกใช้ การทดสอบ Ljung-Box และยืนยันว่าเรามีแบบอย่างที่ดี: เนื่องจากค่า p มากกว่า 0.05 เรามีหลักฐานว่ามีรูปแบบที่เหมาะสม ทำไมในบทความก่อนหน้านี้การทดสอบ Ljung-Box ของเราสำหรับ SampP500 แสดงให้เห็นว่า ARMA (3,3) ไม่เหมาะสำหรับการส่งคืนข้อมูลรายวันโปรดแจ้งให้ทราบว่าฉันได้ตัดทอนข้อมูล SampP500 โดยเจตนาเพื่อเริ่มต้นตั้งแต่ปี 2556 เป็นต้นไปในบทความนี้ ซึ่งช่วยลดระยะเวลาระเหยได้ง่ายในช่วงปี 2550-2551 ดังนั้นเราได้ยกเว้นส่วนใหญ่ของ SampP500 ที่เรามีความผันผวนมากจัดกลุ่ม สิ่งนี้ส่งผลต่อความสัมพันธ์แบบอนุกรมของซีรีส์และด้วยเหตุนี้จึงมีผลต่อการทำให้ซีรี่ส์มีความคงที่มากกว่าที่เคยเป็นมาในอดีต นี่เป็นจุดสำคัญมาก เมื่อวิเคราะห์ชุดเวลาเราจำเป็นต้องระมัดระวังอย่างมากในชุดแบบจำลองที่มีเงื่อนไขเช่นดัชนีตลาดหุ้น ในเชิงปริมาณการเงินพยายามที่จะกำหนดระยะเวลาของความผันผวนที่แตกต่างกันมักจะเรียกว่าการตรวจสอบระบบ เป็นหนึ่งในงานที่หนักขึ้นเพื่อให้บรรลุดีพูดถึงประเด็นนี้ในบทความต่อไปเมื่อเราพิจารณารูปแบบ ARCH และ GARCH ตอนนี้เรามีความสามารถในการพอดีและคาดการณ์แบบจำลองต่างๆเช่น ARIMA ได้ใกล้เคียงกับความสามารถในการสร้างตัวชี้วัดเชิงกลยุทธ์สำหรับการซื้อขาย ขั้นตอนถัดไปในบทความถัดไปเราจะดูที่โมเดล GARCH (generalised Autoregressive Conditional Heteroscedasticity) ที่มีเงื่อนไขและใช้เพื่ออธิบายความสัมพันธ์แบบอนุกรมในตราสารทุนและหุ้นดัชนีบางรายการ เมื่อเราได้กล่าวถึง GARCH แล้วเราจะสามารถรวมกับรูปแบบ ARIMA และสร้างตัวบ่งชี้สัญญาณและเป็นกลยุทธ์การซื้อขายเชิงปริมาณขั้นพื้นฐาน เพิ่งเริ่มต้นกับการค้าขายเชิงปริมาณ RIMA ย่อมาจาก Autoregressive Integrated Moving Average model (single vector) ARIMA เป็นเทคนิคการพยากรณ์ที่คาดการณ์มูลค่าในอนาคตของชุดข้อมูลโดยอิงกับความเฉื่อยของตัวเอง การประยุกต์ใช้หลักของมันอยู่ในพื้นที่ของการคาดการณ์ในระยะสั้นที่ต้องใช้จุดข้อมูลทางประวัติศาสตร์อย่างน้อย 40 จุด ใช้งานได้ดีที่สุดเมื่อข้อมูลของคุณมีรูปแบบที่มั่นคงหรือสอดคล้องกันตลอดเวลาโดยมีจำนวนข้อผิดพลาดน้อยที่สุด บางครั้งเรียกว่า Box-Jenkins (หลังจากผู้เขียนต้นฉบับ) ARIMA มักจะดีกว่าเทคนิคการทำให้เกิดการชี้แจงเมื่อข้อมูลมีความยาวและความสัมพันธ์ระหว่างการสังเกตในอดีตมีเสถียรภาพ หากข้อมูลสั้นหรือมีความผันผวนสูงวิธีการปรับความเรียบบางวิธีอาจทำงานได้ดีขึ้น หากคุณไม่มีจุดข้อมูลอย่างน้อย 38 จุดคุณควรพิจารณาวิธีการอื่นนอกเหนือจาก ARIMA ขั้นตอนแรกในการใช้วิธีการ ARIMA คือการตรวจสอบ stationarity Stationarity แสดงให้เห็นว่าซีรีย์ยังคงอยู่ในระดับที่คงที่ตลอดเวลา หากมีแนวโน้มเช่นเดียวกับในแอปพลิเคชันทางเศรษฐกิจหรือธุรกิจส่วนใหญ่ข้อมูลของคุณจะยังคงอยู่ไม่หยุดนิ่ง ข้อมูลควรแสดงความแปรปรวนของความผันผวนตลอดเวลา นี่ดูได้อย่างง่ายดายด้วยชุดที่มีฤดูกาลมากและเติบโตขึ้นในอัตราที่รวดเร็วขึ้น ในกรณีเช่นนี้การขึ้นและการดาวน์ในฤดูกาลจะทวีความรุนแรงมากขึ้นเมื่อเวลาผ่านไป หากไม่พบเงื่อนไขการหยุดนิ่งเหล่านี้จะไม่สามารถคำนวณการคำนวณจำนวนมากที่เกี่ยวข้องกับกระบวนการนี้ได้ หากพล็อตข้อมูลแบบกราฟิกแสดงถึงความไม่เสถียรภาพคุณควรแตกต่างจากชุดข้อมูล Differencing เป็นวิธีที่ยอดเยี่ยมในการเปลี่ยนชุดแบบไม่ต่อเนื่องให้เป็นแบบคงที่ โดยการลบคำสังเกตในช่วงเวลาปัจจุบันออกจากข้อสังเกตก่อนหน้านี้ หากการแปลงนี้ทำเพียงครั้งเดียวกับชุดคุณจะกล่าวว่าข้อมูลนี้มีความแตกต่างกันเป็นครั้งแรก ขั้นตอนนี้เป็นหลักช่วยลดแนวโน้มหากชุดของคุณมีอัตราการเติบโตที่ค่อนข้างคงที่ หากอัตราการเติบโตเพิ่มขึ้นคุณสามารถใช้ขั้นตอนเดียวกันและทำให้ข้อมูลแตกต่างกันได้อีก จากนั้นข้อมูลของคุณจะแตกต่างกันไป Autocorrelations เป็นค่าตัวเลขที่ระบุว่าชุดข้อมูลเกี่ยวข้องกับตัวเองอย่างไรเมื่อเวลาผ่านไป อย่างแม่นยำมากขึ้นจะวัดว่าค่าข้อมูลอย่างมากที่ช่วงระยะเวลาที่ระบุเป็นจำนวนเท่าใดมีความสัมพันธ์กันเมื่อเวลาผ่านไป จำนวนรอบระยะเวลาโดยปกติจะเรียกว่าความล่าช้า ตัวอย่างเช่นค่าความสัมพันธ์ระหว่างความคลาดเคลื่อน 1 วัดค่าที่แตกต่างกันของช่วงเวลา 1 ช่วงเวลาที่มีความสัมพันธ์กันในชุดข้อมูล ความสัมพันธ์กันที่ความล่าช้า 2 วัดว่าข้อมูลสองช่วงเวลามีความสัมพันธ์กันอย่างไรในซีรี่ส์ Autocorrelations อาจอยู่ในช่วงตั้งแต่ 1 ถึง -1 ค่าใกล้เคียงกับ 1 แสดงถึงความสัมพันธ์ทางบวกที่สูงในขณะที่ค่าใกล้เคียงกับ -1 แสดงถึงความสัมพันธ์เชิงลบสูง มาตรการเหล่านี้มักได้รับการประเมินผ่านทางกราฟฟิกที่เรียกว่า correlagrams correlagram แปลงค่าความสัมพันธ์แบบอัตโนมัติสำหรับชุดข้อมูลหนึ่ง ๆ ที่มีความล่าช้าต่างกัน นี่เรียกว่าฟังก์ชัน autocorrelation และมีความสำคัญมากในวิธีการ ARIMA วิธีการ ARIMA พยายามที่จะอธิบายการเคลื่อนไหวในชุดเวลาแบบคงที่ในฐานะที่เป็นหน้าที่ของสิ่งที่เรียกว่าพารามิเตอร์อัตถิภาวนิยมและค่าเฉลี่ยเคลื่อนที่ พารามิเตอร์เหล่านี้เรียกว่าพารามิเตอร์ AR (autoregessive) และพารามิเตอร์ MA (ค่าเฉลี่ยเคลื่อนที่) อาจมีการเขียนแบบ AR ที่มีเพียง 1 พารามิเตอร์เท่านั้น X (t) A (1) X (t-1) E (t) โดยที่ X (t) เวลาชุดภายใต้การตรวจสอบ A (1) พารามิเตอร์ autoregressive ของลำดับ 1 X (t-1) ชุดเวลาล้าหลัง 1 ระยะเวลา E (t) ความผิดพลาดของรูปแบบนี้ก็หมายความว่าค่าใดก็ตาม X (t) สามารถอธิบายได้จากฟังก์ชันของค่าก่อนหน้าที่ X (t-1) รวมทั้งข้อผิดพลาดแบบสุ่มบางส่วนที่ไม่สามารถอธิบายได้ E (t) ถ้าค่าประมาณของ A (1) เท่ากับ. 30 มูลค่าปัจจุบันของชุดจะสัมพันธ์กับ 30 ค่าก่อนหน้า 1 แน่นอนว่าซีรีย์นี้อาจเกี่ยวข้องกับมากกว่าหนึ่งค่าที่ผ่านมา ตัวอย่างเช่น X (t) A (1) X (t-1) A (2) X (t-2) E (t) นี่แสดงว่าค่าปัจจุบันของชุดคือการรวมกันของสองค่าก่อนหน้านี้ทันที, X (t-1) และ X (t-2) รวมทั้งข้อผิดพลาดแบบสุ่ม E (t) แบบจำลองของเราตอนนี้เป็นโมเดลอัตรกรรรณ์ของคำสั่ง 2. การเคลื่อนที่แบบเฉลี่ย: แบบที่สองของแบบจำลอง Box-Jenkins เรียกว่าโมเดลเฉลี่ยเคลื่อนที่ แม้ว่ารูปแบบเหล่านี้มีลักษณะคล้ายกับรุ่น AR แต่แนวคิดที่อยู่เบื้องหลังพวกเขามีความแตกต่างกันออกไป การย้ายค่าเฉลี่ยจะสัมพันธ์กับสิ่งที่เกิดขึ้นในช่วง t เฉพาะกับข้อผิดพลาดแบบสุ่มที่เกิดขึ้นในช่วงเวลาที่ผ่านมาเช่น E (t-1), E (t-2) เป็นต้นแทนที่จะเป็น X (t-1), X ( t-2), (Xt-3) ตามแนวทาง autoregressive แบบเฉลี่ยถ่วงน้ำหนักโดยเฉลี่ยที่มีระยะ MA สามารถเขียนได้ดังนี้ X (t) - B (1) E (t-1) E (t) คําวา B (1) เรียกวา MA ของคําสั่ง 1. เครื่องหมายลบที่ดานหนาของพารามิเตอรใชสําหรับการประชุมเทานั้น ออกโดยอัตโนมัติโดยโปรแกรมคอมพิวเตอร์ส่วนใหญ่ แบบจำลองข้างต้นกล่าวง่ายๆว่าค่าที่กำหนดของ X (t) มีความสัมพันธ์โดยตรงกับความผิดพลาดแบบสุ่มในช่วงก่อนหน้า, E (t-1) และความผิดพลาดปัจจุบัน E (t) เช่นเดียวกับในกรณีของโมเดลอัตถิภาวนิยมโมเดลเฉลี่ยเคลื่อนที่สามารถขยายไปยังโครงสร้างการสั่งซื้อที่สูงขึ้นซึ่งครอบคลุมชุดค่าผสมต่างๆและความยาวเฉลี่ยที่เคลื่อนที่ได้ วิธีการ ARIMA ยังช่วยให้สามารถสร้างโมเดลที่มีทั้งค่าเฉลี่ยอัตรวจและเคลื่อนไหวโดยรวมเข้าด้วยกัน โมเดลเหล่านี้มักถูกเรียกว่าแบบผสม แม้ว่าสิ่งนี้จะทำให้เครื่องมือคาดการณ์ที่ซับซ้อนมากขึ้น แต่โครงสร้างอาจจำลองชุดข้อมูลได้ดีขึ้นและสร้างการคาดการณ์ที่แม่นยำขึ้น โมเดล Pure หมายความว่าโครงสร้างประกอบด้วยเฉพาะ AR หรือพารามิเตอร์ MA - ไม่ใช่ทั้งสองอย่าง โมเดลที่พัฒนาโดยวิธีนี้มักเรียกว่า ARIMA เนื่องจากใช้การผสมผสานของอัตมโนทัศน์ (AR), การผสมผสาน (I) - หมายถึงกระบวนการย้อนกลับของ differencing เพื่อสร้างการคาดการณ์และการดำเนินงานโดยเฉลี่ย (MA) แบบ ARIMA มักถูกระบุว่าเป็น ARIMA (p, d, q) นี่แสดงลำดับของคอมโพเนนต์ autoregressive (p) จำนวน operator ที่ต่างกัน (d) และคำสั่งที่สูงที่สุดของค่าเฉลี่ยเคลื่อนที่ ยกตัวอย่างเช่น ARIMA (2,1,1) หมายความว่าคุณมีแบบจำลองอัตถดถอยอันดับที่สองที่มีส่วนประกอบของค่าเฉลี่ยเคลื่อนที่อันดับแรกที่มีการจัดลำดับชุดหนึ่งครั้งเพื่อกระตุ้นให้เกิดการหยุดนิ่ง การเลือกข้อมูลจำเพาะที่ถูกต้อง: ปัญหาหลักในคลาสสิก Box-Jenkins กำลังพยายามตัดสินใจว่าจะใช้ ARIA ข้อกำหนดใดบ้างเพื่อใช้ - i. e. จำนวนอาร์เรย์และพารามิเตอร์ MA ที่รวมไว้ นี่คือสิ่งที่มากของ Box-Jenkings 1976 ได้ทุ่มเทให้กับกระบวนการระบุตัวตน ขึ้นอยู่กับการประเมินผลแบบกราฟิกและตัวเลขของการเชื่อมโยงความสัมพันธ์ระหว่างตัวอย่างและฟังก์ชันการเชื่อมโยงบางส่วน (autocorrelation) ดีสำหรับรุ่นพื้นฐานของคุณงานไม่ยากเกินไป แต่ละฟังก์ชันมีความสัมพันธ์กันโดยอัตโนมัติซึ่งมีลักษณะบางอย่าง อย่างไรก็ตามเมื่อคุณขึ้นไปอย่างซับซ้อนรูปแบบจะไม่สามารถตรวจพบได้ง่าย เพื่อให้เรื่องยากขึ้นข้อมูลของคุณเป็นเพียงตัวอย่างของกระบวนการอ้างอิงเท่านั้น ซึ่งหมายความว่าข้อผิดพลาดในการสุ่มตัวอย่าง (ข้อผิดพลาดค่าผิดพลาดในการวัด ฯลฯ ) อาจบิดเบือนกระบวนการระบุตัวตนทางทฤษฎี นั่นคือเหตุผลที่การสร้างแบบจำลอง ARIMA แบบดั้งเดิมเป็นศิลปะมากกว่าวิทยาศาสตร์ ACTIMA หมายถึงแบบจำลองการเคลื่อนที่แบบรวมอัตโนมัติแบบอัตถดถอย (single vector) ARIMA เป็นเทคนิคการพยากรณ์ที่คาดการณ์มูลค่าในอนาคตของชุดข้อมูลโดยอิงกับความเฉื่อยของตัวเอง การประยุกต์ใช้หลักของมันอยู่ในพื้นที่ของการคาดการณ์ในระยะสั้นที่ต้องใช้จุดข้อมูลทางประวัติศาสตร์อย่างน้อย 40 จุด ใช้งานได้ดีที่สุดเมื่อข้อมูลของคุณมีรูปแบบที่มั่นคงหรือสอดคล้องกันตลอดเวลาโดยมีจำนวนข้อผิดพลาดน้อยที่สุด บางครั้งเรียกว่า Box-Jenkins (หลังจากผู้เขียนต้นฉบับ) ARIMA มักจะดีกว่าเทคนิคการทำให้เกิดการชี้แจงเมื่อข้อมูลมีความยาวและความสัมพันธ์ระหว่างการสังเกตในอดีตมีเสถียรภาพ ขั้นตอนแรกในการใช้วิธีการ ARIMA คือการตรวจสอบ stationarity quotStationarityquot อนุมานได้ว่าซีรี่ส์ยังคงอยู่ในระดับคงที่ตลอดเวลา หากมีแนวโน้มเช่นเดียวกับในแอปพลิเคชันทางเศรษฐกิจหรือธุรกิจส่วนใหญ่ข้อมูลของคุณจะยังคงอยู่ไม่หยุดนิ่ง ข้อมูลควรแสดงความแปรปรวนของความผันผวนตลอดเวลา นี่ดูได้อย่างง่ายดายด้วยชุดที่มีฤดูกาลมากและเติบโตขึ้นในอัตราที่รวดเร็วขึ้น ในกรณีเช่นนี้การขึ้นและการดาวน์ในฤดูกาลจะทวีความรุนแรงมากขึ้นเมื่อเวลาผ่านไป หากไม่พบเงื่อนไขการหยุดนิ่งเหล่านี้จะไม่สามารถคำนวณการคำนวณจำนวนมากที่เกี่ยวข้องกับกระบวนการนี้ได้ หากพล็อตข้อมูลที่เป็นกราฟแสดงถึงความไม่เสถียรภาพคุณควรระบุชุดข้อมูล Differencing เป็นวิธีที่ยอดเยี่ยมในการเปลี่ยนชุดแบบไม่ต่อเนื่องให้เป็นแบบคงที่ โดยการลบคำสังเกตในช่วงเวลาปัจจุบันออกจากข้อสังเกตก่อนหน้านี้ หากการแปลงนี้ทำเพียงครั้งเดียวกับชุดคุณจะกล่าวว่าข้อมูลมีค่าแตกต่างกันไป ขั้นตอนนี้เป็นหลักช่วยลดแนวโน้มหากชุดของคุณมีอัตราการเติบโตที่ค่อนข้างคงที่ หากอัตราการเติบโตเพิ่มขึ้นคุณสามารถใช้ขั้นตอนเดียวกันและทำให้ข้อมูลแตกต่างกันได้อีก ข้อมูลของคุณจะแตกต่างกันไปในเวลาสี่สิบ quotAutocorrelationsquot เป็นค่าตัวเลขที่ระบุว่าชุดข้อมูลเกี่ยวข้องกับตัวเองอย่างไรเมื่อเวลาผ่านไป อย่างแม่นยำมากขึ้นจะวัดว่าค่าข้อมูลอย่างมากที่ช่วงระยะเวลาที่ระบุเป็นจำนวนเท่าใดมีความสัมพันธ์กันเมื่อเวลาผ่านไป จำนวนรอบระยะเวลาโดยปกติจะเรียกว่า quotlagquot ตัวอย่างเช่นค่าความสัมพันธ์ระหว่างความคลาดเคลื่อน 1 วัดค่าที่แตกต่างกันของช่วงเวลา 1 ช่วงเวลาที่มีความสัมพันธ์กันในชุดข้อมูล ความสัมพันธ์กันที่ความล่าช้า 2 วัดว่าข้อมูลสองช่วงเวลามีความสัมพันธ์กันอย่างไรในซีรี่ส์ Autocorrelations อาจอยู่ในช่วงตั้งแต่ 1 ถึง -1 ค่าใกล้เคียงกับ 1 แสดงถึงความสัมพันธ์ทางบวกที่สูงในขณะที่ค่าใกล้เคียงกับ -1 แสดงถึงความสัมพันธ์เชิงลบสูง มาตรการเหล่านี้มักได้รับการประเมินผ่านทางกราฟฟิกที่เรียกว่า quotcorrelagramsquot correlagram แปลงค่าความสัมพันธ์แบบอัตโนมัติสำหรับชุดข้อมูลหนึ่ง ๆ ที่มีความล่าช้าต่างกัน นี่เรียกว่าฟังก์ชัน quotautocorrelation และมีความสำคัญมากในวิธีการ ARIMA วิธีการ ARIMA พยายามที่จะอธิบายการเคลื่อนไหวในชุดเวลาแบบคงที่ในฐานะที่เป็นหน้าที่ของสิ่งที่เรียกว่าพารามิเตอร์ quotquestregressive และ movingquest averagequot พารามิเตอร์เหล่านี้เรียกว่าพารามิเตอร์ AR (autoregessive) และพารามิเตอร์ MA (ค่าเฉลี่ยเคลื่อนที่) อาจมีการเขียนแบบ AR ที่มีเพียง 1 พารามิเตอร์เท่านั้น X (t) A (1) X (t-1) E (t) โดยที่ X (t) เวลาชุดภายใต้การตรวจสอบ A (1) พารามิเตอร์ autoregressive ของลำดับ 1 X (t-1) ชุดเวลาล้าหลัง 1 ระยะเวลา E (t) ความผิดพลาดของรูปแบบนี้ก็หมายความว่าค่าใดก็ตาม X (t) สามารถอธิบายได้จากฟังก์ชันของค่าก่อนหน้าที่ X (t-1) รวมทั้งข้อผิดพลาดแบบสุ่มบางส่วนที่ไม่สามารถอธิบายได้ E (t) ถ้าค่าประมาณของ A (1) เท่ากับ. 30 มูลค่าปัจจุบันของชุดจะสัมพันธ์กับ 30 ค่าก่อนหน้า 1 แน่นอนว่าซีรีย์นี้อาจเกี่ยวข้องกับมากกว่าหนึ่งค่าที่ผ่านมา ตัวอย่างเช่น X (t) A (1) X (t-1) A (2) X (t-2) E (t) นี่แสดงว่าค่าปัจจุบันของชุดคือการรวมกันของสองค่าก่อนหน้านี้ทันที, X (t-1) และ X (t-2) รวมทั้งข้อผิดพลาดแบบสุ่ม E (t) โมเดลของเราตอนนี้เป็นโมเดลอัตรกรรรณ์ของออร์เดอร์ที่ 2 การเคลื่อนที่แบบเฉลี่ย: แบบที่สองของแบบจำลอง Box-Jenkins เรียกว่าแบบจำลอง averagequot โดยใช้ quotmoving แม้ว่ารูปแบบเหล่านี้มีลักษณะคล้ายกับรุ่น AR แต่แนวคิดที่อยู่เบื้องหลังพวกเขามีความแตกต่างกันออกไป การย้ายค่าเฉลี่ยจะสัมพันธ์กับสิ่งที่เกิดขึ้นในช่วง t เฉพาะกับข้อผิดพลาดแบบสุ่มที่เกิดขึ้นในช่วงเวลาที่ผ่านมาเช่น E (t-1), E (t-2) เป็นต้นแทนที่จะเป็น X (t-1), X ( t-2), (Xt-3) ตามแนวทาง autoregressive แบบเฉลี่ยถ่วงน้ำหนักโดยเฉลี่ยที่มีระยะ MA สามารถเขียนได้ดังนี้ X (t) - B (1) E (t-1) E (t) คําวา B (1) เรียกวา MA ของคําสั่ง 1. เครื่องหมายลบที่ดานหนาของพารามิเตอรใชสําหรับการประชุมเทานั้น ออกโดยอัตโนมัติโดยโปรแกรมคอมพิวเตอร์ส่วนใหญ่ แบบจำลองข้างต้นกล่าวง่ายๆว่าค่าที่กำหนดของ X (t) มีความสัมพันธ์โดยตรงกับความผิดพลาดแบบสุ่มในช่วงก่อนหน้า, E (t-1) และความผิดพลาดปัจจุบัน E (t) เช่นเดียวกับในกรณีของโมเดลอัตถิภาวนิยมโมเดลเฉลี่ยเคลื่อนที่สามารถขยายไปยังโครงสร้างการสั่งซื้อที่สูงขึ้นซึ่งครอบคลุมชุดค่าผสมต่างๆและความยาวเฉลี่ยที่เคลื่อนที่ได้ วิธีการ ARIMA ยังช่วยให้สามารถสร้างโมเดลที่มีทั้งค่าเฉลี่ยอัตรวจและเคลื่อนไหวโดยรวมเข้าด้วยกัน โมเดลเหล่านี้มักถูกเรียกว่า quotemaxed modelsquot แม้ว่าสิ่งนี้จะทำให้เครื่องมือคาดการณ์ที่ซับซ้อนมากขึ้น แต่โครงสร้างอาจจำลองชุดข้อมูลได้ดีขึ้นและสร้างการคาดการณ์ที่แม่นยำขึ้น โมเดล Pure หมายความว่าโครงสร้างประกอบด้วยเฉพาะ AR หรือพารามิเตอร์ MA - ไม่ใช่ทั้งสองอย่าง โมเดลที่พัฒนาโดยวิธีนี้มักเรียกว่า ARIMA เนื่องจากใช้การผสมผสานของอัตมโนทัศน์ (AR), การผสมผสาน (I) - หมายถึงกระบวนการย้อนกลับของ differencing เพื่อสร้างการคาดการณ์และการดำเนินงานโดยเฉลี่ย (MA) แบบ ARIMA มักถูกระบุว่าเป็น ARIMA (p, d, q) นี่แสดงลำดับของคอมโพเนนต์ autoregressive (p) จำนวน operator ที่ต่างกัน (d) และคำสั่งที่สูงที่สุดของค่าเฉลี่ยเคลื่อนที่ ยกตัวอย่างเช่น ARIMA (2,1,1) หมายความว่าคุณมีแบบจำลองอัตถดถอยอันดับที่สองที่มีส่วนประกอบของค่าเฉลี่ยเคลื่อนที่อันดับแรกที่มีการจัดลำดับชุดหนึ่งครั้งเพื่อกระตุ้นให้เกิดการหยุดนิ่ง การเลือกข้อมูลจำเพาะที่ถูกต้อง: ปัญหาหลักในคลาสสิก Box-Jenkins กำลังพยายามตัดสินใจว่าจะใช้ ARIA ข้อกำหนดใดบ้างเพื่อใช้ - i. e. จำนวนอาร์เรย์และพารามิเตอร์ MA ที่รวมไว้ นี่คือสิ่งที่มากของ Box-Jenkings 1976 ได้ทุ่มเทให้กับกระบวนการระบุตัวตน ขึ้นอยู่กับการประเมินผลแบบกราฟิกและตัวเลขของการเชื่อมโยงความสัมพันธ์ระหว่างตัวอย่างและฟังก์ชันการเชื่อมโยงบางส่วน (autocorrelation) 275 มุมมอง middot ดูคำ Upvotes middot Not for Reproduction

No comments:

Post a Comment