i
MỤC LỤC
MỤC LỤC..................................................................................................................................i
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT..............................................................iii
DANH MỤC CÁC BẢNG........................................................................................................v
DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ.............................................................................vi
MỞ ĐẦU...................................................................................................................................1
Chương 1: TỔNG QUAN.........................................................................................................5
1.1. TỔNG QUAN VỀ NĂNG LƯỢNG ĐIỆN......................................................................5
1.1.1. Khái niệm về điện năng..........................................................................................5
1.1.2. Thực trạng thị trường điện lực Việt Nam...............................................................5
1.1.3. Phương hướng xây dựng mô hình thị trường điện lực tại Việt Nam......................6
1.1.4. Tình hình sản xuất kinh doanh trên địa bàn tỉnh Bình Dương...............................7
1.2. KHẢO SÁT CÁC CÔNG TRÌNH, BÀI BÁO ĐÃ ĐĂNG TẢI LIÊN QUAN ĐẾN
ĐỀ TÀI.............................................................................................................................7
1.2.1.Các thuật toán di truyền và tiến hóa dùng dự báo chuỗi thời gian..........................8
1.2.2. Sử dụng thuật giải di truyền đa cấp dự báo chuỗi thời gian.................................11
1.2.3. Giải thuật lai cho bài toán sắp hàng đa trình tự sinh học......................................15
1.3. CÁC MÔ HÌNH THƯỜNG ÁP DỤNG TRONG DỰ BÁO, ĐÁNH GIÁ....................17
1.3.1. Khái niệm về dự báo, đánh giá.............................................................................17
1.3.2. Các mô hình dự báo..............................................................................................17
1.3.3. Mô hình dự báo dựa trên chuỗi thời gian.............................................................18
1.4. KẾT LUẬN CHƯƠNG..................................................................................................19
Chương 2: CƠ SỞ LÝ THUYẾT............................................................................................20
2.1. GIẢI THUẬT LUYỆN KIM (SA:SIMULATED ANNEALING)................................20
2.1.1. Giới thiệu chung về giải thuật luyện kim.............................................................20
2.1.2. Hàm nhiệt độ và quá trình hoạt động...................................................................24
2.1.3. Hàm chi phí và hàm mục tiêu...............................................................................27
2.1.4. Cấu trúc của lời giải lân cận.................................................................................27
2.1.5. Các bước của bài toán SA và điều kiện dừng.......................................................28
2.1.6. Ưu điểm và khuyết điểm......................................................................................29
2.2. GIẢI THUẬT DI TRUYỀN (GA: GENETIC ALGORITHMS)...................................29
2.2.1. Giới thiệu chung về giải thuật di truyền...............................................................29
2.2.2. Thực hiện giải thuật di truyền...............................................................................33
2.2.3. Chương trình tổng quát.........................................................................................38
2.3. CHUỖI THỜI GIAN VÀ MÔ HÌNH TỰ HỒI QUY....................................................40
2.3.1. Thế nào là chuỗi thời gian....................................................................................40
2.3.2. Dự báo chuỗi thời gian.........................................................................................41
2.3.3. Mô hình tự hồi quy...............................................................................................42
2.3.4. Mô hình trung bình trượt......................................................................................43
2.3.5. Quá trình tự hồi quy trung bình trượt cấp p,q: ARMA(p,q).................................43
2.4. KẾT LUẬN CHƯƠNG..................................................................................................44
Chương 3: XÂY DỰNG VÀ THỰC NGHIỆM MÔ HÌNH DỰ BÁO...................................45
3.1. PHÂN TÍCH CHỈ TIÊU ĐÁNH GIÁ HIỆU QUẢ CỦA MÔ HÌNH............................45
3.2. CẤU TRÚC BẢNG DỮ LIỆU.......................................................................................46
3.3. MÔ HÌNH ARMA..........................................................................................................46
3.3.1. Mục đích của việc kết hợp hai mô hình................................................................46
3.3.2. Mô tả giải thuật.....................................................................................................47
3.4. KẾT LUẬN CHƯƠNG..................................................................................................50
Chương 4: KẾT QUẢ THỰC NGHIỆM.................................................................................51
4.1. THỬ NGHIỆM MÔ HÌNH ARMA TRÊN CÁC CHUỖI DỮ LIỆU MẪU LẤY TỪ
TIME SERIES DATA LIBRARY................................................................................51
4.1.1. Các chỉ tiêu đạt được trên mô hình ARMA.........................................................51
4.1.2. Thực nghiệm mô hình ARMA trên chuỗi dữ liệu mẫu lấy từ TS Library............52
4.1.3. Nhận định kết quả.................................................................................................57
4.2. THỰC NGHIỆM MÔ HÌNH ARMA CHO CÁC CHUỖI DỮ LIỆU TRONG
LĨNH VỰC NGÀNH ĐIỆN..........................................................................................58
4.2.1. Dự báo nhu cầu sử dụng điện theo từng khu vực huyện, thị trong tỉnh:..............58
4.2.2. Dự báo nhu cầu sử dụng điện theo từng nhóm ngành nghề trong tỉnh:................59
KẾT LUẬN.............................................................................................................................63
KIẾN NGHỊ CÁC HƯỚNG NGHIÊN CỨU TIẾP THEO.....................................................63
DANH MỤC TÀI LIỆU THAM KHẢO................................................................................64
PHỤ LỤC................................................................................................................................ 66
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Viết tắt
Tiếng Anh
Tiếng Việt
ARMA
AutoRegressive Moving Average
Trung bình trượt tự hồi quy
ARIMA
AutoRegressive
ES
Moving Average
Exponential Smoothing
San bằng số mũ
GA
Genetic Algorithm
Giải thuật di truyền
SA
Simulated Annealing
Giải thuật luyện kim
NN
Neural Network
Mạng nơ-ron
FL
Fuzzy Logic
Logic mờ
EVN
The Electricity of Vietnam
Tổng Công ty Điện lực Việt Nam
TS
Time series
Chuỗi thời gian
GEAs
Genetic
SSE
Algorithms
Sum Squared Error
Sai số tổng bình phương
RMSE
Root Mean Squared Error
Sai số căn của trung bình bình phương
NMSE
Normalized Mean Square Error
.Sai số trung bình bình phương chuẩn
TSF
Time series forecasting
Dự báo chuỗi thời gian
RVR
Real-Valued Representation
Biểu diễn giá trị thực
BIC
Bayesian Information Criterion
STW
Sliding Time Window
Cửa sổ thời gian trượt
STWs
Sliding Time Window
Các cửa sổ thời gian trượt
and
Intergrated Trung bình trượt tích hợp tự hồi qui
Evolutionary Thuật toán di truyền và tiến hóa
Meta-GAs Meta-Genetic Algorithm
Thuật giải di truyền đa cấp
SA-GA
Simulated Annealing - Genetic
Thuật giải luyện kim kết hợp thuật
Algorithm
giải di truyền
AutoRegressive
Tự hồi quy
AR
MA
Moving Average
ARCH
AutoRegressive
Trung bình trượt
Conditional Phương sai sai số thay đổi có điều
Heteroskedasticity
GARCH
Generalized
-
kiện tự hồi quy
AutoRegressive
Conditional Heteroskedasticity
Phương sai sai số thay đổi có điều
kiện tự hồi quy mở rộng
TBA
Trạm biến áp
CN-XD
Công nghiệp - Xây dựng
NL-TS
Nông lâm - Thuỷ sản
KS-NH
Khách sạn - Nhà hàng
CQ-QL
Cơ quan - Quản lý
Điện TP
ĐT (Tr.đ)
Điện Thương phẩm
Đầu tư (Triệu đồng)
DANH MỤC CÁC BẢNG
Bảng 1.1: Time Series Data Library...........................................................................9
Bảng 1.2: So sánh giữa các phương pháp TSF khác nhau........................................11
Bảng 1.3: Đặt giá trị tham số thuật toán Meta-GAs.................................................14
Bảng 1.4: Mô hình ARMA tối ưu thu được bởi thuật toán Meta-GAs...................14
Bảng 1.5: So sánh phương pháp Meta-GAs với các phương pháp truyền thống.....14
Bảng 2.1: So sánh tương quan giữa luyện kim vật lý và giải thuật luyện kim..........21
Bảng 2.2: So sánh giải thuật di truyền với các phương pháp truyền thống...............32
Bảng 2.3. Chọn lọc dùng bánh xe............................................................................34
Bảng 2.4. Sự tương ứng các số ngẫu nhiên và chuỗi nhiễm sắc thể.........................35
Bảng 4.1: So sánh phương pháp SA-GA với các phương pháp truyền thống..........51
DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ
Hình 1.1: Ví dụ về giải mã thuật toán Meta-GAs.....................................................12
Hình 1.2: The Meta-Ecolutionary Approach............................................................13
Hình 1.3: Biểu đồ mô tả mức độ ổn định của nghiệm được chọn............................16
Hình 2.1: Sơ đồ không gian lời giải.........................................................................21
Hình 2.2: Lưu đồ biểu diễn giải thuật luyện kim.....................................................24
Hình 2.3: Biểu diễn quá trình hoạt động của hàm nhiệt độ......................................25
Hình 2.4: Biểu diễn quan hệ giữa hàm chi phí và hàm mục tiêu..............................27
Hình 2.5: Sơ đồ tổng quát của giải thuật di truyền...................................................31
Hình 2.6: Bánh xe Roulette......................................................................................35
Hình 2.7: Lai ghép...................................................................................................36
Hình 2.8: Lai ghép biểu diễn theo cây......................................................................37
Hình 2.9: Giải thuật di truyền...................................................................................40
Hình 2.10: Phân tích chuỗi số liệu trong dự báo......................................................42
Hình 2.11: Phương pháp luận dự báo chuỗi thời gian..............................................42
Hình 3.1: Cấu trúc lời giải của phương pháp SA-GA..............................................46
Hình 3.2: Giải thuật SA-GA cho mô hình ARMA..................................................48
Hình 4.1. Giao diện chính........................................................................................52
Hình 4.2: Đồ thị biểu diễn chuỗi Passengers............................................................53
Hình 4.3: Đồ thị biểu diễn chuỗi Paper....................................................................54
Hình 4.4: Đồ thị biểu diễn chuỗi Deaths..................................................................54
Hình 4.5: Đồ thị biểu diễn chuỗi Maxtemp..............................................................55
Hình 4.6: Đồ thị biểu diễn chuỗi Chemical..............................................................55
Hình 4.7: Đồ thị biểu diễn chuỗi Prices...................................................................56
Hình 4.8: Đồ thị biểu diễn chuỗi Sunspots...............................................................57
Hình 4.9: Đồ thị biểu diễn chuỗi Kobe.....................................................................57
Hình 4.10: Đồ thị biểu diễn chuỗi TDM.................................................................59
Hình 4.11: Đồ thị biểu diễn chuỗi NLT...................................................................59
Hình 4.12: Đồ thị biểu diễn chuỗi CN-XD...............................................................60
Hình 4.13: Đồ thị biểu diễn chuỗi KD-DV..............................................................61
Hình 4.14: Đồ thị biểu diễn chuỗi AS......................................................................61
Hình 4.15: Đồ thị biểu diễn chuỗi KHAC................................................................62
1
MỞ ĐẦU
1. Đặt vấn đề
Những năm gần đây tình hình phát triển kinh tế xã hội gia tăng, nhu cầu sử dụng
nguồn năng lượng điện cũng tăng nhất là trong sản xuất và đời sống. Việc thiếu
điện sinh hoạt và sản xuất do nhiều nguyên nhân như sử dụng không tiết kiệm, thiếu
nguồn nước để vận hành nhà máy điện, không có kế hoạch cho việc cân đối giữa
cung và cầu… Do đó, dự báo nhu cầu tiêu thụ điện là bài toán hết sức cần thiết
trong quá trình vận hành, quy hoạch, phát triển, điều khiển tối ưu chế độ mạng điện
… Hầu hết các bài toán dự báo phụ tải đều dựa trên cơ sở các mô hình toán học
hoặc các mô hình thực nghiệm nhằm tìm ra các quy luật biến đổi của phụ tải điện
trong chu kỳ xét, đưa ra những kế hoạch sản xuất và tiêu thụ điện hợp lý tránh tình
trạng thiếu điện trong sản xuất và đời sống như hiện nay.
Dự báo là một khoa học và nghệ thuật tiên đoán những sự việc sẽ xảy ra trong
tương lai, trên cơ sở phân tích khoa học về các dữ liệu đã thu thập được và có thể
nói rằng không có những dự báo khoa học thì những dự định tương lai mà con
người vạch ra sẽ không có sự thuyết phục đáng kể. Khi tiến hành dự báo căn cứ vào
việc thu thập xử lý số liệu trong quá khứ và hiện tại để xác định xu hướng vận động
của các hiện tượng trong tương lai nhờ vào một số mô hình toán học.
Các phần mềm máy tính giúp xây dựng các mô hình mô tả các dữ liệu theo một
quy luật nhất định dựa trên việc xử lý các dữ liệu đầu vào. Nhờ vào các công nghệ
của khoa học máy tính mà các nhà nghiên cứu có thể phát triển các mô hình phức
tạp áp dụng vào thực tế phục vụ cho việc hỗ trợ ra quyết định trong việc quản lý,
định hướng phát triển và sử dụng năng lượng điện. Đề tài “Xây dựng phần mềm ứng
dụng vào dự báo nhu cầu sử dụng điện trên địa bàn Thị xã Thủ Dầu Một ” sẽ góp
phần nhỏ tham khảo cho việc định hướng phát triển ngành điện những năm tới.
2. Mục tiêu của đề tài
- Khảo sát xây dựng cơ sở dữ liệu về tình hình sử dụng năng lượng điện, thống
kê, xử lý dữ liệu số kw điện hàng tháng trong những năm trước để làm dữ liệu đầu
vào cung cấp thông tin hỗ trợ ra quyết định trong việc quản lý, định hướng phát
triển và sử dụng năng lượng điện
- Nghiên cứu, phân tích chuỗi dữ liệu thời gian để xác định bản chất của chuỗi
dữ liệu, dự báo các giá trị tương lai dựa trên các cơ chế phát sinh chuỗi
- Xây dựng phần mềm trên cơ sở kết hợp giải thuật luyện kim SA (Simulated
Annealing) và giải thuật di truyền GA (Genetic Algorithms) để dự báo chuỗi dữ liệu
thời gian
- Thực nghiệm các số liệu thực tế đầu vào thống kê được trên phần mềm để đưa
ra kết quả dự báo nhu cầu sử dụng điện
- Phục vụ công tác giảng dạy và nghiên cứu khoa học trong khoa Công nghệ
Thông tin
3. Tình hình nghiên cứu có liên quan đến lĩnh vực nghiên cứu của đề tài
3.1 Các thuật toán di truyền và tiến hóa dùng dự báo chuỗi thời gian (Genetic
and Evolutionary Algorithms Time Series Forecasting) của Paulo Cortez, Miguel
Rocha, and Jose1 Neves [12]
3.2 Sử dụng thuật giải di truyền đa cấp dự báo chuỗi thời gian (A Meta-Genetic
Algorithms for Time Series Forecasting) của P.Cortez, M. Rocha, J.Neves [11]
3.3 Giải thuật lai cho bài toán sắp hàng đa trình tự sinh học [8]
Trong nước, có một số nghiên cứu liên quan đến lĩnh vực về dự báo nhưng theo
những hướng khác nhau, chưa có nghiên cứu nào theo hướng đã trình bày của đề tài
về dự báo tình hình sử dụng điện tại Thị xã Thủ Dầu Một
4. Cách tiếp cận
- Phân tích chuỗi dữ liệu thời gian nhằm hai mục đích:
+ Xác định bản chất của chuỗi dữ liệu
+ Dự báo các giá trị tương lai dựa trên các cơ chế phát sinh chuỗi
- Thu thập số liệu về kw điện sử dụng trên địa bàn Thị xã Dầu Một
5. Phương pháp nghiên cứu:
5.1. Phương pháp nghiên cứu lý thuyết:
- Nghiên cứu giải thuật di truyền SA (Simulated Annealing)
- Nghiên cứu giải thuật luyện kim GA (Genetic Algorithms)
- Nghiên cứu mô hình ARMA (AutoRegressive Moving Average model)
phân tích và dự báo chuỗi dữ liệu thời gian.
5.2. Phương pháp thu thập dữ liệu:
- Thu thập số liệu về kw điện sử dụng trên địa bàn Thị xã
- Phân loại các đơn vị sử dụng điện theo thuộc tính ngành nghề
5.3. Phương pháp thực nghiệm:
- Thực nghiệm số liệu thống kê được trên phần mềm để có kết quả dự báo
tình hình sử dụng điện
6. Đối tượng và phạm vi nghiên cứu
6.1. Đối tượng nghiên cứu: Nghiên cứu các thuật toán tối ưu ứng dụng xây
dựng phần mềm dự báo
6.2. Phạm vi nghiên cứu: Đề tài xây dựng phần mềm dựa trên nghiên cứu các
giải thuật tối ưu và kết hợp các giải thuật ứng dụng vào mô hình ARMA để dự báo
mức tiêu thụ điện, từ kết quả dự báo tiến hành đánh giá tình hình sử dụng điện trên
địa bàn tỉnh Bình Dương. Do các ảnh hưởng phụ đến tình hình sử dụng điện như
tình hình kinh tế, chính trị, xã hội trong nước, tình hình phát triển mới các khu công
nghiệp, trường học, tăng dân số cơ học… rất khó xác định cả về định tính lẫn định
lượng và không dễ thu thập dữ liệu một cách đầy đủ trong thời gian ngắn, nên đề tài
chỉ tập trung trong phạm vi nghiên cứu chuỗi thời gian dự báo chỉ số sử dụng năng
lượng điện trên cơ sở chuỗi dữ liệu của những năm trước dự báo năm tiếp theo.
7. Nội dung nghiên cứu
- Nghiên cứu các công trình có liên quan
- Nghiên cứu các giải thuật di truyền và giải thuật luyện kim, mô hình
ARMA
- Thu thập dữ liệu, phân loại sử dụng điện theo thuộc tính ngành nghề.
- Xây dựng phần mềm, cài đặt thử nghiệm và đưa ra kết quả dự báo nhu cầu
sử dụng điện trên địa bàn Thị xã Thủ Dầu Một
MỞ ĐẦU
Chương 1: TỔNG QUAN
Chương 2: CƠ SỞ LÝ THUYẾT
Chương 3: XÂY DỰNG PHẦN MỀM DỰ BÁO
Chương 4: KẾT QUẢ THỰC NGHIỆM
KẾT LUẬN
KIẾN NGHỊ CÁC HƯỚNG NGHIÊN CỨU TIẾP THEO
TÀI LIỆU THAM KHẢO
PHỤ LỤC
Chương 1
TỔNG QUAN
Chương một giới thiệu sơ lược về nguồn năng lượng điện, thực trạng
nguồn cung cấp điện ở Việt Nam nói chung và Bình Dương nói riêng, phương
hướng phát triển ngành điện trong nước. Đồng thời khảo sát, phân tích một số
công trình nghiên cứu có liên quan để làm nền tảng nghiên cứu của đề tài.
1.1. TỔNG QUAN VỀ NĂNG LƯỢNG ĐIỆN
1.1.1.
Khái niệm về điện năng [20]
Điện là một dạng năng lượng, là dòng chuyển dời có hướng của các electron.
Tất cả vật chất đều được cấu tạo bởi các nguyên tử, trong nguyên tử khi sự cân
bằng lực giữa proton và electron bị phá vỡ bởi tác dụng của ngoại lực, các electron
thoát ra khỏi nguyên tử, sự chuyển dịch tự do của các electron cấu tạo nên dòng
điện.
Điện năng là dạng năng lượng thứ cấp, điện được tạo ra bằng cách chuyển hóa
từ các nguồn năng lượng sơ cấp như dầu mỏ, nguồn nước, năng lượng nguyên tử và
từ các nguồn năng lượng sơ cấp khác. Vào những năm giữa thế kỉ XIX, Thomas
Edison đã làm thay đổi cuộc sống mọi người bằng phát minh ra bóng đèn điện. Phát
minh của Edison đã sử dụng điện năng để mang ánh sáng vào từng gia đình.
Điện năng là một loại hàng hoá đặc biệt. Quá trình kinh doanh điện năng bao
gồm 3 khâu liên hoàn: Sản xuất - Truyền tải - Phân phối điện năng xảy ra đồng thời,
không qua một khâu thương mại trung gian nào. Điện năng được sản xuất ra khi đủ
khả năng tiêu thụ vì đặc điểm của hệ thống điện là ở bất kỳ thời điểm nào cũng có
sự cân bằng giữa công suất phát ra và công suất tiêu thụ (không để tồn đọng).
1.1.2. Thực trạng thị trường điện lực Việt Nam [13]
1.1.2.1. Sản xuất và phân phối điện năng
- Về nguồn điện: Hiện tại, tổng công suất lắp đặt khả dụng 8.454 MW tập
trung chủ yếu vào các nhà máy thuộc Tập đoàn Điện lực Việt Nam (EVN: The
Electricity of VietNam)
- Về lưới điện: EVN đã tập trung nhiều vào việc cải tạo nâng cấp hệ thống
lưới điện truyền tải. Hiện tại lưới điện truyền tải cao áp toàn quốc bao gồm
(1531 km đường dây, 2700 Trạm biến áp (TBA) 500KV; 3839 km đường dây,
8474 TBA 220KV; 7703 km đường dây, 11004 TBA 110KV) do 4 Công ty
Truyền tải điện quản lý vận hành.
1.1.2.2. Phương thức tổ chức kinh doanh điện năng
Mô hình quản lý sản xuất kinh doanh của EVN vẫn đang thực hiện theo mô
hình Nhà nước độc quyền quản lý các khâu của quá trình: Sản xuất- Truyền tải
- Phân phối điện năng. Mô hình này dẫn đến nhiều hạn chế về quản lý cũng
như hiệu quả đầu tư, không thúc đẩy phát triển sản xuất kinh doanh điện năng.
1.1.3. Phương hướng xây dựng mô hình thị trường điện lực tại Việt Nam[13]
1.1.3.1. Định hướng phát triển hoạt động sản xuất kinh doanh điện năng
- Về nguồn điện: Tập trung xây dựng các nhà máy thuỷ điện tại hầu hết
những nơi có khả năng xây dựng.
- Về lưới điện: Sẽ phát triển nhanh hệ thống truyền tải 220kV, 500 kV nhằm
nâng cao độ tin cậy và giảm tổn thất điện năng trên lưới truyền tải; phát triển
lưới điện 110kV thành lưới điện cung cấp trực tiếp cho phụ tải.
- Về cơ cấu bộ máy tổ chức của EVN: Thực hiện đề án của Chính phủ về
việc thí điểm thành lập tập đoàn điện lực, EVN tiếp tục đẩy nhanh quá trình cổ
phần hoá các đơn vị trực thuộc trong đó có các nhà máy điện, công ty phân
phối điện năng phục vụ cho việc phát triển thị trường điện.
1.1.3.2. Mô hình thị trường điện lực Việt Nam
- Đối với EVN: Cần chủ động điều tiết nguồn phát đảm bảo cân bằng hệ thống
- Đối với các nhà máy điện: Từng bước thực hiện cổ phần hoá các nhà
máy điện, chuyển các nhà máy điện thuộc EVN thành các nhà máy điện
độc lập.
- Đối với các công ty truyền tải: Với bản chất là độc quyền tự nhiên, do vậy
Nhà nước vẫn nắm giữ thực hiện các hoạt động truyền tải điện từ người mua duy
nhất (EVN) đến các công ty điện lực.
- Đối với các công ty phân phối điện năng: Thực hiện chuyển đổi trở thành
đơn vị độc lập với EVN dưới hình thức Công ty mẹ - Công ty con.
- Do cần đảm bảo tính phù hợp của một số hoạt động độc quyền trong mô
hình như: EVN độc quyền mua điện từ các nhà máy điện độc lập, độc quyền
bán điện cho các công ty phân phối điện năng, các công ty phân phối độc quyền
bán điện cho khách hàng, do vậy cần thiết phải có một cơ quan đứng ra kiểm
soát hoạt động này với tư cách hoàn toàn độc lập.
- Đối với khách hàng: Tiếp tục chịu mua điện từ một công ty phân phối điện
duy nhất. Tuy nhiên đối với các khách hàng cần phụ tải lớn có thể mua điện trực
tiếp từ các nhà máy điện hoặc thông qua lưới truyền tải của EVN.
1.1.4. Tình hình sản xuất kinh doanh trên địa bàn tỉnh Bình Dương (Phụ lục1)
1.2. KHẢO SÁT CÁC CÔNG TRÌNH, BÀI BÁO ĐÃ ĐĂNG TẢI LIÊN
QUAN ĐẾN ĐỀ TÀI
Trong lĩnh vực dự báo thực trạng nhu cầu sử dụng điện dùng các phương pháp
tối ưu để xử lý số liệu thống kê, nhiều mô hình có thể sử dụng trong đó mô hình
trung bình trượt tự hồi quy ARMA luôn thể hiện là một trong những phương pháp
phân tích hiệu quả nhất và thu hút được nhiều công trình nghiên cứu trong lĩnh vực
phân tích và dự báo chuỗi thời gian để đánh giá. Có nhiều nghiên cứu liên quan đến
chuỗi thời gian, đáng chú ý là một số phương pháp sau:
-
Dùng các thuật toán di truyền và tiến hóa để dự báo chuỗi thời gian.
- Sử dụng thuật giải di truyền đa cấp dự báo chuỗi thời gian.
- Giải thuật lai cho bài toán sắp hàng đa trình tự sinh học.
-
Dự báo chuỗi dữ liệu kinh tế vĩ mô dùng thuật giải di truyền tuyến tính.
-
Dự báo chuỗi dữ liệu thời gian bởi thuật giải di truyền kết hợp với các hàm
thống kê và các hàm lượng giác.
Phân tích một số công trình liên quan đến lĩnh vực đề tài đang nghiên cứu, để
có cơ sở khoa học đáng tin cậy cho việc nghiên cứu, đề tài chọn ba công trình có
liên quan mật thiết nhất để phân tích và làm cơ sở nghiên cứu như sau:
1.2.1. Các thuật toán di truyền và tiến hóa dùng dự báo chuỗi thời gian
(Genetic and Evolutionary Algorithms Time Series Forecasting) của Paulo
Cortez, Miguel Rocha, and Jose1 Neves [12]
Bài báo phân tích những khái niệm cơ bản về chuỗi thời gian (TS: time
series), thuật toán di truyền và tiến hóa (GEAs: Genetic and Evolutionary
Algorithms) sau đó mô tả các mô hình khác nhau và đưa ra các kết quả thực
nghiệm. Cuối cùng, kết quả được trình bày và so sánh với các phương pháp dự báo
chuỗi thời gian truyền thống.
Một chuỗi dữ liệu thời gian là tập hợp các quan sát theo thứ tự thời gian và
được ghi lại tại một khoảng thời gian cụ thể. Một mô hình chuỗi thời gian xt giả
định rằng mô hình quá khứ sẽ tái diễn trong tương lai gần. Trong đó có sự khác biệt
giữa giá trị thực tế và giá trị dự báo gọi là sai số dự báo thể hiện bằng công thức:
Với et là sai số dự báo
(1.1)
Hiệu suất tổng thể của mô hình dự báo được đánh giá bởi thước đo chính
xác, cụ thể là Sum Squared Error (SSE), Root Mean Squared Error (RMSE) và
Normalized Mean Square Error (NMSE), các chỉ tiêu trên được tính toán như sau:
(1.2)
l là số mẫu dự báo ;
là trọng số của chuỗi dữ liệu.
Một phương pháp dự báo chuỗi thời gian (TSF: Time series forecasting) khá
thành công là phương pháp san bằng số mũ ES, dựa trên một số mẫu cơ bản phân
biệt với giá trị ngẫu nhiên bởi trung bình các giá trị trước đó. Những lợi thế của mô
hình này như sử dụng đơn giản, giảm tính toán, tính chính xác cao của dự báo, đặc
biệt với chuỗi thời gian theo mùa.
Mô hình trung bình trượt tích hợp tự hồi quy ARIMA là một phương pháp
quan trọng để dự báo chuỗi thời gian. Ưu điểm chính của phương pháp này là dựa
vào sự chính xác trên một miền rộng lớn của những chuỗi thời gian, nhưng phức tạp
hơn về khả năng sử dụng và hiệu quả tính toán so với ES. Mô hình dựa trên sự kết
hợp tuyến tính của giá trị trong quá khứ. Mô hình có thể mặc nhiên công nhận như
một mô hình trung bình trượt tự hồi quy ARMA(P, Q), được đưa ra với hình thức:
Trong đó P biểu thị bậc của AR và Q biểu thị bậc của MA, Ai và Mj là các hệ số
của AR và MA, một giá trị không đổi. Cả hai liên tục và các hệ số của mô hình
được ước tính bằng cách sử dụng phương pháp tiếp cận thống kê.
Bài báo này dùng bảng dữ liệu từ Time Series Data Library[16] ở bảng 1.1:
Bảng 1.1: Time Series Data Library [16]
Series
Type
Passengers Seasonal &
Paper
Trended
Deaths
Seasonal
maxtemp
Chemical
Trended
Prices
Lynx
Nonlinear
kobe
Domain
Tourism
Sales
Traffic
Meteorology
Chemical
Economy
Ecology
Geology
Description
Monthly international airline passengers
Monthly sales of French paper
Monthly deaths & injuries in UK roads
Maximum temperature in Melbourne
Chemical concentration readings
Daily IBM common stock closing prices
Annual number of lynx
Seismogragh of the Kobe earthquake
Các thí nghiệm được trình bày trong bài báo này, một bộ tám các chuỗi thời
gian được lựa chọn (Bảng 1.1) từ Time Series Data Library lấy từ nhiều nguồn khác
nhau, có liên quan với các vấn đề thực tế. Tất cả chuỗi thời gian được phân thành
bốn loại chính gồm tất cả các chuỗi thời gian: theo mùa và xu hướng (Seasonal and
Trended), theo mùa (Seasonal), theo xu hướng (Trended) và phi tuyến (Nonlinear).
Các GEAs sử dụng một giải thuật nhị phân, một vấn đề nhất định được mã hóa
thành một tập ký tự {0,1}. Tuy nhiên, một số tác giả đã cho rằng còn có những vấn
đề mà các tham số được đưa ra bởi giá trị thực, chiến lược tối ưu là sử dụng một
biểu diễn giá trị thực (RVR: Real-Valued Representation.)
Trong bài báo này, hai cách tiếp cận để dự báo, cả hai đều dựa trên GEAs với
RVR. Trong các mô hình dự báo là sự kết hợp tuyến tính của các giá trị trước đó.
Hai mô hình được quan tâm trong bài báo này đưa ra là:
G1- Tuyến tính kết hợp dựa trên GEAs là:
gi là viết tắt gen thứ i của nhiễm sắc thể của các phần tử; n là kích thước phần tử.
G2- ARMA dựa trên GEAs là:
Một giải pháp thay thế là sử dụng chỉ tiêu Bayesian Information Criterion (BIC).
Với N là số mẫu huấn luyện và p là số lượng tham số mô hình, chỉ tiêu này
giúp chọn mô hình dự báo tối ưu.
Bảng so sánh mô hình tiến hóa và mô hình thông thường đưa ra trong
(Bảng1.2). Các giá trị sai số thử nghiệm dựa trên hai tiêu chuẩn là RMSE và
NMSE.
Bảng 1.2 : So sánh giữa các phương pháp TSF khác nhau [12]
Series
Passengers
Paper
Deaths
Maxtemp
Chemical
Prices
Lynx
Kobe
ES
16.7 (0.71%)
41.0 (3.1%)
145 (43%)
0.917 (4.1%)
0.354 (51%)
7.50 (0.39%)
876 (57%)
3199 (105%)
ARIMA
17.8 (0.81%)
61.0 (6.8%)
144 (42%)
1.068 (5.6%)
0.361 (53%)
7.72 (0.41%)
504 (19%)
582 (4%)
GEA
20.9 (1.12%)
56,3 (5.8%)
134 (37%)
0.915 (4.1%)
0.343 (48%)
7.48 (0.38%)
262 (5%)
524 (3%)
Các kết quả của phương pháp tiến hóa rất tốt, với 6 trong 8 dòng dữ liệu
chuỗi thời gian được dự báo tốt. Trong điều kiện các loại hình khác nhau của
các chuỗi thời gian, phương pháp được đề xuất có kết quả không tốt trong 2
dòng dữ liệu dạng theo mùa và xu hướng (Passengers, Paper), nơi mà ES chiếm
ưu thế. Trong tất cả các loại khác kết quả rất tốt, đặc biệt trong các chuỗi phi
tuyến tính (Lynx, Kobe).
Các kết quả của việc áp dụng các GEAs trong lĩnh vực TSF là đáng khích lệ.
Trong tương lai, việc lựa chọn mô hình được tự động hóa cụ thể là quá trình lựa
chọn các cửa sổ thời gian trượt (STWs: Sliding Time Window) tối ưu. Việc mở
rộng những số liệu tìm kiếm khác nhau của STWs trong không gian tìm kiếm là
cách tốt hơn. Vì đây là một nhiệm vụ tối ưu hóa , việc sử dụng GEAs có thể thuận
lợi, tạo một kiến trúc hai cấp. Ngoài ra có thể dựa vào các chương trình làm tốt hơn
các mô hình dự báo, bằng cách tích hợp các chức năng phi tuyến (ví dụ: logarit hay
lượng giác)
1.2.2. Sử dụng thuật giải di truyền đa cấp dự báo chuỗi thời gian (A MetaGenetic Algorithms for Time Series Forecasting) của P. Cortez, M. Rocha, and
J. Neves [11]
Bài báo này trình bày một phương pháp dự báo chuỗi thời gian bằng mô hình
tự hồi quy trung bình trượt ARMA sử dụng thuật giải di truyền ở 2 cấp bậc, ở cấp
thuật giải GA nhị phân sẽ tìm kiếm mô hình ARMA dự báo tối ưu và GA thập
phân sẽ giúp tìm ra bộ giá trị tham số tương ứng.
Bài báo này được phát triển từ bài báo (mục 1.2.1). Do đó hàm đánh giá mô
hình cũng tương tự bài báo trên.
Đối với các thí nghiệm được trình bày trong bài báo này, cũng gồm một bộ
tám các chuỗi thời gian nhưng chuỗi dữ liệu Lynx được thay bằng Sunspots. Việc
sử dụng cửa sổ thời gian trượt lớn có thể tăng độ phức tạp hệ thống, giảm bớt hiệu
quả của các mô hình, trong khi cửa sổ thời gian trượt nhỏ có thể chứa thông tin
không đầy đủ
Thuật giải di truyền đa cấp (Meta-Gas: Meta-Genetic Algorithm) được sử
dụng cho việc tối ưu hóa các tham số GA. Trong bài báo này, sử dụng thuật giải di
truyền 2 cấp, bao gồm cấp cao (meta-level) GA sử dụng tìm kiếm mô hình ARMA
dự báo tối ưu và cấp thấp (low-level) GA giúp tìm ra bộ tham số tương ứng.
Đại diện cho mô hình là Meta-GAs nhị phân, mỗi gen đại diện cho một hệ số
nếu giá trị của nó là 1, nếu là 0 thì nó không được xem xét (Hình 1.1)
PQ
1010100101000
Meta-Level
Low-Level
A2
A4
M1
M3
Hình 1.1 : Ví dụ về giải mã thuật toán Meta-GAs [11]
Mô hình này được tối ưu hóa bằng cách chạy một thuật toán di truyền RVR
cấp thấp, với mỗi gen mã hóa một hệ số của mô hình ARMA, được cho bởi phương
trình (1.9). Mỗi cá thể, được đánh giá bởi chỉ tiêu RMSE trong tập huấn luyện.
Mặt khác, các hàm mục tiêu của mỗi cá thể trong meta-level thu được bằng
cách giải mã nhiễm sắc thể của nó vào low-level GA chạy và cuối cùng tính toán
giá trị BIC của mô hình tối ưu. Hệ thống tổng thể được mô tả hình (1.2).
(1.9)
Các đề xuất của thuật toán Meta-GA đã được thử nghiệm trên các chuỗi dữ
liệu thời gian từ bảng (1.1).
Chuỗi dữ liệu thời gian được chia 90% giá trị đầu tiên thành tập huấn luyện và
10% giá trị sau là tập thử nghiệm. Chỉ có các tập huấn luyện được sử dụng để lựa
chọn mô hình và tối ưu hóa các thông số. Các tập thử nghiệm được sử dụng để so
sánh các phương pháp tiếp cận được đề xuất.
Meta-GA làm việc như một thủ tục tối ưu hóa thứ hai, do đó thuật toán áp
dụng một quy mô 100 cá thể, với sự tái tổ hợp di truyền cung cấp bởi lai chéo hai
điểm đột biến nhị phân
Hình 1.2 : The Meta-Ecolutionary Approach [11]
- Xem thêm -