You are here: Home » Content » Ứng dụng quy hoạch tuyến tính

Ứng dụng quy hoạch tuyến tính

Module by: ThS. Lê Đức Thắng

Summary: Chương này trình bày các bài toán để thấy khả năng ứng dụng rộng rãi của quy hoạch tuyến tính. Bài toán trò chơi được trình bày một cách chi tiết, các bày toán còn lại chỉ trình bày mô hình. Việc giải các bài toán này được nghiên cứu thêm trong các môn tiếp theo.

MỞ ĐẦU
Trong thực tế hay gặp tình huống là phải chọn một quyết định (bấp bênh) do phải đối mặt với một đối thủ thông minh và có quyền lợi đối lập với ta : ví dụ trong các trò chơi tranh chấp, trong quân sự, trong vận động tranh cử....
Nghiên cứu việc chọn quyết định trong những trường hợp đối kháng này có tên gọi là lý thuyết trò chơi. Ở đây người chọn quyết định và đối thủ đều được gọi là người chơi. Mỗi người chơi có một tập hợp các hành động để lựa chọn được gọi là chiến lược.
Chúng ta xét một trường hợp đơn giản là trò chơi hai người : phần thưởng sẽ là cái được của một người và chính là cái mất của người kia.
Giải một trò chơi nghĩa là tìm chiến lược tốt nhất cho mỗi người chơi. Hai người chơi thường được ký hiệu là A và B, chiến lược tương ứng của mỗi người được ký hiệu là :
A : i (i=1m)
B : j (j=1n)
Giải thưởng ứng với chiến lược (i,j) của hai người được ký hiệu là aij và được viết thành một bảng như sau :
B 1 2 ... n
A        
1 a11 a12 ... a1n
2 a21 a22 ... a2n
... ... ... ... ...
m am1 am2 ... amn
Ví dụ :
    1 2 3 4  B
A 
1 1 0 -2 1  
2 2 2 1 0  
3 -1 -1 0 3  
Ðối với A :
- Nếu A đi nước 1 (dòng 1) thì A sẽ :
. Thắng 1 điểm nếu B đi nước 1(thắng)
. Thắng 0 điểm nếu B đi nước 2(hoà)
. Thắng -2 điểm nếu B đi nước 3(thua)
. Thắng 1 điểm nếu B đi nước 4(thắng)
Những trường hợp còn lại là tương tự .
Ðối với B :
- Nếu B đi nước 2 (cột 2) thì B sẽ :
. Thua 0 điểm nếu A đi nước 1
. Thua 2 điểm nếu A đi nước 2
. Thua -1 điểm nếu A đi nước 3
Những trường hợp còn lại là tương tự .
Nghiệm tối ưu của trò chơi, có khi gọi tắt là nghiệm, là bộ chiến lược (i*,j*) có tính chất là nếu một người lấy chiến lược khác còn người kia vẫn giữ nguyên thì phần thưởng cho người đi khác sẽ bị thiệt hại. Giải trò chơi có nghĩa là tìm nghiệm tối ưu.

BÀI TOÁN TRÒ CHƠI

Trò chơi có nghiệm ổn định

Hai nhà chính trị A và B vận động tranh cử 1 ghế ở nghị viện trong 2 ngày cuối quan trọng nhất ở hai thành phố P và Q. Mỗi người phải đặt kế hoạch vận động mà không biết được kế hoạch của đối phương. Các cố vấn đưa ra 3 chiến lược :
- Ở mỗi thành phố một ngày
- Ở cả 2 ngày ở thành phố P
- Ở cả 2 ngày ở thành phố Q và đánh giá kết quả vận động tương ứng như sau :
    1 2 3  B
A 
1 1 2 4  
2 1 0 5  
3 0 1 -1  
Dữ liệu là tổng số phiếu, tính theo đơn vị là ngàn, mà A sẽ dành được từ B hay ngược lại .
Đây là một trường hợp đơn giản mà người ta có thể giải được bằng khái niệm chiến lược bị trội hơn như sau :
- Đối với A thì chiến lược 3 bị trội hơn bởi chiến lược 1 và 2 vì nó mang đến cho A số điểm thắng ít, nên dù B có chọn chiến lược nào thì A cũng vẫn chọn chiến luợc 1 hoặc 2 mà bỏ chiến lược 3 . Ta có :
    1 2 3  B
A 
1 1 2 4  
2 1 0 5  
3 0 1 -1  
- Đối với B thì chiến lược 3 bị trội hơn bởi chiến lược 1 và 2 vì nó mang đến cho B số điểm thua nhiều nên B bỏ chiến lược 3. Ta có :
    1 2 3  B
A 
1 1 2 4  
2 1 0 5  
3 0 1 -1  
- Đối với A thì chiến lược 2 bị trội hơn bởi chiến lược 1 vì vậy A bỏ chiến lược 2. Ta có :
    1 2 3  B
A 
1 1 2 4  
2 1 0 5  
3 0 1 -1  
- Đối với B thì chiến lược 2 bị trội hơn bởi chiến lược 1 vì vậy B bỏ chiến lược 2. Ta có :
    1 2 3  B
A 
1 1 2 4  
2 1 0 5  
3 0 1 -1  
Cuối cùng thì bộ chiến lược (1,1) là nghiệm tối ưu của trò chơi với kết quả là người A thu thêm được 1 (ngàn) phiếu từ người B.
Trong nhiều trường hợp, khi dùng chiến lược bị trội hơn chỉ mới giảm được cở của bài toán mà chưa giải quyết xong vấn đề đặt ra.
Chiến lược MaxiMin và MiniMax
Xét ví dụ tương tự như ví dụ trên nhưng bảng kết quả vận động được các cố vấn đánh giá như sau :
    1 2 3  B
A 
1 -3 -2 6  
2 1 0 2  
3 5 -2 -4  
Đây là trường hợp người chọn quyết định nghĩ là đối phương thông minh và cố ý chọn quyết định chống lại mình nên họ luôn nghĩ đến chiến lượt “ăn chắc” , đó là MaxiMin(A) và MiniMax(B) như sau :
a- MaxiMin(A)
A luôn xem B là đối thủ thông minh. Khi A đi nước i0 (dòng i0) thì B sẽ chọn nước đi j0 (cột j0) sao cho A thắng điểm ít nhất . Nghĩa là B đi vào ô :
a i 0 j 0 = Min j a i 0 j a i 0 j 0 = Min j a i 0 j size 12{a rSub { size 8{i rSub { size 6{0} } j rSub { size 6{0} } } } = { ital "Min"} cSub { forall j} size 12{ left lbrace a rSub {i rSub { size 6{0} } j} right rbrace }} {}
Trong tình huống đó A sẽ chọn nước đi sao cho A thắng nhiều điểm nhất. Chiến thuật của A là đi vào ô :
g A = a i A j A = MaxiMin ( A ) = max i min j a ij g A = a i A j A = MaxiMin ( A ) = max i min j a ij size 12{g rSub { size 8{A} } =a rSub { size 8{i rSub { size 6{A} } j rSub { size 6{A} } } } ="MaxiMin " \( A \) = {"max"} cSub {i} left lbrace size 12{ {"min"} cSub {j} size 12{ left lbrace " a" rSub {"ij"} right rbrace } size 12{ }} right rbrace } {}
A đi nước 1 thì B sẽ đi nước 1: a11=-3
A đi nước 2 thì B sẽ đi nước 2 : a22=0
A đi nước 3 thì B sẽ đi nước 3 : a33=-4
    1 2 3  B
A 
1 -3 -2 6  
2 1 0 2  
3 5 -2 -4  
Vậy MaxiMin(A) = a22 = 0
b- MiniMax(B)
B luôn xem A là đối thủ thông minh. Khi B đi nước j0 (cột j0) thì A sẽ chọn nước đi i0 (dòng i0) sao cho B thua điểm nhiều nhất . Nghĩa là A đi vào ô
a i 0 j 0 = max i a ij 0 a i 0 j 0 = max i a ij 0 size 12{a rSub { size 8{i rSub { size 6{0} } j rSub { size 6{0} } } } = {"max"} cSub { forall i} size 12{ left lbrace " a" rSub { ital "ij" rSub { size 6{0} } } right rbrace }} {}
Trong tình huống đó B sẽ chọn nước đi sao cho B thua ít điểm nhất. Chiến thuật của B là đi vào ô :
g B = a i B j B = M iniMax ( B ) = min j max i a ij g B = a i B j B = M iniMax ( B ) = min j max i a ij size 12{g rSub { size 8{B} } =a rSub { size 8{i rSub { size 6{B} } j rSub { size 6{B} } } } =M"iniMax " \( B \) = {"min"} cSub {j} size 12{ left lbrace {"max"} cSub {i} size 12{ left lbrace a rSub {"ij"} right rbrace } size 12{ } right rbrace }} {}
    1 2 3  B
A 
1 -3 -2 6  
2 1 0 2  
3 5 -2 -4  
B đi nước 1 thì A sẽ đi nước 3: a31=5
B đi nước 2 thì A sẽ đi nước 2 : a22=0
B đi nước 3 thì B sẽ đi nước 1 : a13=6
Vậy MiniMax(B) = a22= 0
Lần này ta thấy rằng :
MaxiMin(A) = MiniMax(B) = a22= 0
Bộ chiến lược (2,2) có giá trị là 0 là nghiệm tối ưu của trò chơi vì nếu người nào đi lệch và người kia đi đúng thì người đi đúng thu lợi nhiều hơn giá trị của trò chơi. Nghiệm tối ưu trong trường hợp này còn được gọi là nghiệm ổn định.

Trò chơi không có nghiệm không ổn định

Xét ví dụ tương tự như trên với bảng kết quả được các chuyên gia đánh giá như sau :
    1 2 3  B
A 
1 0 -2 2  
2 5 4 -3  
3 2 3 -4  
Khi A và B dùng chiến lược MaxiMin và MiniMax của mình thì cho kết quả như sau :
MaxiMin(A) = a12 = -2
MiniMax(B) = a13 = 2
Vì MaxiMin(A) và MiniMax(B) là khác nhau nên trò chơi không có nghiệm ổn định. Ta xem điều gì có thể xảy ra ?
- A tính rằng nếu B thực hiện đúng chiến lược của mình là chọn cột 3 thì A sẽ chọn chiến lược 1 để thắng 2 từ B (thay vì thắng -2)
    1 2 3  B
A 
1 0 -2 2  
2 5 4 -3  
3 2 3 -4  
- Lúc này B sẽ suy tính và thấy rằng phải chọn chiến lược 2 để thua -2 từ A (thay vì thua 2).
    1 2 3  B
A 
1 0 -2 2  
2 5 4 -3  
3 2 3 -4  
- Đến lượt A cũng đủ thông minh để tính liền được 2 nước, biết được B sẽ chọn chiến lược 2 nên A sẽ dùng chiến lược 2 để thắng 4 từ B .
    1 2 3  B
A 
1 0 -2 2  
2 5 4 -3  
3 2 3 -4  
- Nhưng B cũng tính được điều này nên sẽ quay lại chọn chiến lược 3 để thua -3 từ A .
    1 2 3  B
A 
1 0 -2 2  
2 5 4 -3  
3 2 3 -4  
- Cũng như B , A cũng sẽ tính được điều này nên sẽ quay lại chọn chiến lược 1 để thắng 2 từ B.
    1 2 3  B
A 
1 0 -2 2  
2 5 4 -3  
3 2 3 -4  
Như vậy ta đã xoay đúng một vòng, và nếu cứ lập luận như vậy thì ta sẽ xoay vòng mãi. Những bộ chiến lược nhận được trong khi xoay vòng là những nghiệm không ổ định.
Chiến lược hỗn hợp
Để có được lời giải của trò chơi không có nghiệm ổn định người ta đưa ra khái niệm chiến lược hỗn hợp. Mỗi người chơi không chọn một chiến lược thuần túy như trước đây mà chọn một phân bố xác suất sử dụng tất cả các chiến lược.
Xét trò chơi giữa A và B có ma trận điểm dương có dạng tổng quát :
    1 2 ... n  B
A 
1 a 11 a 11 size 12{a rSub { size 8{"11"} } } {} a 12 a 12 size 12{a rSub { size 8{"12"} } } {} ... a 1n a 1n size 12{a rSub { size 8{1n} } } {}  
2 a 21 a 21 size 12{a rSub { size 8{"21"} } } {} a 22 a 22 size 12{a rSub { size 8{"22"} } } {} ... a 2n a 2n size 12{a rSub { size 8{2n} } } {}  
... ... ... ... ...  
m a m1 a m1 size 12{a rSub { size 8{m1} } } {} a m2 a m2 size 12{a rSub { size 8{m2} } } {} ... a mn a mn size 12{a rSub { size 8{ ital "mn"} } } {}  
Giả sử rằng :
MaxiMin ( A ) = a i A j A = g A MaxiMin ( A ) = a i A j A = g A size 12{"MaxiMin " \( A \) =a rSub { size 8{i rSub { size 6{A} } j rSub { size 6{A} } } } =g rSub {A} } {}
M iniMax ( B ) = a i B j B = g B M iniMax ( B ) = a i B j B = g B size 12{M"iniMax " \( B \) =a rSub { size 8{i rSub { size 6{B} } j rSub { size 6{B} } } } =g rSub {B} } {}
a i A j A a i B j B a i A j A a i B j B size 12{a rSub { size 8{i rSub { size 6{A} } j rSub { size 6{A} } } } <> a rSub {i rSub { size 6{B} } j rSub { size 6{B} } } } {}
Gọi :
. pi > 0 (i=1 m ) là tần suất nước đi thứ i của A với
p1 + p2 + ... + pm = 1
. qj > 0 (j=1 n ) là tần suất nước đi thứ j của B với
q1 + q2 + ... + qn = 1
      q1 q2 ... qn  
      1 2 ... n  B
A 
p1 1 a 11 a 11 size 12{a rSub { size 8{"11"} } } {} a 12 a 12 size 12{a rSub { size 8{"12"} } } {} ... a 1n a 1n size 12{a rSub { size 8{1n} } } {}  
p2 2 a 21 a 21 size 12{a rSub { size 8{"21"} } } {} a 22 a 22 size 12{a rSub { size 8{"22"} } } {} ... a 2n a 2n size 12{a rSub { size 8{2n} } } {}  
... ... ... ... ... ...  
pm m a m1 a m1 size 12{a rSub { size 8{m1} } } {} a m2 a m2 size 12{a rSub { size 8{m2} } } {} ... a mn a mn size 12{a rSub { size 8{ ital "mn"} } } {}  
Vấn đề đặt ra là :
-Tìm tần suất pi > 0 của nước đi thứ i (i =1 m) của A sao cho đối với mỗi nước đi thứ j của B số điểm thắng trung bình của A không nhỏ thua gA :
p1a1j + p2a2j + ..... + pmamj(j = 1 n)
Cũng có nghĩa là tìm pi sao cho :
p1a1j + p2a2j + ..... + pmamj  g1  gA (j = 1 n)
g1  max
- Tìm tần suất qj > 0 của nước đi thứ j (j =1 n) của B sao cho đối với mỗi nước đi thứ i của A số điểm thua trung bình của B không lớn hơn gB :
q1ai1 + q2ai2 + .... + qnain (i = 1 m)
Cũng có nghĩa là tìm các qj sao cho :
q1ai1 + q2ai2 + ..... + qnain  g2  gB (i = 1 m)
g2­  min
Khi đó hai bài toán quy hoạch tuyến tính thu được là :
max g 1 min 1 g 1 p 1 + p 2 + . . . + p m = 1 p 1 a 1j + p 2 a 2j + . . . + p m a mj g 1 ( j = 1 n ) p i > 0 (