Cực đại của tổng các hàm lồi

Một người bạn fb của tôi, ông Marian Dinca có đăng lên trang cá nhân của ông ấy một bài toán như sau

Bài toán 1. Cho các số thực $m,\,n,\,p$ với $m<n$ và $p>1$. Tìm giá trị lớn nhất của biểu thức $F=x^p+y^p+z^p$, khi các biến $x,\,y,\,z$ thay đổi trên đoạn đóng $[m,\,n]$ và thỏa mãn ràng buộc $x+y+z=p$.

Bài toán như thế này, tôi có một kết quả tổng quát từ năm 2000, như sau

Bài toán 2. Cho $\mathbb I=[a;\,b]$, $f_i:\,\mathbb I\to\mathbb R$ là các hàm số  lồi trên $\mathbb I$ (với $1\le i\le n$), hằng số $C\in [na;\,nb]$. Khi đó, với bộ $\left(x_i\right)_{1\le i\le n}\in\mathbb I^n$ thay đổi giá trị và thỏa mãn điều kiện ràng buộc là $\sum\limits_{1 \le i \le n} {{x_i} = } C$, thì $\sum\limits_{1 \le i \le n} {f\left( {{x_i}} \right) }$ sẽ đạt giá trị lớn nhất tại bộ $\left(c_i\right)_{1\le i\le n}\in\mathbb I^n$ thỏa mãn là trong bộ $\left(c_i\right)_{1\le i\le n}$ đó có $k=\left\lfloor {\frac{{nb – C}}{{b – a}}} \right\rfloor $ số bằng $a$, có $l = \left\lfloor {\frac{{C – na}}{{b – a}}} \right\rfloor $ số bằng $b$, còn số còn lại là $C-ka-lb$ thuộc $[a;\,b)$.

Xin biên lại lời giải của nó như sau

Lời giải cho bài toán 2. Bởi vì với mỗi chỉ số $i$ thỏa mãn $1\le i\le n$ thì $f_i:\,\mathbb I\to\mathbb R$ là các hàm số  lồi trên $\mathbb I$, nên ta có $F\left(x_1,\,x_2,\,\ldots ,\,x_n\right)$ liên tục trên tập compact $\mathbb I^n$ của $\mathbb R^n$ (xem ở http://maths.vn/tinh-lien-tuc-cua-ham-loi/), trong đó $$F\left(x_1,\,x_2,\,\ldots ,\,x_n\right)=f_1\left(x_1\right)+f_2\left(x_2\right)+\ldots+f_n\left(x_n\right).$$ Như vậy, trên $D=\mathbb I^n$ thì $F$ sẽ đạt gia trị lớn nhất tại bộ $\left(c_i\right)_{1\le i\le n}\in D$ nào đó.

Ta sẽ chứng minh là: không tồn tại hai chỉ số phân biệt để $c_j$ thuộc vào khoảng mở $(a;\,b)$. Nếu điều đó mà không đúng, ta giả như $c_1,\,c_2\in (a,\,b)$.

Xin nhắc lại ở đây bất đẳng thức cát tuyến, cũng đã trình bày và chứng minh ở bài http://maths.vn/tinh-lien-tuc-cua-ham-loi/

Bổ đề (bất đẳng thức cát tuyến). Cho $\mathbb I$ là một khoảng mở của đường thẳng thực và hàm số $f:\,\mathbb I\to\mathbb R$ lồi trên $\mathbb I$, khi đó với $[a;\,b]\subset\mathbb I$ cho trước thì ta đều có bất đẳng thức sau với mỗi $x\in [a;\,b]$ \[f(x)\le f(a)+(x-a)\frac{f(a)-f(b)}{a-b}.\] Dấu bằng của đánh giá đạt được khi và chỉ khi $x\in\{a,\,b\}$.

Ta đặt $c_1+c_2-a=c,\,c_1+c_2-b=d$, ta để ý $c>a$ và $d<b$, và xét các trường hợp sau

  1. Nếu $c<b$, lúc đó có
    \[\begin{array}{l}
    f\left( {{c_1}} \right) < f\left( a \right) + \left( {{c_1} – a} \right)\frac{{f\left( a \right) – f\left( c \right)}}{{a – c}},\\
    f\left( {{c_2}} \right) \le f\left( c \right) + \left( {{c_2} – c} \right)\frac{{f\left( a \right) – f\left( c \right)}}{{a – c}}.
    \end{array}\]Cộng lại ta có được \[\sum\limits_{1 \le j \le n} {{f_j}\left( {{c_j}} \right)} < f\left( a \right) + f\left( c \right) + \sum\limits_{2 < j \le n} {{f_j}\left( {{c_j}} \right)} .\]Và có sự mâu thuẫn với vai trò của bộ $\left(c_i\right)_{1\le i\le n} $.
  2. Nếu $d>a$, lúc đó có
    \[\begin{array}{l}
    f\left( {{c_1}} \right) < f\left( d \right) + \left( {{c_1} – d} \right)\frac{{f\left( b \right) – f\left( d \right)}}{{b – d}},\\
    f\left( {{c_2}} \right) \le f\left( b \right) + \left( {{c_2} – b} \right)\frac{{f\left( b \right) – f\left( d \right)}}{{b – d}}.
    \end{array}\]Nó dẫn đến \[\sum\limits_{1 \le j \le n} {{f_j}\left( {{c_j}} \right)} < f\left( d \right) + f\left( b \right) + \sum\limits_{2 < j \le n} {{f_j}\left( {{c_j}} \right)} .\]Và lại có sự mâu thuẫn với vai trò của bộ $\left(c_i\right)_{1\le i\le n} $.
  3. Nếu $c\ge b$ và $d\le a$ thì có ngay $c_1+c_2=a+b$, lúc đó
    \[\begin{array}{l}
    f\left( {{c_1}} \right) < f\left( a \right) + \left( {{c_1} – a} \right)\frac{{f\left( a \right) – f\left( b \right)}}{{a – b}},\
    f\left( {{c_2}} \right) < f\left( b \right) + \left( {{c_2} – b} \right)\frac{{f\left( a \right) – f\left( c \right)}}{{a – b}}.
    \end{array}\]Để tiếp tục thấy vai trò của $\left(c_i\right)_{1\le i\le n} $ bị vi phạm, bởi vì là\[\sum\limits_{1 \le j \le n} {{f_j}\left( {{c_j}} \right)} < f\left( a \right) + f\left( b \right) + \sum\limits_{2 < j \le n} {{f_j}\left( {{c_j}} \right)}. \]

Như vậy, $F$ sẽ đạt giá trị lớn nhất tại bộ $\left(c_i\right)_{1\le i\le n} $ mà có không quá một số $c$ (nào đó) trong các $c_j$ thuộc vào khoảng mở $(a;\,b)$. Giả sử có $k$ số bằng $a$, $l$ số bằng $b$, thì ta có $n\ge k+l\ge n-1$ và\[\left( {k + 1} \right)a + lb < C < ka + \left( {l + 1} \right)b.\]Từ đó ta tính được ra $k,\,l$ và $c$ như đã nêu trong bài toán và hoàn tất lời giải.

$\square$

Từ bài toán mà tôi nêu ra và đã xử lý ở trên, ta thấy là nếu muốn đi tìm giá trị lớn nhất của biểu thức ở dạng
$$F\left(x_1,\,x_2,\,\ldots ,\,x_n\right)=f_1\left(x_1\right)+f_2\left(x_2\right)+\ldots+f_n\left(x_n\right).$$ Trong đó các biến số $x_j$ thuộc một đoạn đóng $[a;\,b]$ của đường thẳng thực thỏa mãn ràng buộc là tổng không đổi, còn $f_j(x)$ lồi trên $[a;\,b]$, ta chỉ cần đi thay thế và tính toán với hữu hạn bộ cụ thể. Các bộ đó, chỉ nhiều nhất một số thuộc khoảng mở $(a;\,b)$ còn lại nhận giá trị ở hai đầu mút $a,\,b$. Số các giá trị bằng $a$ hay bằng $b$ và kể cả số thuộc khoảng $(a;\,b)$ kia, thì đã được xác định ở nội dung bài toán 2.

Tags: , ,

Reply