連続ではない凸関数

開区間上で定義された凸関数は連続です。この意味で、「凸関数は連続である」と言えます。(高校数学ではこのケースしか扱わないことも多く、これのみを知りたい方はより分かりやすい文献¹もご参照ください。)

open_interval

一方で、閉区間上で定義された凸関数は区間の端点で連続であるとは限りません。一般に、凸関数は縁(ふち)で不連続になり得ます。

closed_interval

では、上図のように明らかに値が断絶した、ある意味で自明な不連続関数しかないのかというと、実はそうではなく、非自明な不連続関数も存在します。より厳密にいえば、閉凸関数であっても、下図のように不連続な凸関数が構成できます。青点 $(0,0)$ は連続点なように見えますが、赤で示した $(0,0)$ に収束する点列を考えると、不連続点であることが分かります。

psi3

本記事の内容は、Nesterovによる”Lectures on Convex Optimization”²に一部準拠します。以下、教科書と表記します。

概要

本記事では以下のフローチャートに基づき説明します。

flowchart

定義

はじめに、厳密な議論の為に定義を示します。

凸関数

集合 $Q$ が凸(convex)であることは、任意の $x, y \in Q$ と $\alpha \in [0, 1]$ に対して次が成立することと同値です（教科書 Definition 2.1.1）。

\alpha x + (1 - \alpha) y \in Q.

凸集合である	凸集合でない
<img width=100% src=”https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/905155/3b35d51e-3099-9339-cdec-493933834844.png” alt=”convex”>	<img width=100% src=”https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/905155/4206d582-2506-f89d-e23e-ff8b9179a9f2.png” alt=”non_convex”>

(Wikipedia「凸集合」より引用 / CheCheDaWaff, CC BY-SA 4.0, via Wikimedia Commons)

また、拡大実数に値を取る関数 $f\colon \mathbb{R}^n \to \mathbb{R} \cup \lbrace \pm\infty \rbrace$ のdomainは次のように定義されます。

\mathrm{dom} ~ f = \lbrace x \in \mathbb{R}^n \mathrel{\mid} \lvert f(x) \rvert < \infty \rbrace.

なお、これは教科書通りではありますが、やや珍しい定義で、effective domainとして $-\infty$ の場合を含めることもあります。本記事および教科書では、実数の範囲内に値を取る点の集合として定め、また $\mathrm{dom} ~ f \neq \emptyset$ を仮定します。

なお、真凸関数 (proper convex function)³は $\mathrm{dom} ~ f \neq \emptyset$ と $f(x) \neq -\infty$ が条件の為、代わりに真凸関数であることを仮定しても殆ど同じ議論になります。

そして、$f$ が凸関数であることは、$\mathrm{dom} ~ f$ が凸であり、かつ、任意の $x, y \in \mathrm{dom} ~ f$ と $\alpha \in [0, 1]$ に対して次が成立することと同値です（教科書 Definition 3.1.1）。

f(\alpha x + (1 - \alpha) y) \leq \alpha f(x) + (1 - \alpha) f(y).

convex_func

連続

関数 $f$ が $\mathrm{dom} ~ f$ で連続であることは、任意の $\overline{x} \in \mathrm{dom} ~ f$ において $f$ が連続であることと同値です。

ある $\overline{x} \in \mathrm{dom} ~ f$ において $f$ が連続であることは、$\overline{x}$ に収束する任意の点列 $\lbrace x_k \rbrace \subseteq \mathrm{dom} ~ f$ に対し、$\lbrace f(x_k) \rbrace$ が $f(\overline{x})$ に収束すること、すなわち、

\lim_{k \to \infty} x_k = \overline{x} \implies \lim_{k \to \infty} f(x_k) = f(\overline{x})

が成立することと同値です⁴。

凸関数が全域で定義されている場合

凸関数について、一般に次の主張が成り立つことが知られています⁵。

凸関数は、$\mathrm{dom} ~ f$ の相対的内部で連続である。

本記事の主題ではないので、詳細はAppendixに譲りますが、簡単に言うと、縁(ふち)でない部分では凸関数は連続であるし、また縁の部分では不連続になり得るということです。

特に、$\mathrm{dom} ~ f$ が $\mathbb{R}^n$ 全体ならば、その相対的内部も $\mathbb{R}^n$ 全体なので、次の系が導かれます。

$\mathrm{dom} ~ f$ が空間全域となる （$\pm \infty$ に値を取らない） 凸関数は連続である。

そして、この主張を言い換えると、次と等価です⁶。

凸関数 $f\colon \mathbb{R}^n \to \mathbb{R}$ は連続である。

値域が $\mathbb{R}$ であり、$\mathbb{R} \cup \lbrace \pm\infty \rbrace$ ではないことに注意して下さい。1次元だと $ax+b, x^2, \lvert x \rvert, e^x$ などの関数が該当します。ただし、$1/x$ や $-\log x$ すら、この「$\mathrm{dom} ~ f$ が空間全域となる」という条件を満たさないことに注意して下さい。

閉凸関数でない場合

前節では、全域で定義されている場合、つまり $\mathrm{dom} ~ f = \mathbb{R}^n$ である場合について考えました。以下では、$\mathrm{dom} ~ f \neq \mathbb{R}^n$ である場合について考えます。つまり、$\pm \infty$ に値を取ることがある場合です。ここで、凸関数の性質を議論する上で重要な性質である、閉凸(closed convex)について定義します。

閉凸の定義

まず、エピグラフを定義します。関数 $f\colon \mathbb{R}^n \to \mathbb{R}$ のエピグラフ(epigraph)は次のように定義されます。

\mathrm{epi}\ f = \lbrace (x, t) \in \mathbb{R}^{n+1} \mathrel{\mid} x \in \mathrm{dom} ~ f, ~ f(x) \leq t \rbrace.

epi

連続性を議論する上で重要な性質が閉凸です。関数 $f$ が閉凸であることは、エピグラフが閉集合であることと同値です（教科書 Definition 3.1.2）。

以下は閉凸な例です。右の例では、$\mathrm{dom} ~ f$ は $\lbrace x \in \mathbb{R} \mathrel{\mid} x > 0 \rbrace$ と開区間ですが、閉凸関数です。

閉凸	閉凸
<img width=100% src=”https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/905155/122d0d6e-fbaa-ba51-3ba0-e9379121f381.png” alt=”closed_interval_closed_convex”>	<img width=100% src=”https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/905155/288bf339-5452-4b79-9402-4bd1badce3c6.png” alt=”closed_interval_inf.png”>

また、以下は閉凸でない例です。

閉凸でない	閉凸でない
<img width=100% src=”https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/905155/974d791b-2602-3bee-a2b1-680437cdea8a.png” alt=”open_interval”>	<img width=100% src=”https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/905155/265dac7d-f42c-aee4-1313-4a5d4ca3b223.png” alt=”closed_interval”>

定義と見比べて下さい。

連続でない例

凸関数に閉凸という条件を課さない場合、不連続な例が容易に構築出来ます。以下がその一例です。

closed_interval

この関数が凸関数であることは、凸関数の定義

f(\alpha x + (1 - \alpha) y) \leq \alpha f(x) + (1 - \alpha) f(y)

において、$x$ または $y$ が区間の左端である時のみ非自明ですが、確かに定義を満たしています。よって、閉凸でないなら不連続な凸関数は確かに存在します。

余談として、以下の例は不連続ですが、そもそも非凸です。不連続点が $\mathrm{dom} ~ f$ の境界になければならないのは、凸性の担保の為と言えます。

closed_interval_non_convex

以上で、閉凸関数ではないという、ある種自明な例外を議論しました。

ここで、閉凸関数であるという条件を課した時、不連続な例が存在するのか否かは、かなり非自明な問いです。それが実は存在する、ということを次節で示します。

閉凸関数である場合

閉凸関数である場合について考えます。この場合、Appendixで示すように、閉凸関数は下半連続であることは示されますが、連続であるとは限りません。具体的には、以下のことが成り立ちます。

2変数以上の場合、閉凸関数 $f$ は連続であるとは限らない。
1変数の場合、閉凸関数 $f$ は必ず連続である。

これらをそれぞれ証明します。

2変数以上の場合

2変数以上の場合、閉凸関数であっても連続であるとは限らないことを、反例で示します。簡単のため、2変数の場合のみ示しますが、多変数でも同様です。

$g\in \mathbb{R}$ と $\gamma \in \mathbb{R}$ に対して、

\begin{align*}
\phi(y,g,\gamma) &\mathrel{\vcenter{:}}= gy - \frac{\gamma}{2}y^2, \\
\psi(g,\gamma) &\mathrel{\vcenter{:}}= \sup_{y \in \mathbb{R}} \phi(y,g,\gamma)
\end{align*}

と定義します。$\psi(g,\gamma)$ の具体的な値は、$\frac{\partial}{\partial y}\phi = g-\gamma y$ であることから、以下のように求まります。

\psi(g,\gamma) = \begin{cases}
0 & \mathrm{if}~g=\gamma=0,\\
\frac{g^2}{2\gamma} & \mathrm{if}~\gamma > 0,\\
\infty & \text{otherwise}.
\end{cases}

$\psi$ が閉凸関数であることを証明します。凸性の証明は容易なので省略します。一般に、ある関数 $f$ が閉である、つまりエピグラフ $\lbrace (x,t) \mathrel{\mid} x \in \mathrm{dom} ~ f,~ f(x) \leq t \rbrace$ が閉集合であることは、任意の $c \in \mathbb{R}$ に対して、劣位集合(sublevel set) $\lbrace x \mathrel{\mid} x \in \mathrm{dom} ~ f,~f(x) \leq c \rbrace$ が閉集合であることと同値です。十分性は自明で、必要性も点列を用いた議論などで示せます。ここで、$\psi(g,\gamma) \leq c$ を満たす $(g,\gamma)$ は $c$ の値で場合分けすると、それぞれ閉集合であることが分かります。よって、任意の劣位集合が閉集合であり、$\psi$ は閉、特に閉凸関数であることが示されます。

ここで、$\psi$ を図示すると、冒頭でも示した以下のグラフになります。

psi

図では $\gamma$ の下限を少しずつ変えて示しています。このグラフは青点 $(g,\gamma)=(0,0)$ において $\psi(g,\gamma)=0$ ですが、$g \neq 0$ では $\gamma \to 0$ において $\psi(g,\gamma) \to \infty$ です。

ここで、赤の点列は、ある $\beta>0$ に対し、次を満たす点列です。

\begin{cases}
\displaystyle \lim_{k \to \infty} (g_k,\gamma_k)= (0,0), \\
\displaystyle \lim_{k \to \infty} \psi(g_k,\gamma_k)= \beta.
\end{cases}

$\gamma > 0$ において $\psi(\sqrt{\gamma}g,\gamma) = \frac{g^2}{2}$ であることを用いると作れます。これは、

\lim_{k \to \infty} \psi(g_k,\gamma_k) = \beta \neq 0 = \psi(0,0) = \psi(\lim_{k \to \infty} (g_k,\gamma_k))

と、$\psi$ が不連続であることを示しています。よって、$\psi$ は閉凸関数であっても不連続だと分かります。

この小節のまとめとして、以下のことを強調しておきます。

2変数以上の閉凸関数 $f$ は $\mathrm{dom} ~ f$ で連続であるとは限らない。

1変数の場合

1変数の場合、閉凸関数 $f$ は $\mathrm{dom} ~ f$ で連続であることを示します。上記の2変数の場合と、違いに注目して下さい。

具体的には、以下などが連続です。

closed_interval_closed_convex

系として開区間で定義された凸関数の連続性が従います。なお、この事実はかなり簡単に示せますが、そのような証明は別の記事¹などを参照して下さい。

open_interval

では、1変数の閉凸関数 $f$ が $\mathrm{dom} ~ f$ で連続であることを示します。

「1変数の閉凸関数はdom fで連続である」の証明

任意の $\overline{x} \in \mathrm{dom} ~ f \subseteq \mathbb{R}$ に対して、$f$ が $\overline{x}$ で連続だと示します。

点列 $\lbrace x_k \rbrace \subseteq \mathrm{dom} ~ f$ が $\overline{x}$ に収束するとします。Appendixに示すように、$f$ は閉凸ならば下半連続です。つまり、以下は一般に成立します。

\liminf_{k \to \infty} f(x_k) \geq f(\overline{x})

この時、

\limsup_{k \to \infty} f(x_k) \leq f(\overline{x})

であることを示せば、上極限と下極限が一致する為、その極限は $f(\overline{x})$ に一致し、$f$ が $\overline{x}$ で連続であることが示されます⁷。

重要な事として、1変数、つまり、数直線上の凸関数のdomainは、それが凸集合であるという性質上、一つの区間の形以外にありえません。また、$\mathrm{dom} ~ f \neq \emptyset$ であることを仮定しています。

つまり、$x_k \to \overline{x}$ より、$k$ が十分大きい任意の $x_k$ は、2つの相異なる点 $\overline{y}_1, \overline{y}_2\in \mathrm{dom} ~ f$ を用いて、

x_k \in \lbrace (1-\alpha_k) \overline{x} + \alpha_k \overline{y}_1, (1-\alpha_k) \overline{x} + \alpha_k \overline{y}_2 \rbrace \quad (\alpha_k \in [0, 1])

と表せます。$\overline{y}_1, \overline{y}_2$ のうちの一方は $\overline{x}$ 自身でも良いことに注意して下さい。開区間で定義された凸関数の連続性を示す場合との最たる違いは、$\overline{x}$ の開近傍が必ずしも $\mathrm{dom}~f$ に含まれない故に、このような近傍を取る操作において、$\overline{y}_1=\overline{x}$ などとせざるを得ない点にあります。

例えば以下の図では、赤点が $\lbrace x_k \rbrace$ を示しますが、十分 $\overline{x}$ に近い点は、そのように表せることが分かります。

why_interval_1

また、凸関数の定義より、

\begin{cases}
f(x_k) \leq (1-\alpha_k) f(\overline{x}) + \alpha_k f(\overline{y}_1) \\
f(x_k) \leq (1-\alpha_k) f(\overline{x}) + \alpha_k f(\overline{y}_2)
\end{cases}

のいずれかが成立します。ここで、$x_k \to \overline{x}$ より、$\alpha_k \to 0$ が導かれます。そして、上記不等式で $\alpha_k \to 0$ とすると、

\limsup_{k \to \infty} f(x_k) \leq f(\overline{x})

が導かれます。これは、$f$ が $\overline{x}$ で上半連続であることを示しています。よって、$f$ は $\overline{x}$ で連続であり、特に、$f$ は $\mathrm{dom} ~ f$ で連続です。

2変数関数の場合、何故証明が回らないのか

先の証明が何故2変数以上の場合に回らないのか、という点について考察します。

関数 $\psi$ は、閉凸関数だが連続ではない2変数関数でした。

psi3

そのdomainである $\mathrm{dom} ~ \psi =$ $(\mathbb{R} \times \lbrace \gamma > 0 \rbrace) \cup \lbrace (0,0) \rbrace$ および赤の点列を2次元平面上にプロットしたのが下図です。

why_interval_2

この点列では、先の証明で仮定した $\overline{y}_1,~\overline{y}_2$ に相当するものが無限個必要になってしまいます。これでは $x_k \to \overline{x}$ としても、$\alpha_k \to 0$ とは限らないため、先の証明が回りません。

ここに1変数の場合と2変数以上の場合の決定的な違いがあると考えています。

まとめ

本記事では、凸関数の連続性について、以下のことを示しました。

flowchart

理解の一助になれば幸いです。

以下、いくつかのAppendixを示します。

Appendix 凸関数は相対的内部で連続である

凸関数が全域で定義されている場合の節で、凸関数は相対的内部で連続であると述べました。ここでは、その証明を示します。

相対的内部の定義

まず、アファイン包 (affine hull) を定義します。集合 $S$ のアファイン包は、$S$ の要素のすべてのアファイン結合の集合、つまり、

\mathrm{aff} (S)=\left\lbrace\sum_{i=1}^k \alpha_i x_i \mathrel{\mid} k>0, ~ x_i\in S, ~ \alpha_i \in \mathbb{R}, ~ \sum_{i=1}^k \alpha_i=1 \right\rbrace.

です。例えば、3次元空間において、同一直線状にない3点の集合 $S$ のアファイン包は、その3点を通る平面全体になります。

$S$ の凸包も似た定義ですが、$\alpha_i$ が非負であることが追加の条件として課され、$S$ の凸包はその3点を頂点とする三角形になります。

次に、相対的内部 (relative interior) を定義します (Chapter A, Definition 2.1.1 ⁵)。相対的内部とは、内部の概念をアファイン包に対して定義したもの、つまり、

\mathrm{ri} (S) = \left\lbrace x \in S \mathrel{\mid} \exists r > 0 ~ \text{s.t.} ~ B(x, r) \cap \mathrm{aff} (S) \subseteq S \right\rbrace

として定義されます。ただし、$B(x,r)$ で、$x$ を中心とする半径 $r$ の閉球を表すとします。

特に、空間を $\mathrm{aff} (S)$ に限定して考えると、$\mathrm{ri} (S)$ は単に $S$ の内部となります。

「凸関数は相対的内部で連続である」の証明

では、凸関数が相対的内部で連続であることを示します。大まかには文献⁵の内容に従います。

まず、補題(Chapter B, Theorem 3.1.2 ⁵)として、$x_0$ を $\mathrm{ri} (\mathrm{dom} ~ f)$ の任意の点とし、十分小さい $\delta$ に対し、

m \leq f(x) \leq M \quad (\forall x \in B(x_0, 2\delta) \cap \mathrm{aff} (\mathrm{dom} ~ f))

を満たす定数 $m,M$ が存在することを示します。元証明はやや雑に議論しているので少し別の証明を与えます。$\mathrm{aff} (\mathrm{dom} ~ f)$ の次元を $k$ $(\leq n)$ としておきます。

まず、上界 $M$ の存在性を示します。簡潔さのため、$\mathrm{aff} (\mathrm{dom} ~ f)$ に議論を限定します (厳密には、各集合に ${} \cap \mathrm{aff} (\mathrm{dom} ~ f)$ を付ければよいです)。$x_0$ が相対的内点であることから、ある $\delta > 0$ が存在して、

B(x_0, 2 \sqrt{k} \delta) \subseteq \mathrm{dom} ~ f

と書けるので、$\mathrm{aff} (\mathrm{dom} ~ f)$ の適当な基底を用いて、$B(x_0, 2 \sqrt{k} \delta)$ の内部に超立方体 $C$ を入れることができます。特に、$C$ の内部にある $B(x_0, 2\delta)$ の任意の点は、$C$ の頂点の凸結合で表せます。また、$C$ の頂点集合を $\lbrace x_i \rbrace_{i=1}^{2^k}$ とします。

凸結合の係数 $\lbrace \alpha_i \rbrace_{i=1}^{2^k}$ $\left(\sum_{i=1}^{2^k} \alpha_i = 1, \ \alpha_i \geq 0\right)$ を用いて、任意の $x \in B(x_0, 2\delta)$ は、

f(x) = f\left( \sum_{i=1}^{2^k} \alpha_i x_i \right) \leq \sum_{i=1}^{2^k} \alpha_i f(x_i) \leq \max_{i} f(x_i)

と評価できます。よって、$M \mathrel{\vcenter{:}}= \max_{i} f(x_i)$ とすれば、$f(x) \leq M$ が成立します。

次に、下界 $m$ の存在性を示します (元証明を追ってもらえるとself-containedな議論になりますが、長くなりすぎるので支持超平面定理 (関連:分離超平面定理)は既知とします)。

$f$ のエピグラフは定義より凸集合で、$(x_0,f(x_0))$ を通る超平面が存在します。また、$x_0$ が相対的内点であることから、その超平面は、$\mathrm{aff}(S)$ に対して垂直ではありません(簡潔に言えば、劣微分の傾きが無限ではないということです)。よって、ある $s \in \mathbb{R}^n$ が存在して、

f(x) \geq f(x_0) + \langle s, x - x_0 \rangle. \quad (\forall x \in \mathrm{dom} ~ f)

特に、コーシーシュワルツの不等式より、

f(x) \geq f(x_0) - \lVert s \rVert \lVert x - x_0 \rVert \geq f(x_0) - 2\delta \lVert s \rVert \quad (\forall x \in B(x_0, 2\delta))

となるので $m \mathrel{\vcenter{:}}= f(x_0) - 2\delta \lVert s \rVert$ とすれば、$f(x) \geq m$ が成立します。

よって、確かに局所的な有界性が成立します。

続いて、一般の凸関数に対する次の主張を示します (Chapter B, Lemma 3.1.1 ⁵)。ある $x_0 \in \mathbb{R}^n$, $\delta>0$ および $m, M \in \mathbb{R}$ が存在して、

m \leq f(x) \leq M \quad (\forall x \in B(x_0, 2\delta))

を満たすとします。このとき、$f$ は $B(x_0, \delta)$ でリプシッツ連続である、つまり、ある $L > 0$ が存在して、

\lvert f(y) - f(y') \rvert \leq L \lVert y - y' \rVert \quad (\forall y, y' \in B(x_0, \delta))

となります。

証明をします。二つの相異なる $y, y’$ を $B(x_0, \delta)$ から取り、

y'' \mathrel{\vcenter{:}}= y' + \delta \frac{y' - y}{\lVert y' - y \rVert} \in B(x_0, 2\delta)

とおきます。すると、$y’’$ は、$y’$ を中心として $y$ と反対側に $\delta$ だけ離れた点であることが、定義より分かります。よって、$y’$ は $y$ と $y’’$ を結ぶ線分上、つまり、

y' = \frac{\lVert y' - y \rVert}{\delta + \lVert y' - y \rVert} y'' + \frac{\delta}{\delta + \lVert y' - y \rVert} y

となります。これに、凸関数の定義を適用すると、

f(y') \leq \frac{\lVert y' - y \rVert}{\delta + \lVert y' - y \rVert} f(y'') + \frac{\delta}{\delta + \lVert y' - y \rVert} f(y)

であるので、$m \leq f(x) \leq M$ を用いて、

\begin{align*}
f(y') - f(y) &\leq \frac{\lVert y' - y \rVert}{\delta + \lVert y' - y \rVert} (f(y'') - f(y))\\
&\leq \frac{M - m}{\delta} \lVert y' - y \rVert
\end{align*}

が成立します。$y$ と $y’$ を入れ替えても議論は同様に成立するので、先ほどの不等式の左辺に絶対値がつき、$f$ が $B(x_0, \delta)$ でリプシッツ連続であることが示されました。

最後に、$\mathrm{aff}(\mathrm{dom} ~ f)$ に議論を限定して、先ほどの補題を用いると、ある $L > 0$ が存在して、

\lvert f(y) - f(y') \rvert \leq L \lVert y - y' \rVert

となることが分かります。$y \to y’$ とすると、$\lvert f(y) - f(y’) \rvert \to 0$ となり、直ちに連続性を導きます。よって、凸関数は、$\mathrm{dom} ~ f$ の相対的内部で連続であるという主張が示されました。

Appendix 閉凸関数は下半連続である

続いて、閉凸関数は下半連続であるという主張を示します(教科書 Theorem 3.1.4.1)。閉凸関数は連続であるとは限らないですが、それを弱めた性質が下半連続性であり、それは成立するということです。

本節では、下半連続の定義を示し、その後に閉凸関数は下半連続であることを示します。

下半連続の定義

ある $\overline{x} \in \mathrm{dom} ~ f$ において $f$ が下半連続であることは、$\overline{x}$ に収束する任意の点列 $\lbrace x_k \rbrace \subseteq \mathrm{dom} ~ f$ に対し、

\liminf_{k \to \infty} f(x_k) \geq f(\overline{x})

が成立することと同値です。下図も参照して下さい。

lower_semi_continuous

(Wikipedia「半連続」より引用 / Mktyscn, Public domain, via Wikimedia Commons)

実際、$\psi$ の例でも $(\overline{g},\overline{\gamma})=(0,0)$ に収束する赤点で示した点列も、関数値 $\psi$ は $\beta>0$ に収束し、

\liminf_{k \to \infty} \psi(g_k,\gamma_k) = \beta \geq \psi(0,0) = 0

を満たしています。

psi3

（なお、本記事では省略しますが真凸関数に対し、閉凸関数であることの必要十分条件は、それが下半連続である⁸ことです）

「閉凸関数は下半連続である」の証明

$f$ が閉凸関数は下半連続であることを示します。

$\overline{x}$ に収束する任意の点列 $\lbrace x_k \rbrace \subseteq \mathrm{dom} ~ f$ に対し、点列 $\lbrace (x_k, f(x_k)) \rbrace \subseteq \mathrm{epi}\ f$ を考えます。

\overline{f} \mathrel{\vcenter{:}}= \liminf_{k \to \infty} f(x_k) \geq f(\overline{x})

が言えれば良いです。

$\overline{f}$ の値に基づく場合分けを行います。なお、$\overline{f}$ は常に拡大実数 $\mathbb{R} \cup \lbrace \pm\infty \rbrace$ 内に存在します。$\liminf$ になじみがない方は、文献⁷も参考にして下さい。

$\overline{f} \in \mathbb{R}$ の場合

$\liminf$ の性質⁷より、ある部分列 $\lbrace f(x_{k_j}) \rbrace$ が $\overline{f} \in \mathbb{R}$ に収束します。$\lbrace x_k \rbrace$ は $\overline{x}$ に収束する点列でした。なので、収束部分列の性質⁹として、$x_{k_j}$ も $\overline{x}$ に収束します。以上より、$\lbrace (x_{k_j}, f(x_{k_j})) \rbrace$ は $(\overline{x}, \overline{f})$ に収束します。

ここで、閉凸関数の定義より $\mathrm{epi}\ f$ は閉集合である為、その内で定義される任意の点列は、極限を持つならばそれは $\mathrm{epi}\ f$ 内に存在します。

よって、点列 $\lbrace (x_{k_j}, f(x_{k_j})) \rbrace$ は $(\overline{x}, \overline{f})$ という極限を持つため、それは $\mathrm{epi}\ f$ 内に存在します。つまり、

(\overline{x}, \overline{f}) \in \mathrm{epi}\ f
\iff
\overline{f} \geq f(\overline{x})

が成り立ち、主張は成立します。

$\overline{f} = -\infty$ の場合

条件より $\liminf_{k \to \infty} f(x_k) = -\infty$ です。$\overline{x} \in \mathrm{dom} ~ f$ なので $f(\overline{x})-1$ は固定された実数値です。よって、ある部分点列 $\lbrace x_{k_j} \rbrace$ が存在し、$f(x_{k_j}) \leq f(\overline{x})-1$ が成り立ちます。$\mathrm{epi}\ f$ の定義より $\lbrace (x_{k_j}, f(\overline{x})-1) \rbrace \subseteq \mathrm{epi}\ f$ で、収束先は $(\overline{x}, f(\overline{x})-1)$ です。

先程と同様に閉性よりこれは $(\overline{x}, f(\overline{x})-1) \in \mathrm{epi}\ f$ を導きます。

しかし、これは $f(\overline{x}) \leq f(\overline{x})-1 \iff 0 \leq -1$ を意味し矛盾です。なので、そもそもの仮定が誤りだと分かります。

$\overline{f} = \infty$ の場合

この場合、$\overline{f} = \infty \geq f(\overline{x})$ は自明です。

以上より、場合分けは尽くされ、

\overline{f} = \liminf_{k \to \infty} f(x_k) \geq f(\overline{x})

が成り立ち、$f$ は $\overline{x}$ で下半連続です。

謝辞

本記事は所属研究室の輪読準備の一環として書かれました。研究室の皆様に感謝致します。

数学の景色. 凸関数と凸不等式(イェンセンの不等式)についてかなり詳しく. 2023. ↩ ↩²
Nesterov, Yurii. Lectures on convex optimization. Vol. 137. Springer, 2018. ↩
Wikipedia. 真凸関数. 2022. ↩
MATHPEDIA. 位相空間論5:連続写像 (命題 5.18). 2021. ↩
Hiriart-Urruty, J.-B., & Lemaréchal, C. (2001). Fundamentals of convex analysis. Springer. https://doi.org/10.1007/978-3-642-56468-0 ↩ ↩² ↩³ ↩⁴ ↩⁵
Misha Lavrov. Is a convex function always continuous?. Stack Exchange, 2018. ↩
数学の景色. 上極限,下極限(limsup,liminf)の定義と例と性質2つ. 2022. ↩ ↩² ↩³
Wikipedia. 閉凸函数. 2016. ↩
野村数学研究所. 点列の収束と任意の部分列の収束. ↩

Hiroki Hamaguchi

概要

定義

凸関数

連続

凸関数が全域で定義されている場合

閉凸関数でない場合

閉凸の定義

連続でない例

閉凸関数である場合

2変数以上の場合

1変数の場合

「1変数の閉凸関数はdom fで連続である」の証明

2変数関数の場合、何故証明が回らないのか

まとめ

Appendix 凸関数は相対的内部で連続である

相対的内部の定義

「凸関数は相対的内部で連続である」の証明

Appendix 閉凸関数は下半連続である

下半連続の定義

「閉凸関数は下半連続である」の証明

謝辞