Нейроны сүлжээнүүд гүнээрээ ялгагдах нь

Ганц далд давхаргатай нейроны сүлжээ нь ямар ч функцийг дурын нарийвчлалтай ойролцоолох чадалтай гэдгийг Цыбенкогийн теоромоос бид мэднэ. Өөрөөр хэлбэл энэ өнцгөөс харвал олон давхаргатай (гүн) сүлжээ хэрэггүй мэт. Гэтэл бодит байдал дээр гүн сүлжээ нь гүехэн сүлжээтэй харьцуулшгүй сайн үр дүн өгдөг. Гүн сүлжээний онолд яг одоо тулгараад байгаа хамгийн чухал асуудал бол дараах асуудал юм.

  • Стохастик градиентийн аргыг гүн сүлжээтэй хослуулан ашиглахад яагаад ингэж сайн ажиллаад байна вэ? Тухайлбал, гүн сүлжээг сургаад, амьдрал дээр хэрэглэхэд сургалтын өгөгдөлд байхгүй шинэ өгөгдлүүд дээр ч сайн ажиллаад байдаг нь ямар учиртай юм бэ?

Үүний хариуг олоход тусалж мэдэх, арай хялбар асуудлыг сонирхоё.

  • Гүехэн сүлжээгээр ойролцоолоход хэцүү боловч, гүн сүлжээгээр амархан ойролцоологддог тийм функцүүд байдаг уу? Байдаг бол ийм чанартай функцүүд практикт хэр элбэг тохиолдох вэ? Энэ асуудлыг гүний ялгарлын (эсвэл гүний зэрэглэлийн) бодлого гэж ярьдаг.

Сүүлийн 2–3 жилд гүний ялгарлаар эрчимтэй судалгаа хийгдэж, чамлахааргүй үр дүнд хүрчээ. Бид энд энэ чиглэлийн бараг анхны үр дүн болох Матус Телгарскийн ажлыг танилцуулах гэж байна.

Телгарскийн үндсэн санаа бол олон давхаргатай сүлжээ нь хэлбэлзэл ихтэй функцийг ойролцоолохдоо сайн гэсэн ажиглалт юм. Тодруулбал, [0,1] завсар дээр

\mu(x)=1-|2x-1|

гэсэн функц тодорхойлоод, үүний өөрөө өөртэйгөө композицлосон зэргүүдийг авч үзье.

Энэ функцийг шулуутгагч \sigma(x)=\max\{0,x\} өдөөгч функцтэй, 2 давхаргатай нейроны сүлжээгээр яг илэрхийлж болно:

\mu(x)=\sigma\big(2\sigma(x)-4\sigma(x-\frac12)\big).

Тэгэхээр \mu^k(x) гэсэн композицийг 2k давхаргатай нейроны сүлжээгээр яг илэрхийлж болно гэсэн үг. Арай нарийвчлаад, d давхаргатай, давхарга бүр нь m-ээс хэтрэхгүй нейронтой нейроны сүлжээгээр яг илэрхийлэгдэх бүх функцийн олонлогийг \mathcal{N}(d,m) гэж тэмдэглэвэл,

\mu^k\in\mathcal{N}(2k,2).

Одоо энэ функцийг цөөхөн давхаргатай нейроны сүлжээгээр хэр сайн ойролцоолж болох вэ гэдгийг сонирхоё. Үүний тулд юуны түрүүнд [0,1] завсар дээр тодорхойлогдсон, n ширхэг шугаман хэсгээс бүтсэн, тасралтгүй функцүүдийн олонлогийг \mathcal{P}(n) гэж тэмдэглэе. Дорх зурагт \mathcal{P}(4) дотроос авсан нэг функцийг дүрслэв.

Жишээ нь, \sigma\in\mathcal{P}(2) ба \mu^k\in\mathcal{P}(2^k)\setminus\mathcal{P}(2^k-1) болох нь тодорхой. Цаашилбал

\mathcal{N}(d,m)\subset\mathcal{P}\big((2m)^d\big)

байна (Үүнийг индукцээр батлаарай). Тэгэхээр хэрэв сүлжээний өргөн m\leq2^{(k-1)/d-1} нөхцлийг хангадаг бол

\mathcal{N}(d,m)\subset\mathcal{P}\big(2^{k-1}\big).

Ямар нэг g\in\mathcal{P}\big(2^{k-1}\big) функцээр \mu^k функцийг ойролцоолж байна гэе.

Энд \mu^k функц нь

x_i=\displaystyle\frac{i}{2^k},\qquad i=0,\ldots,2^k

гэсэн 2^k+1 ширхэг «оройн цэгүүд» дээрээ 0 ба 1 утгуудыг ээлжлэн авна. Мөн g нь g(x)=\frac12 утгыг хамгийн ихдээ 2^{k-1} удаа дайрах ба, ингэснээр g(x)>\frac12 эсвэл g(x)<\frac12 байх хамгийн ихдээ 2^{k-1}+1 ширхэг интервал байгуулагдаж байгаа. Иймд эдгээр интервалуудын ядаж нэг нь \mu^k функцийн дараалсан 2 оройн цэгийг агуулна. Тэгэхээр

\displaystyle\max_{x\in[0,1]}|\mu^k(x)-g(x)|\geq\frac12

гэсэн үг. Үүнийг дүгнэвэл, \mu_k функц нь 2k гүнтэй, 2 өргөнтэй сүлжээгээр яг илэрхийлэгдэх боловч, d гүнтэй, m\leq2^{(k-1)/d-1} өргөнтэй сүлжээгээр илэрхийлэгдэх ямар ч функцийн хувьд максимум нормоор хэмжсэн алдаа нь дор хаяж \frac12 байна. Тухайлбал, сүлжээний гүнийг d=2 гэж авбал, алдааг багасгахын тулд нейроны тоог m\sim2^{k/2} болтол нь ихэсгэх хэрэгтэй болно. Үүнтэй харьцуулахад 2k гүнтэй, 2 өргөнтэй сүлжээ нь 4k орчим нейронтой.

Энд бид максимум нормоор алдааг хэмжсэн нь хэтэрхий ихийг шаардсан байж мэднэ. Үнэндээ ангиллын бодлогонд ганц хоёр өгөгдөл дээр алдаа гаргах нь байж болох зүйл. Тэгэхээр \mu^k функцийн оройнуудын хэдэн хувийг зөв багцаалдах нь вэ гэдгийг тооцсон алдааны хэмжүүрийг дараах маягаар тодорхойлъё.

R(g)=\displaystyle\frac1{2^k+1}\sum_{i=0}^{2^k}|\mu^k(x_i)-f(x_i)|.

Үүнд f(x)=\theta(g(x)-\frac12), ө.х. g(x)\geq\frac12 үед f(x)=1, бусад үед f(x)=0. Дээрх зурагт үүнийг дүрсэлж үзүүлсэн байгаа. Мөн дээр өгүүлсэн ёсоор, g\in\mathcal{P}\big(2^{k-1}\big) бол f функц нь хамгийн ихдээ 2^{k-1}+1 ширхэг интервал дээр 0 ба 1 утгуудыг ээлжлэн авна. Одоо \mu^k функцийн оройн цэгүүдээс 2 ба түүнээс олныг тус бүртээ агуулсан \ell ширхэг интервал байгаа гэж үзээд, эдгээр интервал доторх оройн цэгүүдийн тоог харгалзан p_1,\ldots,p_\ell гэж тэмдэглэвэл,

p_1+\ldots+p_\ell\geq2^k+1-(2^{k-1}+1)+1=2^{k-1}+1

байх нь илэрхий. Цаашилбал, j дэх ийм интервал дотор f функцийн утга буруу (ө.х. |\mu^k(x_i)-f(x_i)|=1) байх оройн цэгийн тоо нь p_j\geq3 үед

q_j\displaystyle\geq\frac{p_j-1}{2}\geq\frac{p_j}3

ба p_j=2 үед

q_j\displaystyle=\frac{p_j}{2}\geq\frac{p_j}3

тул

R(g)=\displaystyle\frac1{2^k+1}\sum_{j=1}^{\ell}q_j\geq\frac{p_1+\ldots+p_\ell}{3\cdot(2^k+1)}\geq\frac{2^{k-1}+1}{3\cdot(2^k+1)}>\frac16

болно. Ингээд дээрхээс хамаагүй хүчтэй үр дүн гарлаа: d гүнтэй, m\leq2^{(k-1)/d-1} өргөнтэй сүлжээгээр \mu^k функцийн оройнуудыг ангилахад хамгийн багадаа нийт оройн \frac16 нь буруу ангилагдана. Өөрөөр хэлбэл энэ жишээний хувьд гүн сүлжээний оронд гүехэн сүлжээ хэрэглэснээр шаардагдах нейроны тоо экспоненциал байдлаар өсч байна.

Advertisements
Posted in Анализ | Tagged , , , | Сэтгэгдэл бичих

Хиймэл нейроны сүлжээ нь универсаль ойролцоологч мөн

Өмнөх постоор бид хиймэл нейроны сүлжээ гэж юу болох талаар анхны ойлголттой болсон. Одоо энд хэрэг болох хэсгийг нь товч дурдвал, M ширхэг давхаргаас тогтсон хиймэл нейроны сүлжээг

z^{(k)}=\sigma\big(W^{(k)}z^{(k-1)}+b^{(k)}\big),\qquad k=1,\ldots,M

гэсэн рекуррент харьцаагаар өгч болно. Үүнд

  • z^{(0)}=x\in\mathbb{R}^n нь оролтын хувьсагч (n=N_0)
  • z^{(k)}\in\mathbb{R}^{N_k} нь k дугаар давхаргын гаралт
  • y=z^{(M)}\in\mathbb{R}^{m} нь сүлжээний гаралт (m=N_M)
  • N_k нь k дугаар давхаргын өргөн буюу уг давхарга дахь нейроны тоо
  • M нь сүлжээний гүн буюу нийт давхаргын тоо
  • W^{(k)}=[w^{(k)}_{ij}]\in\mathbb{R}^{N_{k-1}\times N_k} нь k дугаар давхаргын жингийн матриц гэгдэх матриц
  • b^{(k)}=[b^{(k)}_j]\in\mathbb{R}^{N_k} нь уг давхаргын хазайлтын вектор гэгдэх вектор
  • \sigma(t)=1/(1+e^{-t}) нь нейроны өдөөгч функц гэгдэх функц бөгөөд, вектор дээр үйлчлэхдээ байгуулагч тус бүрээр нь үйлчлэнэ гэж үзнэ.

Дээрх харьцааг байгуулагчаар нь задалж бичвэл

z^{(k)}_j=\sigma\big(w^{(k)}_{j1}z^{(k-1)}_1+\ldots+w^{(k)}_{jN_{k-1}}z^{(k-1)}_{N_{k-1}}+b^{(k)}_j\big),\qquad j=1,\ldots,N_k

болох ба, z^{(k-1)}\mapsto z^{(k)}_j гэсэн функцийг k дугаар давхаргын j дэх нейроны үйлчлэл гэж ойлгоно. Хамгийн сүүлийн (ө.х. M дэх) давхаргаас бусад давхаргуудыг далд давхаргууд гэж ярьдаг. Жишээлбэл, 1 далд (нийт 2) давхаргатай, 1 гаралттай (m=1) нейроны сүлжээ нь

f(x)=\displaystyle\sigma\Big(\sum_{j=1}^Na_j\sigma(w_j\cdot x+b_j)+c\Big)\qquad\qquad(*)

хэлбэрийн функцүүдийг төлөөлнө. Энд x\in\mathbb{R}^n нь оролтын хувьсагч, a_j,b_j,c\in\mathbb{R} ба w_j\in\mathbb{R}^n нь сүлжээний жин болон хазайлтын параметрүүд, N нь далд давхаргын өргөн. Дорх зурагт n=3 ба N=4 тохиолдлыг дүрслэв.

Ийм сүлжээний үндсэн зориулалт нь, сүлжээний (жин, хазайлт зэрэг) параметрүүдийг тохируулах замаар, өгөгдсөн F(x) функцийг ойролцоолох явдал болно:

f(x)\approx F(x).

Цаадах F(x) функц нь төгсгөлөг тооны цэгүүд дээрх утгуудаараа өгөгдөнө. Өөрөөр хэлбэл,

y^{(i)}=F(x^{(i)}) ,\qquad i=1,\ldots,K

байхаар

x^{(1)},\ldots,x^{(K)}\in\mathbb{R}^n,\qquad y^{(1)},\ldots,y^{(K)}\in\mathbb{R}

гэсэн өгөгдөл мэдэгдэж байгаа гэж үзнэ. Сүлжээний параметрүүдийг тохируулах процессыг сургалт гэж ярьдаг. Тодруулбал, жингийн матрицууд болон хазайлтын векторуудыг сүлжээний (дотоод) параметрүүд гэх ба эдгээр нь сүлжээг сургах үед автоматаар тохируулагдах ёстой. Харин сүлжээн дэх давхаргын тоо (буюу сүлжээний гүн) болон далд давхаргуудын өргөнийг гаднаас нь хүн бэхэлж өгөх тул эдгээрийг гадаад параметрүүд (эсвэл гиперпараметрууд) гэдэг.

Тэгэхээр F(x) нь 0-ээс 1-ийн хооронд утга авдаг дурын функц бол, f(x) функцийг F(x) функцтэй хичнээн л бол хичнээн ойрхон байхаар сүлжээний гадаад болон дотоод параметрүүдийг тохируулж болох уу гэсэн тулгуур асуудал зүй ёсоор тавигдаж байна. Үүнийг товчоор «Хиймэл нейроны сүлжээ нь универсаль ойролцоологч мөн үү?» гэж томъёолж болно. Энэ асуултын хариу эерэг болохоор барахгүй ганц л далд давхарга хангалттай гэдгийг 1989 онд Жорж Цыбенко баталсан. Түүний теоремын үндсэн хэлбэрийг толилуулъя.

Цыбенкогийн теорем. Нэгж куб Q=[0,1]^n дээр тодорхойлогдсон, тасралтгүй функц G\in C(Q) ба дурын тоо \varepsilon>0 өгөгдсөн болог. Тэгвэл x\in Q болгоны хувьд

|g(x)-G(x)|<\varepsilon

нөхцлийг хангадаг,

g(x)=\displaystyle\sum_{j=1}^Na_j\sigma(w_j\cdot x+b_j)\qquad\qquad(**)

хэлбэрийн функц олдоно. Өөрөөр хэлбэл ийм хэлбэрийн функцүүд C(Q) огторгуй дотор шигүү дэд олонлог үүсгэнэ.

Үргэлжлүүлэн унших

Posted in Анализ, теорем | Tagged , , , , | Сэтгэгдэл бичих

Хиймэл нейроны сүлжээ гэж юу вэ?

Энэ постны зорилго нь feedforward neural network гэж нэрлэгддэг хамгийн энгийн хиймэл нейроны сүлжээний талаар анхны ойлголт өгөх явдал болно. Энэ төрлийн сүлжээ нь дангаараа олон төрлийн бодлого бодох чадвартайгаас гадна (CNN, RNN гэх мэт) илүү хүчирхэг сүлжээнүүдийн эд эс, хөрс суурь нь болж өгдөг.

Юуны түрүүнд, нейроны сүлжээ маань ер нь ямар бодлого шийдэх гээд байгаа билээ гэдгийг маш энгийн нэг жишээгээр төлөөлүүлэн авч үзье. Ямар температурыг халуун, ямрыг хүйтэн гэх вэ гэсэн санал асуулга хүмүүсийн дунд явуулахад, дараах үр дүн гарсан гэе.

Үүнд хүйтэнг 0, халууныг 1 гэсэн утгаар төлөөлүүлсэн. Одоо энэ өгөгдөл дээр тулгуурлаад, цаашдаа дурын температурын утга x өгөгдсөн үед үүнийг халуун гэх үү хүйтэн гэх үү гэдгийг шийдэж чаддаг алгоритм байгуулах асуудлыг сонирхоё. Энэ бодлого нь x\in\mathbb{R} гэсэн тоо «халуун», «хүйтэн» гэсэн хоёр ангийн алинд нь орохыг шийдэх ангиллын бодлого бөгөөд цөөн тооны өгөгдөл дээр тулгуурлан ерөнхий зүй тогтлыг нь нээн илрүүлэхийг зорьж байгаагаараа статистикийн хувьд регресс, компьютерийн ухааны хувьд машин сургалтын салбарт хамаарагдах асуудал юм. Мөн түүнчлэн, өгөгдсөн температурын халуун хүйтнийг шийддэг

x\mapsto F(x)

гэсэн бидний мэдэхгүй нэг функц «цаана нь» байгаа гэж үзвэл, дээрх бодлого нь F(x_i)=y_i (эсвэл илүү ерөнхийгөөр F(x_i)\approx y_i) байх \{(x_i,y_i):i=1,\ldots,N\} гэсэн N ширхэг өгөгдсөн хос дээр тулгуурлаад,

x\mapsto f(x)

гэсэн функцийг,

f(x)\approx F(x)

байхаар байгуулах асуудал болох ба үүнийг математик анализын үүднээс ойролцооллын онолд хамааруулан судалж болно.

Функцийг ойролцоолох хамгийн хялбар арга бол шугаман функцээр ойролцоолох явдал юм. Өөрөөр хэлбэл

f(x)=f_{a,b}(x)=ax+b

гэсэн хоёр параметртэй функцээр F(x) функцээ ойролцоолно. Үүнийг статистикт шугаман регресс гэж нэрлэдэг. Одоо өгөгдөл дээрээ тулгуурлан a,b\in\mathbb{R} параметрүүдээ сонгохын тулд ямар нэг алдааны хэмжүүр бидэнд хэрэгтэй. Хамгийн өргөн хэрэглэгддэг ийм хэмжүүр нь квадратлаг алдааны функц

\displaystyle E(a,b)=\frac12\sum_{i=1}^N(ax_i+b-y_i)^2

юм. Хэрвээ бүх i-ийн хувьд ax_i+b=y_i байдаг (ө.х. шугаман ойролцоолол нь өгөгдлүүдтэйгээ яв цав таардаг) бол E(a,b)=0 байх нь ойлгомжтой. Бодит байдал дээр бол өгөгдлүүд маань яг нэг шулуун дээр оршино гэж бараг байхгүй тул E(a,b) функцийг хамгийн бага болгодог тийм a,b\in\mathbb{R} параметрүүдийн утгыг олох нь бидний дараагийн зорилго болно. Үүнийг хамгийн бага квадратын арга гэдэг. Дорх зурагт E(a,b) функц параметрүүдээсээ хэрхэн хамаарахыг дүрсэлж үзүүлэв.

Эндээс a\approx0.05,\,b\approx0 үед E(a,b) функц минимум утгаа авах нь харагдаж байна. Үүнийг яг бодохын тулд E(a,b) функцээс a ба b хувьсагчдаар авсан тухайн уламжлалуудыг тэгтэй тэнцүүлэхэд хангалттай:

\displaystyle\frac{\partial E}{\partial a}=\sum_{i=1}^N(ax_i+b-y_i)x_i=a\sum_{i=1}^Nx_i^2+b\sum_{i=1}^Nx_i-\sum_{i=1}^Nx_iy_i=0,

\displaystyle\frac{\partial E}{\partial b}=\sum_{i=1}^N(ax_i+b-y_i)=a\sum_{i=1}^Nx_i+Nb-\sum_{i=1}^Ny_i=0.

Эдгээр нь a,b-ийн хувьд шугаман тэгшитгэлүүдийн систем тул бодоход маш амархан (x_i,y_i тоонууд өгөгдсөн байгаа гэдгийг сана). Ингээд хариу нь

a\approx0.0256,\,b\approx0.0102

гарах ба, f(x)=ax+b функцийн графикийг өгөгдлүүдтэйгээ хамт зурвал

болно. Тэгэхээр энэ загварын хувьд халуун хүйтний зааг 20ºC орчимд байна.

Дээрхийг дүгнэж хэлэхэд, хичнээн ч хэмжээний өгөгдөл \{(x_i,y_i):i=1,\ldots,N\} өгөгдсөн байсан гэсэн a,b параметрүүдийг тооцоолох процесс нь бүрэн автоматжисан, компьютерийн хувьд маш хялбар процесс байна. Машин сургалтын нэр томъёонд \{(x_i,y_i):i=1,\ldots,N\} өгөгдлийг сургалтын өгөгдөл (эсвэл сургалтын багц),  a,b параметрүүдийг тооцоолох процессыг өөрийг нь сургалт гэж нэрлэдэг. Ерөнхий тохиолдолд,

  • Шугаман функцүүдийн оронд шугаман бус, илүү нарийн нийлмэл функцүүдээр ойролцоолох гэж оролдож болно. Тэгэхээр дотоод параметрийн тоо нь асар их байна.
  • «Цаадах» функц нь маш олон оролттой, бас олон гаралттай F(x_1,\ldots,x_n)\in\mathbb{R}^m маягийн функц байж болно. Жишээ нь, x_1,\ldots,x_n хувьсагчид нь гараар бичсэн үсгийг 16×16 хэмжээтэй хар цагаан зураг болгоод, пикселүүд нь хэр цайвар вэ гэдгийг хэмжсэн утгууд байг. Тэгвэл n=256 болох ба F(x_1,\ldots,x_n) функц нь жишээ нь, m=35 ширхэг гаралттай, гаралт бүр нь тухайн зураг цагаан толгойн тодорхой нэг үсэг байх магадлалд харгалздаг байж болно.
  • Түүнчлэн сургалтын зорилго маань халуун, хүйтэн гэсэн 2-хон ангид задлах биш, гараар бичсэн үсгийг цагаан толгойн ямар үсэг вэ гэдгийг таних явдал байж болно.
  • Алдааны хэмжүүр нь квадратлаг биш функц байж болно.

Эдгээр сонголтуудыг хийсний дараа, ойролцоологч функцийнхээ дотоод параметрүүдийг яаж тооцоолох вэ (ө.х. сургалтаа яаж явуулах вэ) гэдэг нь машин сургалтын гол асуудалд хувирна. Энэ нь үнэндээ алдааны хэмжүүрийг дотоод параметрүүдээс хамааруулан минимумчлэх бодлого юм. Бодит байдал дээр алдааны хэмжүүр нь дотоод параметрүүдээс хамаарсан гүдгэр биш функц байдаг бөгөөд машин сургалтын бодлого маань гүдгэр биш оптималчлал гэгддэг маш том бөгөөд хэцүү салбарт хамаарагдана. Практикт энэ зорилгоор ихэвчлэн градиентийн дагуу уруудах төрлийн алгоритмуудыг ашигладаг. Үргэлжлүүлэн унших

Posted in Статистик, алгоритм | Tagged , , , , | Сэтгэгдэл бичих

Сансар дахь биетийн температур

Дэлхийн агаар мандлын гадна талд байгаа хиймэл дагуулын яг нар луу харсан хэсгийн 1м² талбай бүрт 1 секундэд тусах нарны туяаны энерги S ≈ 1361 Жоуль болно. Нарнаас холдож, ойртох үед энэ туяаны энерги зайн квадратад урвуу хамааралтай (зайг одон орны нэгжээр хэмжвэл S/d² байдлаар) өөрчлөгддөг. Хиймэл дагуулын температур анх маш бага байсан гэвэл, нарны туяаны нөлөөнд халж эхэлнэ. Температур нэмэгдсэнээр хиймэл дагуул дулааны цацраг ихээр цацруулж эхлэх бөгөөд нарны туяанаас авах энерги, дулааны цацрагаар алдах энерги хоёр тэнцэх яг тэр температурт хүрээд температур нь тогтворжих юм.

Хиймэл дагуулыг T температуртай абсолют хар бие гэж үзвэл уг биетийн гадаргуугийн 1м² талбай бүр 1 секундэд хэдэн Жоуль энерги цацруулах вэ гэдэг нь Стефан-Больцманы хууль гэгдэх

E = σ·T

томъёогоор өгөгдөнө. Үүнд T нь Кельвинээр хэмжигдэх бөгөөд σ ≈ 0.0000000567 нь Стефан-Больцманы тогтмол гэгддэг тогтмол.

Хэрэв хиймэл дагуулыг бөмбөрцөг хэлбэртэй гэвэл нарны туяанд өртөх гадаргуугийн талбай нь бүх гадаргуугийн талбайн 25% болно. Одоо

¼·S/d² = σ·T

тэгшитгэлд d-ийн оронд нарны аймгийн гаригуудаас нар хүртэлх зайг орлуулан, температурыг олбол гаригуудын ойролцоох хиймэл дагуулуудын тогтвортой температур ямар байхыг багцаалдаж болно:

Буд 172°C
Сугар 54°C
Дэлхий 5°C
Ангараг –48°C
Бархасбадь –151°C
Санчир –183°C
Далай ван –210°C
Тэнгэрийн ван –222°C

Яг үнэндээ гаригуудын өөрсдийнх нь температурыг ч гэсэн ингэж багцаалдаж болно. Бодит байдал дээр ямар ч биет нарнаас ирсэн бүх цацрагийг шингээхгүй, зарим хэсгийг нь шууд ойлгоно. Үүнийг нь бид альбедо гэж нэрлэгдэх коэффициентээр хэмждэг. Альбедог A үсгээр тэмдэглэвэл, дээрх томъёо

¼·(1 – AS/d² = σ·T

болж өөрчлөгдөнө. Жишээлбэл, Сугар гаригийн хувьд A ≈ 0.7, дэлхийн хувьд A ≈ 0.3 орчим байдаг. Үүнээс гадна, гаригууд абсолют хар биеийг бодвол бага дулааны цацаргалт хийх ба үүнийг E гэсэн коэффициентээр загварчлан

¼·(1 – AS/d² = E·σ·T

томъёо бичиж болно. Гаригийн гадаргаас гарч байгаа цацаргалтыг гаргалгүй хашдаг нэг гол хүчин зүйл нь агаар мандал дахь хүлэмжийн хийнүүд болно. Дэлхийн хувьд E ≈ 0.612 байдаг. Одоо альбедо болон цацаргалтын E коэффициентийг нь дэлхийнхтэй адилхан гэж аваад бүх гаригууд дээр тооцоо хийвэл дараах үр дүн гарч байна.

гариг тооцоолсон температур бодит дундаж температур
Буд 188°C 179°C
Сугар 65°C 453°C
Дэлхий 15°C 12°C
Ангараг –40°C –43°C
Бархасбадь –147°C –153°C
Санчир –180°C –185°C
Далай ван –207°C –214°C
Тэнгэрийн ван –221°C –225°C

Энэ үр дүн нь E=1, A=0 гэж авсан дээрх тооцооноос нэг их ялгарахгүй байгаа.
Мөн бодит өгөгдөлтэй жишвэл Сугараас бусад нь яг таарчээ гэхэд болохоор байна.
Үүнийг графикаар дүрсэлж үзье.

Улаан чагтнууд нь гаригуудын бодит (дундаж) температур. Цэнхэр график нь дээрх аргаар тооцсон A=0, E=1 параметртэй муруй. Улбар шар график нь альбедог A=0.75 гэж аваад, Сугар гаригийн температурыг 453°C байлгахын тулд цацаргалтын E коэффициент нь хэд байх ёстой вэ гээд хөөж гаргасан тооцоо. Эндээс гол сурах юм нь Сугар гариг дээр хүлэмжийн эффект асар их байдаг гэсэн үг. Жишээлбэл, дэлхийн агаар мандал Сугарынхтай адилхан байсан бол дундаж температур нь 350°C орчим байх байсныг харж болно.

Жич: Энэ графикийг зурсан Python програмыг сонирхвол хараарай.

Posted in Одон орон, Физик, Хялбар тооцоо | Tagged , , , | Сэтгэгдэл бичих

Сильвестрийн процедур

Өмнөх постоор танилцсан шинэ ойлголтуудынхаа хүрээнд Чебышёвын онолыг «тайлбарлах» гэж оролдъё. Чебышёвын онолын гол асуудал нь

\displaystyle \sum_{k\leq x}\psi(x/k)=T(x)\equiv\sum_{n\leq x}\ln n=x\ln x-x+O(\ln x)

харьцааг ойролцоогоор ч болтугай урвуулж, \psi(x) функцийн талаар мэдээлэл гаргаж авах явдал байгаа. Үүнийг урвуулах нэг арга бол, \Lambda=\mu*\ln адилтгалаас эхлээд, өмнөх постны хуйлаасыг нийлбэрчлэх теоремыг ашиглан

\displaystyle \psi(x)=\sum_{n\leq x}\Lambda(n)=\sum_{n\leq x}(\mu*\ln)(n)=\sum_{k\leq x}\mu(k)T(x/k)

гэж гаргах явдал юм. Энэ томъёо \psi(x) функцийг T(x) функцээр яг илэрхийлэх боловч, өмнө өгүүлснээр Мёбиусын функцийн талаарх мэдлэгийг шаардах тул,  \mathit1*\Lambda=\ln адилтгалыг \nu\approx\mu гэсэн функцтэй хуйлбал

\nu*\mathit1*\Lambda=\nu*\ln

болно. Үүнийг нийлбэрчилбэл

\displaystyle V(x)=\sum_{n\leq x}(\nu*\mathit1*\Lambda)(n)=\sum_{n\leq x}(\nu*\ln)(n)=\sum_{k\leq x}\nu(k)T(x/k)\qquad(*)

болох ба зүүн гар талыг нь

\displaystyle V(x)=\sum_{n\leq x}(\nu*\mathit1*\Lambda)(n)=\sum_{k\leq x}(\nu*\mathit1)(k)\psi(x/k)=\sum_{k\leq x}E(x/k)\Lambda(k)\qquad(**)

гэж хоёр янзаар нийлбэрчлэх боломжтой. Энд

\displaystyle E(x)=\sum_{n\leq x}(\nu*\mathit1)(n)=\sum_{k\leq x}\Big[\frac{x}{k}\Big]\nu(k).

Жишээлбэл, Чебышёвын

\displaystyle V(x)=T(x)-T(x/2)-T(x/3)-T(x/5)+T(x/30)

 сонголтыг (*) томъёотой харьцуулбал

\nu_*=\delta_1-\delta_2-\delta_3-\delta_5+\delta_{30}

функцэд харгалзах нь харагдана. Энд \delta_m(n)=\delta_{m,n} буюу, \delta_m(n) нь n=m үед л \delta_m(n)=1, бусад үед \delta_m(n)=0 гэж тодорхойлогдсон функц.

Одоо (*)-(**) томъоноос \psi(x) функцийн үнэлгээг гаргаж авч болдог байхын тулд \nu функц ямар ямар шинж чанартай байх хэрэгтэй вэ? гэсэн ауултанд хариулахыг оролдъё.

  • Юуны түрүүнд, T(x)=x\ln x+O(x) гэдгийг санаад, (*) томъёоны зүүн гар тал \approx\psi(x) гэж бодвол, уг томъёоны баруун гар тал O(x) хэмжээтэй байхын тулд \sum_n\nu(n)/n=0 байх хэрэгтэй. Чебышёвын схем энэ шаардлагыг хангана.
  • Хоёрдугаарт, (*) томъёоны зүүн гар тал буюу (**) томъёоны баруун гар тал \approx\psi(x) байхын тулд ядаж x бага үед E(x)\approx1 байх хэрэгтэй. Чебышёвын схемын хувьд 1\leq x<6 мужид E(x)=1 байгаа.
  • Эцэст нь, хялбарыг бодож \nu(n)\neq0 байх n-ийн тоог төгсгөлөг гэж шаардаж болно.

Ерөнхий тохиолдолд

\displaystyle \sum_n\frac{\nu(n)}n=0\qquad(\dagger)

гэж шаардвал, Стирлингийн T(x)=x\ln x-x+O(\ln x) ойролцооллыг ашиглан (*) томъёоноос

\displaystyle V(x)=\sum_{n\leq x}\nu(n)T(x/n)=\underbrace{-\Big(\sum_{n}\frac{\nu(n)\ln n}{n}\Big)}_{A(\nu)}x+O(\ln x)=A(\nu)x+O(\ln x)

гэж гарна. Жишээ нь, Чебышёвын схемийн хувьд

\displaystyle A_*=A(\nu_*)=\frac{\ln2}2+\frac{\ln3}3+\frac{\ln5}5-\frac{\ln30}{30}=0.92129\ldots

байдгийг бид мэднэ. Цааш нь, x\geq1 үед

E(x)\leq1

гэж үзвэл (**) томъёоноос \psi(x)-ийн доод зааг

\displaystyle V(x)=\sum_{k\leq x}E(x/k)\Lambda(k)\leq\sum_{k\leq x}\Lambda(k)=\psi(x)

гээд шууд гарч ирнэ. Нөгөө талаас, 1\leq x<N үед

E(x)\geq1

гэж үзвэл

\displaystyle V(x)=\sum_{k\leq x}E(x/k)\Lambda(k)\geq\sum_{x/N<k\leq x}\Lambda(k)=\psi(x)-\psi(x/N)

болох ба,

\displaystyle \psi(x)-\psi(x/N)\leq V(x)=A(\nu)x+O(\ln x),\\\psi(x/N)-\psi(x/N^2)\leq V(x/N)=A(\nu)x/N+O(\ln x),\\\psi(x/N^2)-\psi(x/N^3)\leq V(x/N^2)=A(\nu)x/N^2+O(\ln x),\\\ldots

гэсэн [\frac{\ln x}{\ln N}] ширхэг мөрийг хооронд нь нэмснээр

\displaystyle \psi(x)\leq(1+N^{-1}+N^{-2}+\ldots)A(\nu)x+O(\ln^2\!x)=\frac{N}{N-1}A(\nu)x+O(\ln^2\!x)

гэсэн зааг олдоно. Дээрх хоёр заагийг нэгтгэж бичвэл

\displaystyle A(\nu)x+O(\ln x)\leq\psi(x)\leq\frac{N}{N-1}A(\nu)x+O(\ln^2\!x).\qquad(\dagger\dagger)

Чебышёвын схемийн хувьд E(x) нь 30 үетэй, үргэлж 0\leq E(x)\leq1 байдаг. Түүнчлэн x<6 үед E(x)=1 тул N=6 гэсэн үг. Эндээс бидний танил

\displaystyle A_*x+O(\ln x)\leq\psi(x)\leq\frac65A_*x+O(\ln^2\!x)

зааг шууд мөрдөнө. Дараах зурагт Чебышёвын схемд харгалзах E(x) функцийг дүрслэв.

(**) томъёоноос

\displaystyle V(x)=\sum_{n\leq x}E(x/n)\Lambda(n)=\sum_{n\leq x}\big(E(n)-E(n-1)\big)\psi(x/n)

тул V(x) функцийг \psi(x/n) функцүүдээр задалсан задаргааг энэ график дээрээс шууд «уншиж» болно. Жишээлбэл, Чебышёвын схем дээр

\displaystyle V(x)=\psi(x)-\psi(x/6)+\psi(x/7)-\psi(x/10)+\psi(x/11)-\psi(x/12)+\ldots.

Энэ зургийг харж байгаад, \psi(x) функцийн үл буурах чанарыг ашиглаад

\displaystyle V(x)=\psi(x)\underbrace{-\psi(x/6)+\psi(x/7)}_{\leq0}\underbrace{-\psi(x/10)+\psi(x/11)}_{\leq0}\underbrace{-\psi(x/12)+\ldots}_{\leq0}\\{}\qquad\leq\psi(x)

\displaystyle V(x)=\psi(x)-\psi(x/6)+\underbrace{\psi(x/7)-\psi(x/10)}_{\geq0}+\underbrace{\psi(x/11)-\psi(x/12)}_{\geq0}+\ldots\\{}\qquad\geq\psi(x)-\psi(x/6)

тэнцэл бишүүдийг гаргаж авахад амархан. Үүнийг дор зургаар дүрсэлж үзүүлэв. Үл буурах чанараар хооронд нь хослуулан устгасан гишүүдийг тасархай улаан шугамаар холбосон. 

Чебышёвын ажлаас 30-40 жилийн дараа Жеймс Сильвестр ба түүний хамтрагч Жеймс Хаммонд нар

\nu_1=\delta_1-2\delta_2,\\\nu_2=\delta_1-\delta_2-2\delta_3+\delta_6,\\\nu_3=\delta_1-\delta_2-\delta_3-\delta_4+\delta_{12}

гэсэн 3 шинэ схемийг олсон. Сильвестрийн өөрийнх нь тэмдэглэгээгээр эдгээрийг

\nu_1=[1;2,2],\qquad\nu_2=[1,6;2,3,3],\qquad\nu_3=[1,12;2,3,4]

гэж бичнэ. Энэ тэмдэглэгээгээр Чебышёвын схем

\nu_*=[1,30;2,3,5]

болно гэсэн үг. Дээрх шинэ схемүүд бүгд {}(\dagger) нөхцлийг хангах ба үргэлж 0\leq E(x)\leq1 байдаг. Түүнчлэн

  • \nu_1 схемийн хувьд E(x)-ийн үе нь 2 ба x<2 үед E(x)=1.
  • \nu_2 схемийн хувьд E(x)-ийн үе нь 6 ба x<3 үед E(x)=1.
  • \nu_3 схемийн хувьд E(x)-ийн үе нь 12 ба x<4 үед E(x)=1.

Дээрх 3 схемийн E(x) функцүүдийг дараах зурагт дүрслэв.

Ингээд (\dagger\dagger) томъёонд орсон A(\nu) ба B(\nu)=\frac{N}{N-1}A(\nu) тогтмолуудыг дээрх схем тус бүр дээр бодвол

A(\nu_1)=0.6931\ldots,\qquad B(\nu_1)=2A(\nu_1)=1.3862\ldots,\\A(\nu_2)=0.7803\ldots,\qquad B(\nu_2)=\frac32A(\nu_2)=1.1705\ldots,\\A(\nu_3)=0.8522\ldots,\qquad B(\nu_3)=\frac43A(\nu_3)=1.1363\ldots

гарна. Эдгээр хосуудын аль нь ч Чебышёвын

A(\nu_*)=0.9212\ldots,\qquad B(\nu_*)=\frac65A(\nu_*)=1.1055\ldots

хосыг давж гарахгүй боловч \psi(x)=O(x) ба \frac1{\psi(x)}=O(x) заагуудыг нэг их ажил удалгүйгээр өгөх тул зарим үед илүү сонирхол татаж мэднэ. Жишээлбэл, Бертраны постулатыг батлахад \nu_2 схем байхад л хангалттай. Үргэлжлүүлэн унших

Posted in Тооны онол | Tagged , , | Сэтгэгдэл бичих

Арифметик функцүүд

Эерэг бүхэл тоонууд дээр тодорхойлогдсон, бодит (эсвэл комплекс) утга авдаг функцийг тооны онолд арифметик функц гэдэг. Арифметик функцүүдийн жишээ гэвэл

f(n)=n^2+3,\qquad g(k)=k!,\qquad h(n)=(-1)^n,

гэх мэтийг дурдаж болно. Тооны онолоос бусад салбарт бол эдгээрийг зүгээр л тоон дарааллууд гэх байсан. Мэдээж захын нэг арифметик функцийг судлаад байх нь тийм ч сонирхолтой биш. Тооны онолд зарим арифметик функц онцгой байр суурь эзэлдэг. Жишээлбэл, бид өмнө нь

\displaystyle\pi(n)=\sum_{p\leq n}1,\qquad\theta(n)=\sum_{p\leq n}\ln p,\qquad\psi(n)=\sum_{p^k\leq n}\ln p

болон n=p^k үед \Lambda(n)=\ln p байдаг, n\neq p^k үед \Lambda(n)=0 байдаг Мангольдтын

\displaystyle\Lambda(n)=\begin{cases}\ln p&\textrm{if}\quad n=p^k\\0&\textrm{if}\quad n\neq p^k\end{cases}

функцтэй тааралдсан.

Хэрэв бид хэдэн арифметик функц жагсааж бичих төдийхнөөр орхих байсан бол тэдгээрт ийм сүртэй нэр өгөх хэрэггүй байх байсан. Арифметик функцүүдийг жинхэнэ «амилуулахын» тулд тооны онолын үүднээс сонирхолтой үйлдлүүдийг тэдгээр дээр тодорхойлох хэрэгтэй. Ийм үйлдлүүдийг анх системтэйгээр судалсан хүн нь Николай Васильевич Бугаев юм. Одоо ямар үйлдлүүд чухал байж мэдэх талаар ойлголт авах үүднээс Чебышёвын онолын суурь хэсгийг эргэн санацгаая. Арифметикийн үндсэн теоремоос дурын натурал тоог

\displaystyle n=\prod_{p^k|n}p

байдлаар задалж болох ба эндээс логарифм авбал

\displaystyle \ln n=\sum_{p^k|n}\ln p=\sum_{b|n}\Lambda(b)\qquad(*)

болдгийг бид мэднэ. Чебышёв үүнийг нийлбэрчилсэн

\displaystyle \ln[x]!=\sum_{n\leq x}\sum_{b|n}\Lambda(b)

томъёог гарааны цэгээ болгож аваад анхны тоонуудын тархалтын талаар дүгнэлт хийсэн байгаа. Одоо ингэж тойруу замаар явалгүйгээр (*) томъёог «урвуулж» Мангольдтын функцийг шууд олох гээд үзье. Ерөнхий томъёо гаргах үүднээс

\displaystyle f(n)=\sum_{b|n}g(b)

гэж үзээд,

\displaystyle f(1)=g(1),\\ f(2)=g(2)+g(1),\\ f(3)=g(3)+g(1),\\ f(4)=g(4)+g(2)+g(1),\\ f(5)=g(5)+g(1),\\ f(6)=g(6)+g(3)+g(2)+g(1),\\ f(7)=g(7)+g(1),\\ f(8)=g(8)+g(4)+g(2)+g(1),\\ f(9)=g(9)+g(3)+g(1),

гэх мэтчилэн бичье. Үүний n-р мөрнөөс өмнөх мөрүүдийг нь нэмж хасах замаар баруун гар талд нь байгаа g(n)-ээс бусад бүх гишүүдийг устгаж байна гэж төсөөл. Тэгвэл дараах зүй тогтол ажиглагдана.

  • Хэрэв n нь 2-т хуваагддаг бол, g(\frac{n}2) гишүүнийг баруун гар талаас арилгахын тулд (\frac{n}2)-р мөрийг хасах хэрэгтэй. Энэ явцад g(\frac{n}{2m}) маягийн бүх гишүүд хамтдаа устана. Жишээ нь 8-р мөрнөөс 4-р мөрийг хасахад g(4)+g(2)+g(1) гишүүд устана.
  • Хэрэв n нь 3-т хуваагддаг бол, g(\frac{n}3) гишүүнийг баруун гар талаас арилгахын тулд (\frac{n}3)-р мөрийг хасах хэрэгтэй. Энэ явцад g(\frac{n}{3m}) маягийн бүх гишүүд хамтдаа хасагдана. Жишээ нь 18-р мөрнөөс 6-р мөрийг хасахад g(6) төдийгүй g(2) гишүүн бас хасагдана.
  • Гэх мэтчилэн, хэрэв n нь p анхны тоонд хуваагддаг бол, g(\frac{n}p) гишүүнийг баруун гар талаас арилгахын тулд (\frac{n}p)-р мөрийг хасна. Энэ явцад g(\frac{n}{mp}) маягийн бүх гишүүд хамтдаа хасагдана.
  • Хэрэв n нь 4-т хуваагддаг бол, g(\frac{n}4) гишүүн өмнө нь (\frac{n}2)-р мөрийг хасах үед хасагдчихсан учраас, (\frac{n}4)-р мөрийг хасах шаардлага байхгүй.
  • Үүнчлэн хэрэв n нь (4m)-д хуваагддаг бол, g(\frac{n}{4m}) гишүүн өмнө нь (\frac{n}2)-р мөрийг хасах үед хасагдчихсан учраас, (\frac{n}{4m})-р мөрийг хасах шаардлага байхгүй.
  • Гэх мэтчилэн, хэрэв n нь mp^2 хэлбэрийн тоонд хуваагддаг бол, g(\frac{n}{mp^2}) гишүүн өмнө нь (\frac{n}{p})-р мөрийг хасах үед хасагдчихсан учраас, (\frac{n}{mp^2})-р мөрийг хасах шаардлага байхгүй.
  • Нөгөө талаас, хэрэв n нь 6-д хуваагддаг бол, g(\frac{n}6) гишүүн өмнө нь (\frac{n}2)-р ба (\frac{n}3)-р мөрүүдийг хасах үед 2 удаа хасагдсан учраас, (\frac{n}6)-р мөрийг нэмж өгөх хэрэгтэй.
  • Гэх мэтчилэн, хэрэв n нь pq хэлбэрийн, ялгаатай хоёр анхны тооны үржвэрт хуваагддаг бол, g(\frac{n}{pq}) гишүүн өмнө нь (\frac{n}p)-р ба (\frac{n}q)-р мөрүүдийг хасах үед 2 удаа хасагдсан учраас, (\frac{n}{pq})-р мөрийг нэмж өгөх хэрэгтэй.
  • Цаашилбал, хэрэв n нь pqr хэлбэрийн, гурван ялгаатай анхны тооны үржвэрт хуваагддаг бол, g(\frac{n}{pqr}) гишүүн өмнө нь (\frac{n}p)-р, (\frac{n}q)-р ба (\frac{n}r)-р мөрүүдийг хасах үед 3 удаа хасагдаад, (\frac{n}{pq})-р, (\frac{n}{pr})-р ба (\frac{n}{qr})-р мөрүүдийг нэмэх үед 3 удаа нэмэгдээд «хуучин байрандаа» ирчихсэн байсан учраас, (\frac{n}{pqr})-р мөрийг одоо хасч өгөх хэрэгтэй.

Эцэст нь, хэрэв n нь p_1p_2\cdots p_m хэлбэрийн, m ялгаатай анхны тооны үржвэрт хуваагддаг бол, (\frac{n}{p_1p_2\cdots p_m})-р мөрийг (-1)^m тэмдэгтэйгээр нэмэхэд g(\frac{n}{p_1p_2\cdots p_m}) гишүүн устана гэдгийг индукцээр харуулъя. Дээр m=1,2,3 тохиолдлуудыг бид шалгачихсан байгаа.

  • Тэгэхээр g(\frac{n}{p_1p_2\cdots p_m}) гишүүний өмнөх коэффициент анх 1 байж байгаад, g(\frac{n}{p_i}) хэлбэрийн гишүүдийг устгах үед 1-m болно. Энд m=1 үед 1-m=0 байгааг ажиглаарай.
  • Ингээд g(\frac{n}{p_ip_j}) хэлбэрийн гишүүдийг устгах үед 1-m+\binom{m}2 болно. Энд m=2 үед 1-m+\binom{m}2=0 байгааг ажиглаарай.
  • Дараа нь g(\frac{n}{p_ip_jp_k}) хэлбэрийн гишүүдийг устгах үед 1-m+\binom{m}2-\binom{m}3 болно. Энд m=3 үед 1-m+\binom{m}2-\binom{m}3=0 байгааг ажигла.

Ингэж явсаар, хамгийн сүүлд (\frac{n}{p_1p_2\cdots p_m})-р мөрийг (-1)^m тэмдэгтэйгээр нэмсний дараа g(\frac{n}{p_1p_2\cdots p_m}) гишүүний өмнөх коэффициент

1-m+\binom{m}2-\binom{m}3+\ldots+(-1)^{m-1}\binom{m}{m-1}+(-1)^m=(1-1)^m=0

болж, бидний батлах гэсэн зүйл батлагдана.

Дээр өгүүлсэн бүгдийг дүгнэж бичихийн тулд, a=p_1p_2\cdots p_m гэсэн m ялгаатай анхны тооны үржвэрүүдийн хувьд \mu(a)=(-1)^m байдаг, бусад тохиолдолд (ө.х. a тооны задаргаанд анхны тооны квадрат болон түүнээс дээш зэрэг орсон л бол) \mu(a)=0 байдаг \mu(a) гэсэн функц тодорхойлбол

\displaystyle g(n)=\sum_{b|n}\mu(n/b)f(b)=\sum_{ab=n}\mu(a)f(b)\qquad(**)

гэсэн томъёо гарна. Үүнд g(n)-ийн томъёонд f(n)-ийн өмнөх коэффициент үргэлж 1 байх ёстой тул \mu(1)=1 гэж авна. Энэ томъёог Мёбиусын урвуугийн томъёо, \mu функцийг Мёбиусын функц гэж нэрлэдэг. Мёбиусын функцийн эхний 20 утгыг жагсааж бичвэл

\mu(n)=(1,-1,-1,0,-1,1,-1,0,0,1,-1,0,-1,1,1,0,-1,0,-1,0,\ldots).

Одоо Мёбиусын томъёог (*) адилтгалд хэрэглэснээр

\displaystyle \Lambda(n)=\sum_{b|n}\mu(n/b)\ln b\qquad(\dagger)

болно. Энэ томъёог ашиглан \Lambda(n) функцийн талаар хангалттай мэдээлэл гарган авч, анхны тооны теоремыг батлах боломжтой юу? Харамсалтай нь, үүний тулд Мёбиусын функцийн талаар сайн мэдэх хэрэгтэй ба, Мёбиусын функцийг судлахын тулд анхны тооны тархалтын талаар мэдээлэл хэрэгтэй. Тухайлбал, анхны тооны теорем нь дараах тэнцэл биштэй эквивалент гэдгийг Эдмунд Ландау 1906 онд баталсан:

\displaystyle\sum_{n\leq x}\mu(n)=o(x).

Мёбиусын (**) эсвэл (\dagger) томъёог шууд хэрэглэхэд төвөгтэй байж мэдэх ч арифметик функцүүд дээрх гол чухал үйлдлийг эдгээр томъёо бидэнд бэлэглэнэ: f ба g функцүүдийн хуйлаас гэж нэрлэгдэх, f*g гэж тэмдэглэгдэх функцийг

\displaystyle (f*g)(n)=\sum_{b|n}f(n/b)g(b)=\sum_{ab=n}f(a)g(b)

томъёогоор тодорхойлъё. Хуйлаасыг нэг төрлийн үржвэр гэж ойлгох хэрэгтэй. Тэгвэл (\dagger) томъёог

\displaystyle \Lambda=\mu*\ln

гэж бичиж болно. Түүнчлэн, анхны (*) томъёо маань

\displaystyle \ln=\mathit1*\Lambda

болж хувирна. Үүнд \mathit1 нь \mathit1(n)=1 гэж тодорхойлогдсон функц.

Хуйлаас орсон өөр жишээнүүд гэвэл, n-ийн хуваагчдын тоо

\displaystyle d(n)=\sum_{b|n}1

тул

\displaystyle d=\mathit1*\mathit1.

Хэрэв n=p^k үед \lambda_p(n)=1 байдаг, n\neq p^k үед \lambda_p(n)=0 байдаг \lambda_p гэсэн функц тодорхойлбол, n-ийн анхны тоон задаргаан дахь p-ийн зэрэг нь

\displaystyle \nu_p(n)=\sum_{b|n}\lambda_p(b)

буюу

\displaystyle \nu_p=\mathit1*\lambda_p

томъёогоор өгөгдөнө.

Арифметик функцүүдийн хуйлаасны

\displaystyle (f*g)(n)=\sum_{ab=n}f(a)g(b)

тодорхойлолтоос хуйлах үйлдэл коммутатив

f*g=g*f

болох нь тодорхой. Цаашилбал

\displaystyle (f*g*h)(n)=\sum_{ab=n}\Big(\sum_{jk=a}f(j)g(k)\Big)h(b)=\sum_{jkb=n}f(j)g(k)h(b)

тул хуйлах үйлдэл ассоциатив

(f*g)*h=g*(f*h).

Мөн \delta гэсэн функцийг \delta(1)=1 ба n\geq2 үед \delta(n)=0 гэж тодорхойлбол

\displaystyle (\delta*g)(n)=\sum_{ab=n}\delta(a)g(b)=g(n)

буюу

\delta*g=g

тул \delta нь хуйлах үйлдлийн хувьд нэгжийн үүрэг гүйцэтгэнэ. Одоо

\delta*\mathit1=\mathit1

адилтгалыг Мёбиусын томъёогоор урвуулбал,

\delta=\mathit1*\mu.

Өөрөөр хэлбэл Мёбиусын функц нь (хуйлах үйлдлийн хувьд) \mathit1 функцийн урвуу нь юм. Энэ чанарыг сууриа болгож аваад,

f=\mathit1*g

тэнцлийн хоёр талыг Мёбиусын функцээр үржүүлж, хуйлах үйлдлийн ассоциатив чанарыг ашиглан, Мёбиусын урвуугийн томъёог гаргаж авч бас болно:

\mu*f=\mu*\mathit1*g=\delta*g=g.

Чебышёвын онолд чухал үүрэг гүйцэтгэдэг өөр нэг үйлдэл бол

H(x)=\displaystyle\sum_{n\leq x}h(n)

маягийн нийлбэр юм. Ялангуяа h нь өөрөө h=f*g хэлбэртэй нийлбэр их тохиолддог. Үүнд

\displaystyle\sum_{n\leq x}(f*g)(n)=\sum_{n\leq x}\sum_{ab=n}f(a)g(b)=\sum_{ab\leq x}f(a)g(b)=\sum_{a\leq x}f(a)\sum_{k\leq x/a}g(k)

гэдгээс дараах теорем гарна.

Теорем. Арифметик функцүүдийн нийлбэрийн хувьд

F(x)=\displaystyle\sum_{n\leq x}f(n),\qquad G(x)=\displaystyle\sum_{n\leq x}g(n)

гэсэн тэмдэглэгээнүүд оруулбал

\displaystyle H(x)=\sum_{n\leq x}(f*g)(n)=\sum_{a\leq x}f(a)G(x/a)=\sum_{b\leq x}F(x/b)g(b).\qquad(\dagger\dagger)

Мөрдлөгөө 1. \nu_p=\lambda_p*\mathit1 гэдгээс

\displaystyle\nu_p(n!)=\sum_{k\leq n}(\lambda_p*\mathit1)(k)=\sum_{a\leq n}\lambda_p(a)\sum_{k\leq n/a}1=\sum_{a\leq n}\lambda_p(a)\cdot\Big[\frac{n}{a}\Big]=\sum_{k\geq1}\Big[\frac{n}{p^k}\Big]

гээд Лежандрын теорем мөрдөнө.

Мөрдлөгөө 2. Арифметикийн үндсэн теоремын \ln=\mathit1*\Lambda бичиглэлээс Чебышёвын онолын үндсэн адилтгал

\displaystyle T(x)=\ln[x]!=\sum_{n\leq x}\ln n=\sum_{n\leq x}(\mathit1*\Lambda)(n)=\sum_{k\leq x}\psi(x/k)

гарах ба зүүн гар талд нь Стирлингийн ойролцооллыг хэрэглэснээр

\displaystyle\sum_{k\leq x}\psi(x/k)=x\ln x-x+O(\ln x).

Мөрдлөгөө 3. d=\mathit1*\mathit1 гэдгээс

\displaystyle D(x)=\sum_{n\leq x}d(n)=\sum_{n\leq x}(\mathit1*\mathit1)(k)=\sum_{a\leq x}\sum_{k\leq x/a}1=\sum_{a\leq x}\Big[\frac{x}{a}\Big].

Сүүлийн мөрдлөгөөг сайжруулах үүднээс, нийлбэрийн томъёоны Дирихле гиперболын арга гэж нэрлэгдсэн нэг хувилбарыг авч үзье.

Теорем. Өмнөх теоремын тэмдэглэгээг хэрэглэн, 1<y<x үед

\displaystyle H(x)=\sum_{a\leq y}f(a)G(x/a)+\sum_{b<x/y}F(x/b)g(b) - F(y)G(x/y).

Баталгаа. Өмнөх теоремын үр дүнг

\displaystyle H(x)=\sum_{a\leq y}f(a)G(x/a)+\sum_{y<a\leq x}f(a)G(x/a)

гэж бичээд, сүүлийн нийлбэрийг

\displaystyle\sum_{y<a\leq x}f(a)G(x/a)=\sum_{y<a\leq x}\sum_{b\leq x/a}f(a)g(b)=\sum_{b<x/y}\sum_{y<a\leq x/b}f(a)g(b)\\{}\quad=\sum_{b<x/y}\big(F(x/a)-F(y)\big)g(b)=\sum_{b<x/y}F(x/a)g(b)-F(y)G(x/y)

гэж хувиргаснаар теорем батлагдана.

Мөрдлөгөө. Гиперболын аргыг y=\sqrt{x} үед d=\mathit1*\mathit1 адилтгалын хувьд хэрэглэвэл

\displaystyle\sum_{n\leq x}d(n)=\sum_{a\leq\sqrt{x}}\Big[\frac{x}{a}\Big]+\sum_{b<\sqrt{x}}\Big[\frac{x}{b}\Big]-\big[\sqrt{x}\big]^2=2\sum_{n\leq\sqrt{x}}\Big[\frac{x}{n}\Big]-x+O(\!\sqrt{x}\,).

Энд орсон нийлбэрийг

\displaystyle\sum_{n\leq\sqrt{x}}\Big[\frac{x}{n}\Big]=\sum_{n\leq\sqrt{x}}\Big(\frac{x}{n}-\big\{\frac{x}{n}\big\}\Big)=\sum_{n\leq\sqrt{x}}\frac{x}n+O(\sqrt{x})=x\ln\sqrt{x}+\gamma x+O(\!\sqrt{x}\,)

маягаар үнэлбэл

\displaystyle D(x)=\sum_{n\leq x}d(n)=x\ln x+(2\gamma-1)x+O(\!\sqrt{x}\,)

гэсэн Дирихлен алдарт үнэлгээ гарч ирнэ.

Одоо арифметик функцүүдийг арай өөр өнцгөөс харах гээд үзье. Зэрэгт цуваануудыг үржүүлэх

\displaystyle \Big(\sum_{j=0}^\infty a_jx^j\Big)\Big(\sum_{k=0}^\infty b_kx^k\Big)=\sum_{n=0}^\infty\Big(\sum_{j+k=n}a_jb_k\Big)x^n

томъёоноос \sum a_jx^j ба \sum b_kx^k цуваануудын үржвэр \sum c_nx^n цувааны коэффициентүүд

\displaystyle c_n=\sum_{j+k=n}a_jb_k\qquad(\ddagger)

гэж өгөгдөнө. Үүнийг

\displaystyle (f*g)(n)=\sum_{jk=n}f(j)g(k)\qquad(\ddagger\ddagger)

томъёотой харьцуулаад хар. Зэрэгт цувааны үржвэрийн (\ddagger) томъёоны хувьд

 \displaystyle x^jx^k=x^{j+k}

чанар гол үүрэг гүйцэтгэж байгааг ажиглавал,

\displaystyle e_j(x)e_k(x)=e_{jk}(x)\qquad(\S)

чанарыг хангадаг e_n(x) функцүүд орсон \sum a_ne_n(x) хэлбэрийн цуваануудыг үржүүлэхэд

\displaystyle \Big(\sum_{j=0}^\infty a_je_j(x)\Big)\Big(\sum_{k=0}^\infty b_ke_k(x)\Big)=\sum_{n=0}^\infty\Big(\sum_{jk=n}a_jb_k\Big)e_n(x)

үржвэрийнх нь коэффициентүүд яг (\ddagger\ddagger) томъёогоор өгөгдөнө. Дээрх (\S) нөхцлийг хангадаг хялбар функц гэвэл

\displaystyle e_n(x)=n^{\alpha x}

байна. Цаашилбал, x>0 үед

\displaystyle\sum_n a_ne_n(x)=\sum_n a_nn^{\alpha x}

цувааг нийлэхэд нь саад болох зүйл аль болох бага байлгая гэвэл \alpha<0 гэж авбал дээр. Ингээд хялбарыг бодож \alpha=-1 гэсэн сонголт хийснээр арифметик функцүүдийг бодит (эсвэл комплекс) хувьсагчийн функцүүд рүү хувиргадаг Дирихлен цуваа нэртэй

\displaystyle F(s)=\sum_{n} \frac{f(n)}{n^s}\qquad(\S\S)

хувиргалт гарч ирнэ. Дирихлен цуваа нь тоон дарааллыг үүсгэгч функцэд нь хувиргадаг зэрэгт цуваа

\displaystyle A(x)=\sum_n a_nx^n,

Фурье коэффициентүүдийг функцэд нь хувиргадаг Фурьегийн цуваа

\displaystyle g(x)=\sum_n \hat g(n)e^{-inx}

зэрэгтэй «нэг тэрэгний дугуйнууд» юм. Зэрэгт болон Фурьегийн цуваа нь коэффициентуудынхаа аддитив чанарыг илүү тусгаж авдаг бол, Дирихлен цуваа нь мултипликатив чанартай холбоотой байдгаараа онцлогтой. Хамгийн алдартай Дирихлен цуваа бол мэдээж \mathit1(n)=1 функцэд харгалзах зета функц

\displaystyle\zeta(s)=\sum_{n} \frac1{n^s}

болно. Дирихлен цувааны (\S\S) харгалзааг

f\longleftrightarrow F

гэж илэрхийлэхээр тохирвол

\mathit1\longleftrightarrow\zeta.

Түүнчлэн, дээр өгүүлснээр

f*g\longleftrightarrow FG,

ө.х. арифметик функцүүдийн хуйлаас нь Дирихлен цуваан дор функцүүдийн (жирийн) үржвэрт хувирна.

Теорем. Хэрэв f(n)=O(n^\lambda) бол 

\displaystyle F(s)=\sum_{n} \frac{f(n)}{n^s}

цуваа \alpha>\lambda+1 байх [\alpha,\infty) хэлбэрийн бүх муж дээр абсолют нийлнэ. Үүн дээр нэмээд g(n)=O(n^\lambda) бол 

\displaystyle F(s)G(s)=\sum_{n} \frac{(f*g)(n)}{n^s}

тэнцэтгэл s>\lambda+1 мужид хүчинтэй.

Баталгаа. Эхнийх нь өгүүлбэр

\displaystyle s\geq\alpha\quad\Longrightarrow\quad\frac{f(n)}{n^s}=O(n^{\lambda-\alpha})

ба \lambda-\alpha<-1 гэдгээс шууд гарна. Хоёрдахь өгүүлбэр нь абсолют нийлдэг цуваануудыг гишүүнчлэн үржүүлж, гишүүдийг нь яаж ч бүлэглэж болно гэсэн классик теоремоос мөрдөнө.

Энэ теоремыг \mu*\mathit1=\delta адилтгалд хэрэглэвэл, s>1 үед

\displaystyle\zeta(s)\sum_{n} \frac{\mu(n)}{n^s}=1

буюу

\displaystyle\frac1{\zeta(s)}=\sum_{n} \frac{\mu(n)}{n^s}

гэж гарна. Мөн d=\mathit1*\mathit1 адилтгалаас

\displaystyle\zeta^2(s)=\sum_{n} \frac{d(n)}{n^s}\qquad(s>1).

Түүнчлэн, \ln=\mathit1*\Lambda адилтгалыг

\displaystyle\sum_{n}\frac{\ln n}{n^s}=\zeta(s)\sum_{n}\frac{\Lambda(n)}{n^s}\qquad(s>1)

гэж бичиж болно. Үүнийг цааш нь хялбарчлахын тулд, Дирихлен (\S\S) цуваанаас уламжлал авахад, абсолют нийлдэг муж дотроо

\displaystyle F'(s)=-\sum_{n}\frac{f(n)\ln n}{n^s}

байна гэдгийг ажиглая. Эндээс

\displaystyle \zeta'(s)=-\sum_{n}\frac{\ln n}{n^s}

гарах тул

\displaystyle-\frac{\zeta'(s)}{\zeta(s)}=\sum_{n}\frac{\Lambda(n)}{n^s}\qquad(s>1)

болно. Энэ нь арифметикийн үндсэн теоремыг Дирихлен цуваануудаар илэрхийлсэн илэрхийлэл юм.

Эцэст нь, Дирихлен цувааны уламжлалыг арифметик функц талд нь бүр илэрхий болгох үүднээс, арифметик функцүүдийн «уламжлалыг»

f'(n)=f(n)\ln n

гэж тодорхойлж болно. Энэ уламжлал нь хуйлаас үйлдлийн хувь Лейбницийн хуулийг дагадаг:

\displaystyle (f*g)'(n)=(f*g)(n)\ln n=\sum_{ab=n}f(a)g(b)\ln n=\sum_{ab=n}f(a)g(b)(\ln a+\ln b)\\{}\qquad=\sum_{ab=n}f'(a)g(b)+\sum_{ab=n}f(a)g'(b)=f'*g+f*g'.

Дээрх тэмдэглэгээг ашиглан арифметикийн үндсэн теоремыг

\Lambda*\mathit1=\mathit1'

гэж илэрхийлж болно.

Posted in Тооны онол | Tagged , , , , , , , , | Сэтгэгдэл бичих

Биномынхоо коэффициентийг бариад урагшаа!

Биномын

\displaystyle\binom{2n}{n}=\frac{(2n)!}{n!n!}

коэффициентийн анхны тоон задаргааг судалсны үндсэн дээр Эрдёш Бертраны постулатыг харьцангуй хялбархнаар баталсан болохыг бид харсан. Бертраны постулатын анхны баталгааг бол Чебышёв өөрийн боловсруулсан анхны тооны тархалтын талаарх ерөнхий онолын нэг жижиг мөрдлөгөө мэтээр гаргасан. Түүний онолын нэг гол хэрэглээ нь n их үед A=0.9212 ба B=1.1055 тогтмолуудтай

\displaystyle An<\pi(n)\ln n<Bn

тэнцэл бишүүд биелнэ гэдгийг баталсан явдал юм. Тэгвэл Эрдёшын аргыг өргөтгөн ийм тэнцэл бишүүдийг баталж болох уу гэсэн асуулт гарч ирнэ. Энэ асуултын хариултыг шууд хэлэхэд: Тийм боломж бий, гэхдээ A, B тогтмолуудын утгыг яг  Чебышёвынх шиг биш, арай сулруулах хэрэгтэй болно. Нэг ийм хялбар баталгааг дор толилуулъя.

Эрдёшын баталгааны явцад бид

\displaystyle \prod_{p\leq x}p\leq4^{x-1}

болохыг харсан. Эндээс логарифм авбал

\displaystyle \theta(x)=\sum_{p\leq x}\log p\leq(x-1)\ln4

гэсэн зааг гарах ба үүнийг \pi(n) функцийн заагт хувиргах боломжтой. Гэхдээ бид ийм тойруу замаар явах шаардлага байхгүй. Биномын

\displaystyle \binom{2n}{n}=\frac{(2n)!}{n!n!}

коэффициент n<p\leq2n байх бүх анхны тоонд хуваагдана гэдгээс

\displaystyle n^{\pi(2n)-\pi(n)}\leq\prod_{n<p\leq2n}p\leq\binom{2n}{n}\leq2^{2n}

буюу

\displaystyle \pi(2n)-\pi(n)\leq\frac{2n\ln2}{\ln n}.\qquad(*)

Энэ томъёог

\displaystyle \pi(2^{k+1})-\pi(2^k)\leq\frac{2^{k+1}}{k}\qquad(**)

гэж бичвэл \pi(2^k)\sim{2^k}/{k} байж магадгүй гэсэн таамаглал төрнө. Иймд утгыг нь сүүлд сонгохоор a>0 гэсэн тогтмол оруулаад,

\displaystyle \pi(2^{k})\leq\frac{a2^{k}}k\qquad(\dagger)

гэдгийг индукцээр батлах гээд үзье. Үүн дээрээ (**) томъёог нэмбэл

\displaystyle \pi(2^{k+1})\leq\frac{a2^{k}}k+\frac{2^{k+1}}k=\frac{(a+2)2^{k}}k

гарах ба, индукцийн алхмыг гүйцээхэд хэрэгтэй

\displaystyle \frac{(a+2)2^{k}}k\leq\frac{a2^{k+1}}{k+1}

тэнцэл биш биелдэг байх зайлшгүй бөгөөд хүрэлцээтэй нөхцөл нь

\displaystyle k\geq\frac{a+2}{a-2}

болно. Тухайлбал, (\dagger) тэнцэл бишийг a=\frac52 параметртэйгээр батлая гэвэл, k\to k+1 гэсэн индукцийн алхам k\geq9 үед хүчинтэй. Индукцийн суурь болгоод k=9 тохиолдлыг шалгавал

\displaystyle \pi(2^9)=97<\frac{\frac52\cdot2^{9}}9=142.22\ldots

тул, (\dagger) тэнцэл бишийн a=\frac52 тохиолдол k\geq9 үед батлагдана. Үнэндээ энэ тэнцэл биш 1\leq k\leq8 утгуудад ч хүчинтэй:

\displaystyle\pi(2)=1<\frac{\frac52\cdot2}1=5,\qquad\pi(2^2)=2<\frac{\frac52\cdot2^{2}}2=5,

\displaystyle\pi(2^3)=4<\frac{\frac52\cdot2^{3}}3=6.66\ldots,\qquad\pi(2^4)=6<\frac{\frac52\cdot2^{4}}4=10,

\displaystyle\pi(2^5)=11<\frac{\frac52\cdot2^{5}}5=16,\qquad\pi(2^6)=18<\frac{\frac52\cdot2^{6}}6=26.66\ldots,

\displaystyle\pi(2^7)=31<\frac{\frac52\cdot2^{7}}7=45.71\ldots,\qquad\pi(2^8)=54<\frac{\frac52\cdot2^{8}}8=80.

Эцэст нь, x\geq2 бодит тооны хувьд 2^m<x\leq2^{m+1} гэвэл

\displaystyle\pi(x)\leq\pi(2^{m+1})<\frac{\frac52\cdot2^{m+1}}{m+1}<\frac{5x\ln2}{\ln x}

болно. Ингээд дараах теорем батлагдлаа.

Теорем. x\geq2 бол \displaystyle \pi(x)\leq5\ln2\cdot\frac{x}{\ln x}.

Одоо \pi(x) функцийг доороос нь зааглахын тулд Эрдёшын баталгааны явцад гарсан дараах аргументыг санацгаая. Юуны түрүүнд, m!=1\cdot2\cdots m тооны анхны тоон задаргаанд p анхны тоо яг

\displaystyle \Big[\frac{m}{p}\Big]+\Big[\frac{m}{p^2}\Big]+\Big[\frac{m}{p^3}\Big]+\ldots

зэрэгтэйгээр орно гэсэн Лежандрын теоремоос, \binom{2n}{n} коэффициентийн анхны тоон задаргаанд p анхны тоо

\displaystyle \langle n,p\rangle=\sum_{k\geq0}\Big(\Big[\frac{2n}{p^k}\Big]-2\Big[\frac{n}{p^k}\Big]\Big)

зэрэгтэйгээр орно гэж гарна. Цаашилбал, ямар ч x бодит тооны хувьд \{x\}<\frac12 бол [2x]=2[x]\{x\}\geq\frac12 бол [2x]=2[x]+1 гэдгээс

\displaystyle \Big[\frac{2n}{p^k}\Big]-2\Big[\frac{n}{p^k}\Big]\in\{0,1\}.

Түүнчлэн, p^k>2n үед

\displaystyle \Big[\frac{2n}{p^k}\Big]-2\Big[\frac{n}{p^k}\Big]=0

учир

\displaystyle \langle n,p\rangle=\sum_{k\geq0}\Big(\Big[\frac{2n}{p^k}\Big]-2\Big[\frac{n}{p^k}\Big]\Big)\leq\max\{k:p^k\leq2n\}=\Big[\frac{\ln2n}{\ln p}\Big]

буюу

\displaystyle p^{\langle n,p\rangle}\leq2n.

Эндээс шууд

\displaystyle \binom{2n}{n}=\prod_{p\leq2n}p^{\langle n,p\rangle}\leq(2n)^{\pi(2n)}

гэж гарах ба, зүүн гар талд нь

\displaystyle\binom{2n}{n}=\max_{0<k<2n}\binom{2n}{k}\geq\frac{2^{2n}}{2n}

гэсэн тривиал заагийг хэрэглэснээр

\displaystyle \frac{2^{2n}}{2n}\leq\binom{2n}{n}\leq(2n)^{\pi(2n)}

болно. Хоёр талаас нь логарифм авбал

\displaystyle 2n\ln2-\ln2n\leq\pi(2n)\ln2n

буюу

\displaystyle \pi(2n)\geq\frac{2n\ln2}{\ln2n}-1.

Үүнийгээ бүх бодит (эсвэл ядаж хангалттай их) x-ийн хувьд биелдэг

\displaystyle \pi(x)\geq\frac{ax}{\ln x}

хэлбэрийн тэнцэл бишид хөрвүүлэх гээд үзье. Хэрэв 2n\leq x<2n+2 бол,

\displaystyle \pi(x)\geq\pi(2n)\geq\frac{2n\ln2}{\ln2n}-1.\qquad(\dagger\dagger)

Тэгэхээр

\displaystyle \frac{ax}{\ln x}\leq\frac{2a(n+1)}{\ln2n}

тэнцэл бишийн баруун гар тал (\dagger\dagger) тэнцэл бишийн баруун гар талаас хэтрэхгүй байх нөхцөл нь

\displaystyle f(n)=2n\ln2-\ln2n-2a(n+1)\geq0

байх явдал болно. Энд хялбарыг бодоод a=\frac12 гэж авбал f(x) функц нь

\displaystyle x\geq\frac1{2(\ln2-a)}=1.29\ldots

үед үл буурах функц байна. Цаашилбал,

f(11)=0.15\ldots

гэдгээс n\geq11 үед f(n)>0 гэж гарах тул,

\displaystyle \pi(x)\geq\frac{x}{2\ln x}

тэнцэл биш x\geq22 үед хүчинтэй нь батлагдана. Энэ тэнцэл бишийг шууд шалгахад 3\leq x\leq22 үед биелдэг нь харагдана (Зураг). Хэрэв зурагт итгэхгүй бол \pi(x) функц зөвхөн анхны тоонууд дээр л үсрэлттэй гэдгийг санаад, 22 хүртэлх анхны тоонууд дээр дээрх тэнцэл бишийн хоёр талыг тооцоод үзэхэд хангалттай.

Ингээд дараах теорем батлагдлаа.

Теорем. x\geq3 бол \displaystyle \pi(x)\geq\frac{x}{2\ln x}.

Posted in Тооны онол | Tagged , | Сэтгэгдэл бичих