где функция f (d, х ) ³ 0 и f (d, 0) = 0 (если точка {0} является поглощающим состоянием и f (d, x ) = I, d Î D, x = 1,..., N, то V a (x ) есть матем. ожидание времени попадания из точки х в точку 0). Функцию
называется ценой, а стратегию а * – оптимальной, если = V (x ) для всех х Î Е.
При довольно общих предположениях о множестве D устанавливается, что цена V (x ) удовлетворяет следующему уравнению оптимальности (уравнению Беллмана):
,
где
.
В классе всех стратегий наибольший интерес представляют т. н. однородные марковские стратегии, характеризуемые одной функцией а (х ) такой, что a n (x 0 ,..., x n ) = a (x n ) при всех n = 0, 1,...
Следовательно, критерий оптимальности (или достаточное условие оптимальности) может быть использован для проверки того, что данная однородная марковская стратегия является оптимальной: пусть существуют функции a * = а* (х ) и V* = V* (x ) такие, что для любого d Î D
0 = f (x, a* (x )) + L a *V* £ f (x, d ) + L d V* (x )
(L d = T d – I, I – единичный оператор), тогда V * является ценой (V * = V ) и стратегия a* = a*(х ) является оптимальной.
Лит.: Ховард Р.-А., Динамическое программирование и марковские процессы, пер. с англ., М. 1964.
А. Н. Ширяев.
Управляемый термоядерный синтез
Управля'емый термоя'дерный си'нтез, процесс слияния лёгких атомных ядер, происходящий с выделением энергии при высоких температурах в регулируемых, управляемых условиях. Скорости протекания термоядерных реакций малы из-за кулоновского отталкивания (см. Кулона закон ) положительно заряженных ядер. Поэтому процесс синтеза идёт с заметной интенсивностью только между лёгкими ядрами, обладающими малым положительным зарядом и только при высоких температурах, когда кинетическая энергия сталкивающихся ядер оказывается достаточной для преодоления кулоновского потенциального барьера . В природных условиях термоядерные реакции между ядрами водорода (протонами) протекают в недрах звёзд, в частности во внутренних областях Солнца, и служат тем постоянным источником энергии, который определяет их излучение. Сгорание водорода в звёздах идёт с малой скоростью, но гигантские размеры и плотности звёзд обеспечивают непрерывное испускание огромных потоков энергии в течение миллиардов лет (подробнее см. Термоядерные реакции ). С несравненно большей скоростью идут реакции между тяжёлыми изотопами водорода (дейтерием 2 H и тритием 3 H) с образованием сильно связанных ядер гелия:
.
Именно названные реакции представляют наибольший интерес для проблемы У. т. с. В особенности привлекательна вторая реакция, сопровождающаяся большим энерговыделением и протекающая со значительной скоростью. Тритий радиоактивен (период полураспада 12,5 лет) и не встречается в природе. Следовательно, для обеспечения работы предполагаемого термоядерного реактора, использующего в качестве ядерного горючего тритий, должна быть предусмотрена возможность воспроизводства трития. С этой целью рабочая зона рассматриваемой системы может быть окружена слоем лёгкого изотопа лития, в котором будет идти процесс воспроизводства
6 Li + n ® 3 H + 4 He.
Вероятность (эффективное поперечное сечение ) термоядерных реакций быстро возрастает с температурой, но даже в оптимальных условиях остаётся несравненно меньше эффективного сечения столкновений атомных . По этой причине реакции синтеза должны происходить в полностью ионизованной плазме , нагретой до высокой температуры, где процессы ионизации и возбуждения атомов отсутствуют и дейтон-дейтонные или дейтон-тритонные столкновения рано или поздно завершаются ядерным синтезом.
Удельная мощность термоядерного реактора находится путём умножения числа ядерных реакций, происходящих ежесекундно в единице объёма рабочей зоны реактора, на энергию, выделяющуюся при каждом акте реакции.
Критерий Лоусона. Применение законов сохранения энергии и числа частиц позволяет выяснить некоторые предъявляемые к реактору синтеза общие требования, не зависящие от каких-либо особенностей технологического или конструктивного характера рассматриваемой системы. На рис. 1 изображена принципиальная схема работы реактора. Установка произвольной конструкции содержит чистую водородную плазму с плотностью п при температуре Т. В реактор вводится топливо, например равнокомпонентная смесь дейтерия и трития, уже нагретая до необходимой температуры. Внутри реактора инжектируемые частицы время от времени сталкиваются между собой и происходит их ядерное взаимодействие. Это полезный процесс; одновременно, однако, из реактора уходит энергия за счёт электромагнитного излучения плазмы и из рабочей зоны ускользает некоторая доля «горячих» (обладающих высокой энергией) частиц, которые не успели испытать ядерные взаимодействия. Пусть t – среднее время удержания частиц в реакторе; смысл величины t таков: за время в 1 сек из 1 см 3 плазмы в среднем уходит n /t частиц каждого знака. В стационарном режиме в реактор надо ежесекундно инжектировать такое же число частиц (в расчёте на единицу объёма). Для покрытия энергетических потерь подводимое топливо должно подаваться в зону реакции с энергией, превышающей энергию потока ускользающих частиц. Эта дополнительная энергия должна компенсироваться за счёт энергии синтеза, выделяющейся в зоне реакции, а также за счёт частичной рекуперации в стенках и оболочке реактора электромагнитного излучения и корпускулярных потоков. Примем для простоты, что коэффициент преобразования в электрическую энергию продуктов ядерных реакций, электромагнитного излучения и частиц с тепловой энергией одинаков и равен h. Величину (часто называют коэффициент полезного действия (кпд). В условиях стационарной работы системы и при нулевой полезной мощности уравнение баланса энергии в реакторе имеет вид:
h(Po + Pr + Pt ) = Pr + Pt , (1)
где Po – мощность ядерного энерговыделения, Pr – мощность потока излучения и Pt – энергетическая мощность потока ускользающих частиц. Когда левая часть написанного равенства делается больше правой, реактор перестаёт расходовать энергию и начинает работать как термоядерная электростанция. При написании равенства (1) предполагается, что вся рекуперированная энергия без потерь возвращается в реактор через инжектор вместе с потоком подводимого нагретого топлива. Величины Ро , Pr и Pt известным образом зависят от температуры плазмы, и из уравнения баланса легко вычисляется произведение
n t = f (T ), (2)
где f (T ) для заданного значения кпд h и выбранного сорта топлива есть вполне определённая функция температуры. На рис. 2 приведены графики f (T ) для двух значений h и для обеих ядерных реакций. Если величины h, достигнутые в данной установке, расположатся выше кривой f (T ), это будет означать, что система работает как генератор энергии. При h = 1 /3 энергетически выгодная работа реактора в оптимальном режиме (минимум на кривых рис. 2 ) отвечает условию («критерии Лоусона»):
реакции (d, d): n t >1015 см -3 ·сек ;
Т ~ 109 К; (3)
реакции (d, t): n t > 0, 5·1015 см -3 ·сек,