Одно из наиболее востребованных применений суперкомпьютеров, особенно актуальное для современных молекулярных биофизиков, это различные методы вычислительной химии. Вычислительная химия («computational chemistry») — это термин, который аккумулирует в себе все компьютерные методы исследования процессов, протекающих на молекулярном уровне. Широкое распространение и развитие эти методы, поскольку все они достаточно затратны, получили только с появлением в мире свободных вычислительных мощностей. Об этих методах ниже пойдет речь в конексте их эффективности и вычислительной стоимости, поэтому предварительно введем несколько компьютерных понятий:

  • параллельный режим исполнения — режим, при котором алгоритм разбивается на логические куски и исполняется одновременно несколькими ядрами/узлами. Следует отличать от случая когда разные алгоритмы запускаются на разных ядрах — это не параллельность, а многозадачность.

  • масштабируемость — это свойство параллельного алгоритма работать быстрее на большем количестве ядер. Непараллельный алгоритм этим свойством необладает. Ситуация, когда повышение количества ядер вдвое приводит к сокращению времени исполнения вдвое называется идеальным масштабированием, к которому все стремятся.

  • вычислительной мощностью называется число операций за единицу времени. Обычно его измеряют по времени отрабатывания суперкомпьютером алгоритма LU-декомпозиции (диагонализации) гигантской матрицы на специальном тесте.

  • вычислительной стоимостью алгоритма называется количество операций, которое требуется для его завершения. Стоимость обычно выражают в процессоро-часах (кол-во процессоров * кол-во часов).

  • вычислительнай сложностью алгоритма называют функцию, описывающую время исполнения алгоритма в зависимости от размера системы. Обозначают сложность «O(f(N))», например говорят, что алгоритм быстрой сортировки имеет сложность O(N ln(N)). Это означает, что сортировка всех возможных массивов длины N не будет происходить медленнее чем K N ln(N), где K — некоторая константа, зависящая от реализации алгоритма.

В зависимости от механизма расчета потенциала молекулярной системы методы делятся на ab initio, полуэмпирические, механические атомистические, механические корс-грейн (объединенно-атомные) и комбинированные.

  • ab initio — под этим словом понимаются все методы квантовой химии, которые не содержат настраиваемых под экспериментальный набор (“эмпирических”) членов. Сюда входят различные расширения МО ЛКАО: Хартри-Фок с различными надбавками, теория возмущений, метод сопряженных кластеров, методы конфигурационного взаимодействия, многоконфигурационного взаимодействия и т.д.. Кроме МО ЛКАО существуют и другие методы апроксимации многоэлектронной волновой функции, но они менее распространены. Как правило, вычислительная стоимость растет пропорционально N4, где N — количество базисных функций, пропорциональное кол-ву атомов.

  • полуэмпирические — это методы, в принципе похожие на классические QM-методы, но содержащие эмпирические коэфициенты, которые заменяют множество вычислений в “тяжелых” методах. Например, это метод Хюкеля, подменяющий коэфициентами кулоновские и обменные интегралы в матрице Фока. Это MP2, похожим образом учитывающий поляризацию оболочек. Их вычислительная сложность — O(N2). И наконец, это теория функционала электронной плотности (Density Functional Theory, DFT) — самый успешный и чуть ли не самый самый распространенный во всей квантовой химии метод, о котором мы здесь не говорим подробно. Этот метод настолько успешен, что дает даже более точные решения уравнения Шредингера чем классический метод Хартри-Фока. Вычислительная сложность DFT — O(N3).

  • механические — в этом случае атомы заменяются материальными точками с парциальными зарядами, а потенциальная энергия заменяется набором 2-х, 3-х 4-х центровых членов, имитирующих различные механические упругие элементы — пружины, пружинные педали, винтовые пружины. Сюда же добавляются ван-дер-ваальсовы взаимодействия и различные члены в качестве “присыпки”, повышающие качество механистического описания полной потенциальной энергии. Набор коэфициентов, описывающих всю эту сложную механическую систему называется силовым полем (force field), от выбора которого результат ваших расчетов может зависеть очень и очень сильно. Вычислительная сложность, в основном — O(N2).

  • механические корс-грейн — это те же механические расчеты, но для снижения вычислительной стоимости, атомы объединяются в группы и материальная точка имитирует уже группу атомов. Отсюда английское название «united-atom force field» в противовес атомистическому описанию («all-atom force field»).

  • комбинированные методы — предполагают разделение системы на квантовую (небольшую) и механическую (большую) подсистемы и расчет потенциала, соответственно, представляет собой комбинацию ab inito или полуэмпирического подхода и механического или корс-грейн подхода.

По отношению к понятию “времени” методы вычислительной химии можно разделить на три группы — динамические, стохастические и статические.

  • Динамические методы претендуют на имитацию “жизни” молекул в небольшом объеме на небольших временах. Объем описываемых систем и внутреннее время моделирования зависят от уровня приближения и вычислительной мощности. Расчеты динамическими методами часто называют “вычислительный эксперимент” или “эксперимент in silico”. Поскольку здесь претендуется на моделирование “во времени”, то ДМ необходимо представляют собой систему динамических уравнений. Зачастую, это уравнения Ньютона вида

    m_i \ddot{x}_i = -\frac{\partial U(\vec{x})}{\partial x_i} ,

    которые решаются тем или иным алгоритмом численного пошагового интегрирования, то есть каждый последующий шаг зависит только от предыдущего. Поэтому распараллеливание подобного алгоритма возможно только внутри одного шага интегрирования.

  • Стохастические методы претендуют на имитацию «ансамбля». Времени в них нет. Они генерируют набор конформаций, согласно правилу отбора, имитируя естественные распределения статфизики. Согласно теореме об эргодичности, которую в краткой форме можно сформулировать как “среднее по времени равно среднему по ансамблю”, стохастические методы должны быть эквивалентны динамическим. Однако для некоторых систем времени моделирования оказывается недостаточно и тогда исследователю приходится прибегать к стохастическим методам.

  • Статические методы вычисляют характеристики системы, не зависящие от времени: полную потенциальную энергию, спектр нормальных колебаний, стационарное состояние геометрии, энергию сродства к электрону и др. Большинство «тяжелых» методов ab initio способны работать только в таком режиме из-за гигантской вычислительной сложности расчетов и плохой масштабируемости.

Комбинации методов, перечисленных в обоих списках дают нам все разнообразие методов современной вычислительной химии. Динамические механические методы — это методы классической молекулярной динамики. Статические ab initio методы — это методы классической вычислительной квантовой химии. Эти две комбинации — самые распространенные на сегодняшний день подходы. Динамические ab initio методы, например, носят название AIMD («ab initio molecular dynamics»), а динамические и статические методы в комбинированном — обычно называют QMMM. В последнее время популярность стали набирать динамические методы корс-грейн, которые обычно называют «молекулярной динамикой в силовом поле корс-грейн». Остальные комбинации, как правило не имеют специального названия и используются реже.

В зависимости от задачи и вычислительных мощностей, имеющихся в распоряжении, исследователь выбирает необходимую комбинацию методов. Например, задачи с переносом электрона в обязательном порядке требуют квантовой химии на стадии переноса, но не требуют — на стадии диффузии. В то же время, адсорбция в большинстве случаев может моделироваться динамическими механическими методами. Кроме того, каждый метод хорош на уровне своего масштаба: например, нельзя сказать, что механические модели менее точны, чем квантовые — для больших систем это не может быть не так.