Markov state models (MSMs) have been demonstrated to be a powerful method for computationally studying intramolecular processes such as protein folding and macromolecular conformational changes. In this article, we present a new approach to construct MSMs that is applicable to modeling a broad class of multi-molecular assembly reactions. Distinct structures formed during assembly are distinguished by their undirected graphs, which are defined by strong subunit interactions. Spatial inhomogeneities of free subunits are accounted for using a recently developed Gaussian-based signature. Simplifications to this state identification are also investigated. The feasibility of this approach is demonstrated on two different coarse-grained models for virus self-assembly. We find good agreement between the dynamics predicted by the MSMs and long, unbiased simulations, and that the MSMs can reduce overall simulation time by orders of magnitude.

1.
D. L. D.
Caspar
and
A.
Klug
,
Cold Spring Harbor Symp. Quant. Biol.
27
,
1
(
1962
).
2.
A.
Zlotnick
and
S.
Mukhopadhyay
,
Trends Microbiol.
19
,
14
(
2011
).
3.
J. A.
Speir
and
J. E.
Johnson
,
Curr. Opin. Struct. Biol.
22
,
65
(
2012
).
4.
M.
Hagan
,
Adv. Chem. Phys.
155
,
1
(
2014
).
5.
Y.
Yang
,
R.
Meyer
, and
M. F.
Hagan
,
Phys. Rev. Lett.
104
,
258102
(
2010
).
6.
7.
S.
Sacanna
,
W. T. M.
Irvine
,
P. M.
Chaikin
, and
D. J.
Pine
,
Nature (London)
464
,
575
(
2010
).
8.
E.
Duguet
,
A.
Desert
,
A.
Perro
, and
S.
Ravaine
,
Chem. Soc. Rev.
40
,
941
(
2011
).
9.
Y.
Yang
,
L.
Gao
,
G. P.
Lopez
, and
B. B.
Yellen
,
ACS Nano
7
,
2705
(
2013
).
10.
S.
Whitelam
,
I.
Tamblyn
,
T. K.
Haxton
,
M. B.
Wieland
,
N. R.
Champness
,
J. P.
Garrahan
, and
P. H.
Beton
,
Phys. Rev. X
4
,
011044
(
2014
).
11.
Y.
Wang
,
Y.
Wang
,
D. R.
Breed
,
V. N.
Manoharan
,
L.
Feng
,
A. D.
Hollingsworth
,
M.
Weck
, and
D. J.
Pine
,
Nature (London)
491
,
51
(
2012
).
12.
Y.
Wang
,
A. D.
Hollingsworth
,
S. K.
Yang
,
S.
Patel
,
D. J.
Pine
, and
M.
Weck
,
J. Am. Chem. Soc.
135
,
14064
(
2013
).
13.
A.
Walther
and
A. H. E.
Mueller
,
Chem. Rev.
113
,
5194
(
2013
).
14.
G.
van Anders
,
N. K.
Ahmed
,
R.
Smith
,
M.
Engel
, and
S. C.
Glotzer
,
ACS Nano
8
,
931
(
2014
).
15.
A. H.
Groeschel
,
A.
Walther
,
T. I.
Loebling
,
F. H.
Schacher
,
H.
Schmalz
, and
A. H. E.
Mueller
,
Nature (London)
503
,
247
(
2013
).
16.
P.
Rothemund
,
Nature (London)
440
,
297
(
2006
).
17.
B.
Sacca
and
C. M.
Niemeyer
,
Angew. Chem., Int. Ed.
51
,
58
(
2012
).
18.
T.
Torring
,
N. V.
Voigt
,
J.
Nangreave
,
H.
Yan
, and
K. V.
Gothelf
,
Chem. Soc. Rev.
40
,
5636
(
2011
).
19.
A. C.
Pan
,
D.
Sezer
, and
B.
Roux
,
J. Phys. Chem. B
112
,
3432
(
2008
).
20.
V.
Ovchinnikov
,
M.
Karplus
, and
E.
Vanden-Eijnden
,
J. Chem. Phys.
134
,
085103
(
2011
).
21.
P. G.
Bolhuis
,
D.
Chandler
,
C.
Dellago
, and
P. L.
Geissler
,
Annu. Rev. Phys. Chem.
53
,
291
(
2002
).
22.
S.
Fischer
,
K. W.
Olsen
,
K.
Nam
, and
M.
Karplus
,
Proc. Natl. Acad. Sci. U.S.A.
108
,
5608
(
2011
).
24.
F.
Pietrucci
,
F.
Marinelli
,
P.
Carloni
, and
A.
Laio
,
J. Am. Chem. Soc.
131
,
11811
(
2009
).
25.
M.
Lei
,
M. I.
Zavodszky
,
L. A.
Kuhn
, and
M. F.
Thorpe
,
J. Comput. Chem.
25
,
1133
(
2004
).
26.
D.
Moroni
,
P. G.
Bolhuis
, and
T. S.
van Erp
,
J. Chem. Phys.
120
,
4055
(
2004
).
27.
A.
Dickson
and
A. R.
Dinner
,
Annu. Rev. Phys. Chem.
61
,
441
(
2010
).
28.
R. J.
Allen
,
P. B.
Warren
, and
P. R.
ten Wolde
,
Phys. Rev. Lett.
94
,
018104
(
2005
).
29.
J.
Pfaendtner
,
D.
Branduardi
,
M.
Parrinello
,
T. D.
Pollard
, and
G. A.
Voth
,
Proc. Natl. Acad. Sci. U.S.A.
106
,
12723
(
2009
).
30.
A.
Barducci
,
M.
Bonomi
, and
M.
Parrinello
,
Biophys. J.
98
,
L44
(
2010
).
31.
B. W.
Zhang
,
D.
Jasnow
, and
D. M.
Zuckerman
,
Proc. Natl. Acad. Sci. U.S.A.
104
,
18043
(
2007
).
32.
G. A.
Huber
and
S.
Kim
,
Biophys. J.
70
,
97
(
1996
).
33.
A. L.
Ferguson
,
A. Z.
Panagiotopoulos
,
I. G.
Kevrekidis
, and
P. G.
Debenedetti
,
Chem. Phys. Lett.
509
,
1
(
2011
).
34.
T. S.
van Erp
, “
Dynamical rare event simulation techniques for equilibrium and nonequilibrium systems
,” in
Kinetics and Thermodynamics of Multistep Nucleation and Self-Assembly in Nanoscale Materials
,
Advances in Chemical Physics
Vol.
151
, edited by
G.
Nicolis
and
D.
Maes
(
Wiley & Sons
,
2012
), pp.
27
60
.
35.
N. B.
Becker
,
R. J.
Allen
, and
P. R.
ten Wolde
,
J. Chem. Phys.
136
,
174118
(
2012
).
36.
F.
Jamalyaria
,
R.
Rohlfs
, and
R.
Schwartz
,
J. Comput. Phys.
204
,
100
(
2005
).
37.
T.
Keef
,
C.
Micheletti
, and
R.
Twarock
,
J. Theor. Biol.
242
,
713
(
2006
).
38.
M.
Hemberg
,
S.
Yaliraki
, and
M.
Barahona
,
Biophys. J.
90
,
3029
(
2006
).
39.
E. C.
Dykeman
,
P. G.
Stockley
, and
R.
Twarock
,
Phys. Rev. E
87
,
022717
(
2013
).
40.
B.
Sweeney
,
T.
Zhang
, and
R.
Schwartz
,
Biophys. J.
94
,
772
(
2008
).
41.
T. Q.
Zhang
and
R.
Schwartz
,
Biophys. J.
90
,
57
(
2006
).
42.
N.
Misra
,
D.
Lees
,
T. Q.
Zhang
, and
R.
Schwartz
,
Comput. Math. Method Med.
9
,
277
(
2008
).
43.
M. S.
Kumar
and
R.
Schwartz
,
Phys. Biol.
7
,
045005
(
2010
).
44.
L.
Xie
,
G.
Smith
,
X.
Feng
, and
R.
Schwartz
,
Biophys. J.
103
,
1545
(
2012
).
45.
G. R.
Smith
,
L.
Xie
,
B.
Lee
, and
R.
Schwartz
,
Biophys. J.
106
,
310
(
2014
).
46.
G. R.
Bowman
,
V. A.
Voelz
, and
V. S.
Pande
,
J. Am. Chem. Soc.
133
,
664
(
2011
).
47.
G. R.
Bowman
,
D. L.
Ensign
, and
V. S.
Pande
,
J. Chem. Theory Comput.
6
,
787
(
2010
).
48.
G. R.
Bowman
,
K. A.
Beauchamp
,
G.
Boxer
, and
V. S.
Pande
,
J. Chem. Phys.
131
,
124101
(
2009
).
49.
W. C.
Swope
,
J. W.
Pitera
,
F.
Suits
,
M.
Pitman
,
M.
Eleftheriou
,
B. G.
Fitch
,
R. S.
Germain
,
A.
Rayshubski
,
T. J. C.
Ward
,
Y.
Zhestkov
, and
R.
Zhou
,
J. Phys. Chem. B
108
,
6582
(
2004
).
50.
W. C.
Swope
,
J. W.
Pitera
, and
F.
Suits
,
J. Phys. Chem. B
108
,
6571
(
2004
).
51.
J.-H.
Prinz
,
J. D.
Chodera
,
V. S.
Pande
,
W. C.
Swope
,
J. C.
Smith
, and
F.
Noe
,
J. Chem. Phys.
134
,
244108
(
2011
).
52.
S.
Park
,
D. L.
Ensign
, and
V. S.
Pande
,
Phys. Rev. E
74
,
066703
(
2006
).
53.
V. S.
Pande
,
K.
Beauchamp
, and
G. R.
Bowman
,
Methods
52
,
99
(
2010
).
54.
F.
Noe
,
C.
Schutte
,
E.
Vanden-Eijnden
,
L.
Reich
, and
T. R.
Weikl
,
Proc. Natl. Acad. Sci. U.S.A.
106
,
19011
(
2009
).
55.
T. J.
Lane
,
G. R.
Bowman
,
K.
Beauchamp
,
V. A.
Voelz
, and
V. S.
Pande
,
J. Am. Chem. Soc.
133
,
18413
(
2011
).
56.
G.
Jayachandran
,
V.
Vishal
, and
V. S.
Pande
,
J. Chem. Phys.
124
,
164902
(
2006
).
57.
J. D.
Chodera
,
W. C.
Swope
,
F.
Noe
,
J.-H.
Prinz
,
M. R.
Shirts
, and
V. S.
Pande
,
J. Chem. Phys.
134
,
244107
(
2011
).
58.
N. S.
Hinrichs
and
V. S.
Pande
,
J. Chem. Phys.
126
,
244101
(
2007
).
59.
J. D.
Chodera
,
N.
Singhal
,
V. S.
Pande
,
K. A.
Dill
, and
W. C.
Swope
,
J. Chem. Phys.
126
,
155101
(
2007
).
60.
P.
Deuflhard
and
M.
Weber
,
Linear Algebra Its Appl.
398
,
161
(
2005
).
61.
R.
Schwartz
,
P. W.
Shor
,
P. E.
Prevelige
, and
B.
Berger
,
Biophys. J.
75
,
2626
(
1998
).
62.
M. F.
Hagan
and
D.
Chandler
,
Biophys. J.
91
,
42
(
2006
).
63.
H. D.
Nguyen
,
V. S.
Reddy
, and
C. L.
Brooks
,
Nano Lett.
7
,
338
(
2007
).
64.
A. W.
Wilber
,
J. P. K.
Doye
,
A. A.
Louis
,
E. G.
Noya
,
M. A.
Miller
, and
P.
Wong
,
J. Chem. Phys.
127
,
085106
(
2007
).
65.
H.
Nguyen
and
C.
Brooks
,
Nano Lett.
8
,
4574
(
2008
).
66.
H. D.
Nguyen
,
V. S.
Reddy
, and
C. L.
Brooks
,
J. Am. Chem. Soc.
131
,
2606
(
2009
).
67.
I. G.
Johnston
,
A. A.
Louis
, and
J. P. K.
Doye
,
J. Phys.: Condens. Matter
22
,
104101
(
2010
).
68.
A. W.
Wilber
,
J. P. K.
Doye
,
A. A.
Louis
, and
A. C. F.
Lewis
,
J. Chem. Phys.
131
,
175102
(
2009
).
69.
D. C.
Rapaport
,
J. E.
Johnson
, and
J.
Skolnick
,
Comput. Phys. Commun.
121–122
,
231
(
1999
).
70.
D.
Rapaport
,
Phys. Rev. E
70
,
051905
(
2004
).
71.
72.
O.
Elrad
and
M. F.
Hagan
,
Phys. Biol.
7
,
045003
(
2010
).
73.
M. F.
Hagan
,
O. M.
Elrad
, and
R. L.
Jack
,
J. Chem. Phys.
135
,
104115
(
2011
).
74.
J. P.
Mahalik
and
M.
Muthukumar
,
J. Chem. Phys.
136
,
135101
(
2012
).
75.
J. D.
Perlmutter
,
C.
Qiao
, and
M. F.
Hagan
,
eLife
2
,
e00632
(
2013
).
76.
D. C.
Rapaport
,
Phys. Rev. E
86
,
051917
(
2012
).
77.
S.
Hicks
, “
Statistical mechanical models of virus capsid assembly
,” Ph.D. thesis (
Cornell University
,
2010
).
78.
S.
Sriraman
,
I. G.
Kevrekidis
, and
G.
Hummer
,
J. Phys. Chem. B
109
,
6479
(
2005
).
79.
J. D.
Chodera
,
W. C.
Swope
,
J. W.
Pitera
, and
K. A.
Dill
,
Multiscale Model. Simul.
5
,
1214
(
2006
).
80.
E. J.
Sorin
and
V. S.
Pande
,
Biophys. J.
88
,
2472
(
2005
).
81.
S. P.
Elmer
,
S.
Park
, and
V. S.
Pande
,
J. Chem. Phys.
123
,
114903
(
2005
).
82.
M.
Andrec
,
A. K.
Felts
,
E.
Gallicchio
, and
R. M.
Levy
,
Proc. Natl. Acad. Sci. U.S.A.
102
,
6801
(
2005
).
83.
B. L.
de Groot
,
X.
Daura
,
A. E.
Mark
, and
H.
Grubmuller
,
J. Mol. Biol.
309
,
299
(
2001
).
84.
M. E.
Karpen
,
D. J.
Tobias
, and
C. L.
Brooks
,
Biochemistry
32
,
412
(
1993
).
85.
N.
Singhal
,
C. D.
Snow
, and
V. S.
Pande
,
J. Chem. Phys.
121
,
415
(
2004
).
86.
G. R.
Bowman
,
X.
Huang
, and
V. S.
Pande
,
Methods
49
,
197
(
2009
).
87.
K. A.
Beauchamp
,
G. R.
Bowman
,
T. J.
Lane
,
L.
Maibaum
,
I. S.
Haque
, and
V. S.
Pande
,
J. Chem. Theory Comput.
7
,
3412
(
2011
).
88.
J.-H.
Prinz
,
H.
Wu
,
M.
Sarich
,
B.
Keller
,
M.
Senne
,
M.
Held
,
J. D.
Chodera
,
C.
Schtte
, and
F.
Noe
,
J. Chem. Phys.
134
,
174105
(
2011
).
89.
K. A.
Beauchamp
,
R.
McGibbon
,
Y.-S.
Lin
, and
V. S.
Pande
,
Proc. Natl. Acad. Sci. U.S.A.
109
,
17807
(
2012
).
90.
V. A.
Voelz
,
G. R.
Bowman
,
K.
Beauchamp
, and
V. S.
Pande
,
J. Am. Chem. Soc.
132
,
1526
(
2010
).
91.
G. R.
Bowman
and
P. L.
Geissler
,
Proc. Natl. Acad. Sci. U.S.A.
109
,
11681
(
2012
).
92.
G.
Perez-Hernandez
,
F.
Paul
,
T.
Giorgino
,
G.
De Fabritiis
, and
F.
Noé
,
J. Chem. Phys.
139
,
015102
(
2013
).
93.
C. R.
Schwantes
and
V. S.
Pande
,
J. Chem. Theory Comput.
9
,
2000
(
2013
).
94.
M.
Senne
,
B.
Trendelkamp-Schroer
,
A. S.
Mey
,
C.
Schtte
, and
F.
No
,
J. Chem. Theory Comput.
8
,
2223
(
2012
).
95.
C.
Gu
,
C.
Huang-Wei
,
L.
Maibaum
,
V. S.
Pande
,
G. E.
Carlsson
, and
L. J.
Guibas
,
BMC Bioinf.
14
,
1
(
2013
).
96.
J.
Grant
,
R. L.
Jack
, and
S.
Whitelam
,
J. Chem. Phys.
135
,
214505
(
2011
).
98.
P. E.
Prevelige
,
D.
Thomas
, and
J.
King
,
Biophys. J.
64
,
824
(
1993
).
99.
A.
Zlotnick
,
J. M.
Johnson
,
P. W.
Wingfield
,
S. J.
Stahl
, and
D.
Endres
,
Biochemistry
38
,
14644
(
1999
).
100.
A.
Zlotnick
,
R.
Aldrich
,
J. M.
Johnson
,
P.
Ceres
, and
M. J.
Young
,
Virology
277
,
450
(
2000
).
101.
G. L.
Casini
,
D.
Graham
,
D.
Heine
,
R. L.
Garcea
, and
D. T.
Wu
,
Virology
325
,
320
(
2004
).
102.
C.
Chen
,
C. C.
Kao
, and
B.
Dragnea
,
J. Phys. Chem. A
112
,
9405
(
2008
).
103.
C.
Berthet-Colominas
,
M.
Cuillel
,
M. H. J.
Koch
,
P.
Vachette
, and
B.
Jacrot
,
Eur. Biophys. J.
15
,
159
(
1987
).
104.
S.
Kler
,
R.
Asor
,
C.
Li
,
A.
Ginsburg
,
D.
Harries
,
A.
Oppenheim
,
A.
Zlotnick
, and
U.
Raviv
,
J. Am. Chem. Soc.
134
,
8823
(
2012
).
105.
M.
Tsiang
,
A.
Niedziela-Majka
,
M.
Hung
,
D.
Jin
,
E.
Hu
,
S.
Yant
,
D.
Samuel
,
X.
Liu
, and
R.
Sakowicz
,
Biochemistry
51
,
4416
(
2012
).
106.
W.
E
and
E.
Vanden-Eijnden
,
Annu. Rev. Phys. Chem.
61
,
391
(
2010
).
107.
P.
Metzner
,
C.
Schütte
, and
E.
Vanden-Eijnden
,
J. Chem. Phys.
125
,
084110
(
2006
).
108.
F.
Noé
and
S.
Fischer
,
Curr. Opin. Struct. Biol.
18
,
154
(
2008
).
109.
P.
Metzner
,
C.
Schutte
, and
E.
Vanden-Eijnden
,
Multiscale Model. Simul.
7
,
1192
(
2009
).
110.
C.
Dellago
,
P. G.
Bolhuis
, and
P. L.
Geissler
,
Adv. Chem. Phys.
123
,
1
(
2002
).
111.
J.-H.
Prinz
,
M.
Held
,
J. C.
Smith
, and
F.
No
,
Multiscale Model. Simul.
9
,
545
(
2011
).
112.
A.
Levandovsky
and
R.
Zandi
,
Phys. Rev. Lett.
102
,
198102
(
2009
).
113.
S. D.
Hicks
and
C. L.
Henley
,
Phys. Rev. E
74
,
031912
(
2006
).
114.
D. J.
Wales
,
Philos. Trans. R. Soc. A
363
,
357
(
2005
).
115.
I.
Tsvetkova
,
C.
Chen
,
S.
Rana
,
C. C.
Kao
,
V. M.
Rotello
, and
B.
Dragnea
,
Soft Matter
8
,
4571
(
2012
).
116.
J.
Sun
,
C.
DuFort
,
M. C.
Daniel
,
A.
Murali
,
C.
Chen
,
K.
Gopinath
,
B.
Stein
,
M.
De
,
V. M.
Rotello
,
A.
Holzenburg
,
C. C.
Kao
, and
B.
Dragnea
,
Proc. Natl. Acad. Sci. U.S.A.
104
,
1354
(
2007
).
117.
X.
Huang
,
L. M.
Bronstein
,
J.
Retrum
,
C.
Dufort
,
I.
Tsvetkova
,
S.
Aniagyei
,
B.
Stein
,
G.
Stucky
,
B.
McKenna
,
N.
Remmes
,
D.
Baxter
,
C. C.
Kao
, and
B.
Dragnea
,
Nano Lett.
7
,
2407
(
2007
).
118.
S. K.
Dixit
,
N. L.
Goicochea
,
M. C.
Daniel
,
A.
Murali
,
L.
Bronstein
,
M.
De
,
B.
Stein
,
V. M.
Rotello
,
C. C.
Kao
, and
B.
Dragnea
,
Nano Lett.
6
,
1993
(
2006
).
119.
M.-C.
Daniel
,
I. B.
Tsvetkova
,
Z. T.
Quinkert
,
A.
Murali
,
M.
De
,
V. M.
Rotello
,
C. C.
Kao
, and
B.
Dragnea
,
ACS Nano
4
,
3853
(
2010
).
120.
C.
Chen
,
E. S.
Kwak
,
B.
Stein
,
C. C.
Kao
, and
B.
Dragnea
,
J. Nanosci. Nanotechnol.
5
,
2029
(
2005
).
121.
C.
Chen
,
M. C.
Daniel
,
Z. T.
Quinkert
,
M.
De
,
B.
Stein
,
V. D.
Bowman
,
P. R.
Chipman
,
V. M.
Rotello
,
C. C.
Kao
, and
B.
Dragnea
,
Nano Lett.
6
,
611
(
2006
).
122.
M. F.
Hagan
,
Phys. Rev. E
77
,
051904
(
2008
).
123.
M. F.
Hagan
,
J. Chem. Phys.
130
,
114902
(
2009
).
124.
O. M.
Elrad
and
M. F.
Hagan
,
Nano Lett.
8
,
3850
(
2008
).
125.
A.
Siber
,
R.
Zandi
, and
R.
Podgornik
,
Phys. Rev. E
81
,
051919
(
2010
).
126.
L.
He
,
Z.
Porterfield
,
P.
van der Schoot
,
A.
Zlotnick
, and
B.
Dragnea
,
ACS Nano
7
,
8447
(
2013
).
127.
A.
Branka
and
D.
Heyes
,
Phys. Rev. E
60
,
2381
(
1999
);
D.
Heyes
and
A.
Branka
,
Mol. Phys.
98
,
1949
(
2000
).
128.
D.
Endres
and
A.
Zlotnick
,
Biophys. J.
83
,
1217
(
2002
).
129.
M. F.
Hagan
and
O.
Elrad
,
Biophys. J.
98
,
1065
(
2010
).
130.
Convergence required a 50% increase in total simulation time because statistics were reduced by the increased number of states (18000 states with the graph compared to 220 with the simple state definition). However, this increase could be at least partially eliminated through lumping of microstates.
131.
R. F.
Garmann
,
M.
Comas-Garcia
,
A.
Gopal
,
C. M.
Knobler
, and
W. M.
Gelbart
,
J. Mol. Biol.
426
,
1050
(
2013
).
132.
J.
van Zon
and
P.
ten Wolde
,
J. Chem. Phys.
123
,
234910
(
2005
).
133.
Note that characterization of the full time course of assembly kinetics for a system in which subunits are the limiting reagent will require multiple simulations at different subunit concentrations.
134.
J. G.
de la Torre
and
B.
Carrasco
,
Biopolymers
63
,
163
(
2002
).
135.
S.
Fortin
, “
The graph isomorphism problem
,” Technical Report No. 96-20 (
Department of Computer Science, University of Alberta
,
1996
).
136.
N.
Reingold
and
Deo
,
Combinatorial Algorithms: Theory and Practice
(
Prentice Hall
,
1977
).
137.
B. D.
McKay
,
Practical Graph Isomorphism
(
Congressus Numerantium
,
1981
).
138.
E. M.
Luks
,
J. Comput. Syst. Sci.
25
,
42
(
1982
).
140.
P.
Moisant
,
H.
Neeman
, and
A.
Zlotnick
,
Biophys. J.
99
,
1350
(
2010
).
141.
T. E.
Ouldridge
,
A. A.
Louis
, and
J. P. K.
Doye
,
J. Phys.: Condens. Matter
22
,
104102
(
2010
).
You do not currently have access to this content.