Hi,<br><br>I'm working with PDB files, opening them with:<br><br>chimera.openModels.open(fileHandler, 'PDB'). <br><br>Later on when I use the chainId on the residues of the molecule (accessed by residue.id.chainId). The problem is that the PDB format does not require the chaind id to be defined. When that is the case, all residues have id ' ', which is rather annoying to distinguish the chains to which they belong.<br>
<br>Now, bringing up problems only is never really appreciated ;), so my colleague Aurelien Grosdidier and I tried to think of some solutions to split the residues into chains when loading a model from a PDB file that does not contain any chain ID.<br>
<br>1) Split on TER. Chains are usually separated by a TER line, which could thus be used to determine when to create a new chain. However, like the chain id information, the TER line is optional in the PDB format...<br><br>
2) Compute an atom to atom distance matrix for each two consecutive residues. Since the typical distance between two atoms is known, we can compute if two residues reasonably belong to the same chain. The computations can easily be pruned when two residues belong to the same chain, which is the most frequent case.<br>
<br>3) Compute an atom to atom distance matrix and use it to determine which atoms belong to the same chain. This is computationnally more expensive than 2), but it must be done somewhere in Chimera to compute the bonds between the atoms that are rendered graphically. Any chance we can access this information (I did not find how)?<br>
 <br>Any comment on those solutions? Any other solutions? Any help will be appreciated!<br><br>Thanks,<br><br>Sebastien<br>